«normalization» 태그된 질문

일반적으로 "정규화"는 값을 지정된 범위 내에 있도록 데이터를 다시 표현하는 것을 의미합니다.


5
정규화와 표준화의 차이점은 무엇입니까?
직장 상사가 정규화에 대해 들어 본 적이 없으므로 직장에서 이것을 논의했습니다. 선형 대수에서 정규화는 벡터를 길이로 나누는 것으로 나타납니다. 통계에서 표준화는 평균을 빼고 SD로 나눈 것을 말합니다. 그러나 그들은 다른 가능성과도 상호 교환 가능한 것처럼 보입니다. 어떤 종류의 범용 점수를 만들 때 , 다른 수단과 다른 SD를 가진 가지 다른 …

6
신경망에서 좋은 초기 가중치는 무엇입니까?
방금 범위에서 신경망의 초기 가중치를 선택하는 것이 좋습니다 . 여기서 는 주어진 뉴런에 대한 입력 수. 세트가 정규화되었다고 가정합니다-평균 0, 분산 1 (이 문제가 중요하지 않은 경우).d( − 1디√, 1디√)(−1d,1d)(\frac{-1}{\sqrt d} , \frac{1}{\sqrt d})디dd 이것이 왜 좋은 생각입니까?

9
정규화 및 기능 확장은 어떻게, 왜 작동합니까?
많은 기계 학습 알고리즘이 평균 취소 및 공분산 이퀄라이제이션으로 더 잘 작동한다는 것을 알았습니다. 예를 들어 신경망은 더 빨리 수렴하는 경향이 있으며 K-Means는 일반적으로 사전 처리 된 기능으로 더 나은 클러스터링을 제공합니다. 이러한 사전 처리 단계의 직관이 성능 향상으로 이어지지는 않습니다. 누군가 나에게 이것을 설명 할 수 있습니까?

3
모델 검증 전 또는 모델 검증 내에서 기능 정규화를 수행합니까?
머신 러닝의 일반적인 모범 사례는 예측 변수의 특징 정규화 또는 데이터 표준화를 수행하는 것입니다. 즉, 평균을 빼고 데이터를 중심에두고 분산 (또는 표준 편차도)으로 나누어 정규화하는 것입니다. 자립과 이해를 위해 두 가지 주요 목표를 달성하기 위해이 작업을 수행합니다. 수치 적 안정성을 위해 작은 모델 중량을 피하십시오. 컨쥬 게이트 그라디언트 (Conjugate Gradient)와 …

1
예측이 목표 인 경우 교육 및 테스트 세트에 표준화 / 정규화를 적용하는 방법은 무엇입니까?
모든 데이터 또는 접기 (CV가 적용된 경우)를 동시에 변환합니까? 예 : (allData - mean(allData)) / sd(allData) trainset과 testset을 개별적으로 변환합니까? 예 : (trainData - mean(trainData)) / sd(trainData) (testData - mean(testData)) / sd(testData) 아니면 trainset을 변환하고 testset에서 계산을 사용합니까? 예 : (trainData - mean(trainData)) / sd(trainData) (testData - mean(trainData)) / sd(trainData) …

4
정규화와 스케일링
데이터 '정규화'와 '스케일링'데이터의 차이점은 무엇입니까? 지금까지 두 용어가 모두 같은 과정을 의미한다고 생각했지만 지금은 내가 모르거나 이해해야 할 것이 더 많다는 것을 알고 있습니다. 또한 정규화와 스케일링간에 차이가있는 경우 언제 정규화를 사용해야하지만 스케일링은 사용하지 않아야합니까? 몇 가지 예를 자세히 설명하십시오.




8
0에서 1 사이의 숫자로 제한되지 않은 변수를 나타내는 방법
변수를 0과 1 사이의 숫자로 나타내려고합니다. 변수는 고유 한 바인딩이없는 음이 아닌 정수입니다. 0을 0으로 매핑하지만 1 또는 0과 1 사이의 숫자로 무엇을 매핑 할 수 있습니까? 해당 변수의 기록을 사용하여 제한을 제공 할 수 있습니다. 이것은 최대 값이 증가하면 이전 통계를 다시 작성해야 함을 의미합니다. 이 작업을 수행해야합니까, 아니면 …

2
올가미 이전의 표준화가 정말로 필요한가?
Lasso회귀 와 같은 전에 변수를 표준화 해야하는 세 가지 주요 이유를 읽었습니다 . 1) 계수의 해석 성. 2) 수축 후 계수 추정치의 상대적 크기에 따라 계수 중요도를 평가하는 기능. 3) 가로 채지 않아도됩니다. 그러나 가장 중요한 점이 궁금합니다. 표준화가 모형의 표본 일반화를 향상시킬 것이라고 생각할만한 이유가 있습니까? 또한 모델에 인터셉트가 …

2
코사인 유사성이 l2 정규화 된 유클리드 거리와 동일합니까?
동일한 의미, 이는 벡터 u 와 벡터 세트 V 사이의 유사성 순위에 대해 동일한 결과를 생성 할 것 입니다. 거리 측정 (유클리드 거리, 코사인 유사성) 및 정규화 기술 (없음, l1, l2)을 매개 변수로 사용하는 벡터 공간 모델이 있습니다. 내 이해에서, 설정 [코사인, 없음]의 결과는 [유클리드, l2]와 동일하거나 적어도 실제로는 유사해야하지만, …

5
이진 변수를 표준화해야합니까?
기능 세트가있는 데이터 세트가 있습니다. 이들 중 일부는 이진 활성 또는 해고, 0 = 비활성 또는 휴면)이고 나머지는 실제 값입니다 (예 : 4564.342) .( 1 =(1=(1=0 =0=0=4564.3424564.3424564.342 이 데이터를 기계 학습 알고리즘에 공급하고 싶기 때문에 모든 실제 가치 기능을 점수로 매 깁니다. 나는 범위 사이에 그들을 얻을 3 과 - …

1
행과 열 길이에 제약이있는 랜덤 행렬
행과 열을 갖는 임의의 비 제곱 행렬 , 평균 = 0으로 임의로 분포 된 요소 를 생성 하고 각 행의 길이 (L2 규범)가 이고 각 열의 길이가 . 마찬가지로, 제곱 값의 합은 각 행에 대해 1이고 각 열에 대해 입니다.RRRCCC111RC−−√RC\sqrt{\frac{R}{C}}RCRC\frac{R}{C} 지금까지 나는 이것을 달성하는 한 가지 방법을 발견했다. 매트릭스 요소를 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.