«standardization» 태그된 질문

일반적으로 "z- 표준화"는 평균과 단위 분산이 0이되도록 데이터를 이동하고 크기를 조정하는 것입니다. 다른 "표준화"도 가능합니다.

7
다중 회귀 분석을 수행 할 때는 예측 변수를 언제 중심에두고 언제 표준화해야합니까?
일부 문헌에서는 다른 단위로 여러 설명 변수가있는 회귀를 표준화해야한다고 읽었습니다. (표준화는 평균을 빼고 표준 편차로 나누는 것으로 구성됩니다.) 어떤 경우에 데이터를 표준화해야합니까? 데이터를 중앙에만 배치해야하는 경우가 있습니까 (예 : 표준 편차로 나눔)

5
정규화와 표준화의 차이점은 무엇입니까?
직장 상사가 정규화에 대해 들어 본 적이 없으므로 직장에서 이것을 논의했습니다. 선형 대수에서 정규화는 벡터를 길이로 나누는 것으로 나타납니다. 통계에서 표준화는 평균을 빼고 SD로 나눈 것을 말합니다. 그러나 그들은 다른 가능성과도 상호 교환 가능한 것처럼 보입니다. 어떤 종류의 범용 점수를 만들 때 , 다른 수단과 다른 SD를 가진 가지 다른 …


3
모델 검증 전 또는 모델 검증 내에서 기능 정규화를 수행합니까?
머신 러닝의 일반적인 모범 사례는 예측 변수의 특징 정규화 또는 데이터 표준화를 수행하는 것입니다. 즉, 평균을 빼고 데이터를 중심에두고 분산 (또는 표준 편차도)으로 나누어 정규화하는 것입니다. 자립과 이해를 위해 두 가지 주요 목표를 달성하기 위해이 작업을 수행합니다. 수치 적 안정성을 위해 작은 모델 중량을 피하십시오. 컨쥬 게이트 그라디언트 (Conjugate Gradient)와 …

1
예측이 목표 인 경우 교육 및 테스트 세트에 표준화 / 정규화를 적용하는 방법은 무엇입니까?
모든 데이터 또는 접기 (CV가 적용된 경우)를 동시에 변환합니까? 예 : (allData - mean(allData)) / sd(allData) trainset과 testset을 개별적으로 변환합니까? 예 : (trainData - mean(trainData)) / sd(trainData) (testData - mean(testData)) / sd(testData) 아니면 trainset을 변환하고 testset에서 계산을 사용합니까? 예 : (trainData - mean(trainData)) / sd(trainData) (testData - mean(trainData)) / sd(trainData) …

3
로지스틱 회귀를 맞추기 전에 표준화가 필요합니까?
제 질문은 로지스틱 회귀를 맞추기 전에 모든 변수가 [0,1] 사이에서 동일한 척도를 갖도록 데이터 세트를 표준화해야한다는 것입니다. 공식은 다음과 같습니다. xi−min(xi)max(xi)−min(xi)xi−min(xi)max(xi)−min(xi)\frac{x_i-\min(x_i)}{\max(x_i)-\min(x_i)} 내 데이터 세트에는 2 개의 변수가 있으며 두 채널에 대해 동일한 것을 설명하지만 볼륨이 다릅니다. 두 상점의 고객 방문 횟수라고 가정하면 여기에서 고객의 구매 여부가 결정됩니다. 고객은 구매하기 전에 …

2
선형 회귀 분석에서 표준화 된 설명 변수를 사용하는시기와 방법
선형 회귀에 대한 두 가지 간단한 질문이 있습니다. 설명 변수를 표준화하는 것이 언제 권장됩니까? 일단 표준화 된 값으로 평가를 수행하면 새로운 값으로 어떻게 예측할 수 있습니까 (새로운 값을 어떻게 표준화해야합니까)? 일부 참조가 도움이 될 것입니다.

3
LASSO에 대한 인디케이터 / 바이너리 / 더미 예측 변수의 재조정 여부
LASSO (및 다른 모델 선택 절차)의 경우 예측 변수를 재조정하는 것이 중요합니다. 일반 추천 I 추적은 연속 변수의 0 평균, 1 개 표준 편차의 정상화를 사용하는 것입니다. 그러나 인형과 어떤 관련이 있습니까? 예를 들어 , 동일한 (우수한) 여름 학교의 일부 적용 예 는 연속 변수를 0과 1 사이로 조정하지만 (이상치에는 …

2
올가미 이전의 표준화가 정말로 필요한가?
Lasso회귀 와 같은 전에 변수를 표준화 해야하는 세 가지 주요 이유를 읽었습니다 . 1) 계수의 해석 성. 2) 수축 후 계수 추정치의 상대적 크기에 따라 계수 중요도를 평가하는 기능. 3) 가로 채지 않아도됩니다. 그러나 가장 중요한 점이 궁금합니다. 표준화가 모형의 표본 일반화를 향상시킬 것이라고 생각할만한 이유가 있습니까? 또한 모델에 인터셉트가 …


3
"정규화"란 무엇이며 표본 또는 분포가 정규화되었는지 확인하는 방법은 무엇입니까?
균일 분포 ( Uniform(a,b)Uniform(a,b){\rm Uniform}(a,b) )가 정규화 되는지 여부를 묻는 질문 이 있습니다. 우선, 분포가 정규화되었다는 것은 무엇을 의미합니까? 둘째, 분포가 정규화되는지 여부를 확인하는 방법은 무엇입니까? 나는 X 를 계산함으로써 이해한다 - 평균X−meansdX−meansd \frac{X-\text{mean}}{\text{sd}} 정규화 된데이터를 얻지만 여기서는분포가 정규화되었는지 여부를 묻습니다.

2
능선 회귀 분석 표준화에 관한 질문
이봐, 난 능선 회귀를 사용하는 하나 또는 두 개의 논문을 찾았습니다 (농구 데이터). 능선 회귀 분석을 실행하면 항상 변수를 표준화하라는 지시를 받았지만, 능선은 척도 변형이기 때문에 간단하게 지시를 받았습니다. 내가 읽은이 논문은 변수를 표준화하지 않았기 때문에 조금 놀랍습니다. 그들은 또한 교차 검증을 통해 큰 람다 값 (2000-4000 수준)으로 끝났으며 이는 …

2
패널 / 세로 데이터를 사용하여 회귀 데이터를 표준화하는 것이 좋은 방법입니까?
일반적으로 계수를 올바르게 비교하기 위해 회귀 분석에서 독립 변수를 표준화합니다 (이렇게하면 동일한 단위 (표준 편차)를 갖습니다). 그러나 패널 / 세로 데이터를 사용하면 특히 계층 적 모델을 추정 할 때 데이터를 어떻게 표준화해야하는지 잘 모르겠습니다. 그것이 잠재적 인 문제가 될 수있는 이유를 보려면, 개인이 t = 1 , … , T …

1
회귀 분석에서 데이터 센터링 및 표준화 필요
일부 정규화와 선형 회귀를 고려 : 예 찾기 것을 최소화 | | A x − b | | 2 + λ | | x | | 1xxx||Ax−b||2+λ||x||1||Ax−b||2+λ||x||1||Ax - b||^2+\lambda||x||_1 일반적으로 A의 열은 평균이 0이고 단위 규범을 갖도록 표준화되고 는 평균이 0이되도록 중앙에 배치됩니다. 표준화 및 센터링 사유에 대한 나의 이해가 …


당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.