«data-transformation» 태그된 질문

종종 비선형 인 데이터 값의 수학적 재 표현. 데이터는 종종 통계 모델의 가정을 충족 시키거나 분석 결과를보다 해석하기 쉽도록 변환합니다.


2
순위 상관을 사용한 정식 상관 분석
정식 상관 분석 (CCA)은 두 데이터 세트의 선형 조합에 대한 일반적인 Pearson 곱-모멘트 상관 (즉, 선형 상관 계수)을 최대화하는 것을 목표로합니다. 이제이 상관 계수가 선형 연관 만 측정한다는 사실을 고려하십시오. 이것이 우리가 예를 들어 Spearman- ρρ\rho 또는 Kendall- ττ\tau (순위) 상관 계수를 사용하는 이유이기도합니다. 변수 사이의 연결. 따라서 CCA의 한 …


3
CDF가 힘을 얻었습니까?
경우 FZFZF_Z CDF, 그것과 같다 FZ(z)αFZ(z)αF_Z(z)^\alpha ( α>0α>0\alpha \gt 0 )뿐만 아니라 CDF이다. Q : 이것이 표준 결과입니까? Q : 함수를 찾는 좋은 방법이 있는가 ggg 과 X≡g(Z)X≡g(Z)X \equiv g(Z) 일 FX(x)=FZ(z)αFX(x)=FZ(z)αF_X(x) = F_Z(z)^\alpha , 여기서 x≡g(z)x≡g(z) x \equiv g(z) 기본적으로, 나는 또 다른 CDF, FZ(z)αFZ(z)αF_Z(z)^\alpha 있습니다. 일부 축소 된 …

1
데이터를 원하는 평균 및 표준 편차로 변환
데이터 세트를 현재 평균 및 표준 편차에서 목표 평균 및 목표 표준 편차로 변환하는 방법을 찾고 있습니다. 기본적으로 분산을 축소 / 확장하고 모든 숫자를 평균으로 스케일링하려고합니다. 표준 편차와 평균에 각각 하나씩 두 개의 선형 변환을 수행하는 것은 효과가 없습니다. 어떤 방법을 사용해야합니까? 데이터 세트의 평균을 0.5로, SD를 0.1667으로 조정할 때 …

2
데이터 변환 : 모든 변수 또는 비정규 변수?
Andy Field의 SPSS를 사용한 통계 발견에서 그는 모든 변수를 변환해야한다고 말합니다. 그러나 간행물 : "지리적 가중 회귀 I : 모델 설계 및 평가를 사용하여 토지 이용과 수질 사이의 공간적으로 다양한 관계를 조사하는 것"은 비정규 변수 만 변형되었다고 구체적으로 언급합니다. 이 분석은 구체적입니까? 예를 들어, 평균을 비교할 때 로그를 원시 데이터와 …

1
신경망에서 이진 입력과 연속 입력의 혼합을 처리하는 방법은 무엇입니까?
R의 nnet 패키지를 사용하여 콘도 (개인 프로젝트)의 부동산 가격을 예측하기 위해 ANN을 작성하려고합니다. 나는 이것에 익숙하지 않으며 수학 배경이 없으므로 나와 함께 맨손으로하십시오. 이진 및 연속 입력 변수가 있습니다. 예를 들어 원래 예 / 아니오였던 일부 이진 변수는 신경망에 대해 1/0으로 변환되었습니다. 다른 변수는 다음과 같이 연속적 Sqft입니다. 입력 데이터 …



1
엔트로피는 위치와 규모에 어떻게 의존합니까?
밀도 함수 를 갖는 연속 분포 의 엔트로피 는 의 기대 값과 동일하지 않으므로 다음과 같습니다.ffflog(f),log⁡(f),\log(f), Hf=−∫∞−∞log(f(x))f(x)dx.Hf=−∫−∞∞log⁡(f(x))f(x)dx.H_f = -\int_{-\infty}^{\infty} \log(f(x)) f(x)\mathrm{d}x. 또한 분포가 밀도 갖는 임의의 변수 는 엔트로피 갖는다 고 (이 적분은 가 그러한 값에서 0이 될 수 있기 때문에 에 0이있는 경우에도 잘 정의 됩니다.)XXXfffHf.Hf.H_f.ffflog(f(x))f(x)log⁡(f(x))f(x)\log(f(x))f(x) 되면 및 있는 …

3
더미 변수 센터링 및 스케일링
범주 형 변수와 연속 변수가 모두 포함 된 데이터 세트가 있습니다. 범주 형 변수를 각 수준에 대한 이진 변수로 변환하는 것이 좋습니다 (예 : A_level1 : {0,1}, A_level2 : {0,1}). 일부는이 "더미 변수"라고합니다. 그렇게 말하면, 새로운 변수로 전체 데이터 세트를 중앙에 배치하고 스케일링하는 것이 오해의 소지가 있습니까? 마치 변수의 "켜기 …

3
극도로 치우친 분포 변환
분포가 매우 긍정적으로 치우친 변수가 있다고 가정하여 정규 분포의 비대칭 범위 내에 로그를 가져 오기에 충분하지 않습니다. 이 시점에서 내 옵션은 무엇입니까? 변수를 정규 분포로 변환하려면 어떻게해야합니까?

4
두꺼운 꼬리 분포에 해당하는 상자 그림?
대략 정규 분포 된 데이터의 경우 상자 그림을 사용하면 특이 치의 존재뿐만 아니라 데이터의 중앙값과 확산을 빠르게 시각화 할 수 있습니다. 그러나 더 두꺼운 꼬리 분포의 경우 특이점이 IQR의 고정 된 요인을 벗어난 것으로 정의되기 때문에 많은 점이 특이 치로 표시되며, 이는 물론 꼬리가 두꺼운 분포에서 훨씬 더 자주 발생합니다. …



당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.