정규 분포 X와 Y는 정규 분포 잔차를 더 많이 발생합니까?


12

여기서 선형 회귀 분석에서 정규성의 가정에 대한 잘못된 해석이 논의되고 ( '정규'는 잔차가 아닌 X 및 / 또는 Y를 나타냄) 포스터는 정규 분포가 아닌 X와 Y를 가질 수 있는지 묻습니다. 여전히 정규 분포 잔차가 있습니다.

내 질문은 : 정규 분포 X와 Y 가 정규 분포 잔차를 초래할 가능성더 큽 니까? 관련 게시물이 많이 있었지만이 질문을 구체적으로 한 사람은 믿지 않습니다.

회귀가 한 번만 있다면 이것이 사소한 포인트 일지 모르지만 여러 번의 테스트가있는 경우에는 더 적습니다. 따라서 100 개의 X 변수가 있고 모두 같은 기울어 짐을 가지고 있으며 모두 테스트하고 싶습니다. 그것들을 모두 정규 분포로 변환하면 비정규 분포 잔차로 인해 재검사가 필요한 X 변수가 더 적거나 (변환이 다르거 나 전혀 없음) 사전 회귀 변환이 완전히 임의적입니까?


1
"더 가능성이 높다"고 답하기 위해 우리는 아마도 마진뿐만 아니라 조인트 분포에 대해 무언가를 포지셔닝해야 할 것입니다.
Glen_b-복지 주 모니카

답변:


15

YXYXXX+10X1/5X/πYXXYY|X)는 동일합니다. 즉, 이전과 마찬가지로 정상인지 여부입니다. (이 주제를보다 완벽하게 이해하려면 여기에서 내 대답을 읽는 데 도움이 될 수 있습니다. 잔차가 정상적으로 분포되어 있지만 Y는 그렇지 않은 경우는 무엇입니까? )

XXYXXXY

비선형 변환이 모델을 변경하는 방법과 모델이 응답하는 질문 (로그 변환에 중점을 두어)에 대한 자세한 내용은 다음과 같은 CV 스레드를 읽는 데 도움이 될 수 있습니다.

XYβ^00Xβ^1 (m)=100×β^1 (cm)Y 1cm 이상으로 1m 이상 100 배 증가합니다).


Y YYλYX


XY

YXR

set.seed(9959)              # this makes the example exactly reproducible
x = rnorm(100)              # x is drawn from a normal population
y = 7 + 0.6*x + runif(100)  # the residuals are drawn from a uniform population

mod = lm(y~x)
summary(mod)
# Call:
# lm(formula = y ~ x)
# 
# Residuals:
#     Min      1Q  Median      3Q     Max 
# -0.4908 -0.2250 -0.0292  0.2539  0.5303 
# 
# Coefficients:
#             Estimate Std. Error t value Pr(>|t|)    
# (Intercept)  7.48327    0.02980   251.1   <2e-16 ***
# x            0.62081    0.02971    20.9   <2e-16 ***
# ---
# Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
# 
# Residual standard error: 0.2974 on 98 degrees of freedom
# Multiple R-squared:  0.8167,  Adjusted R-squared:  0.8148 
# F-statistic: 436.7 on 1 and 98 DF,  p-value: < 2.2e-16

여기에 이미지 설명을 입력하십시오

그림에서 우리는 두 한계 모두 합리적으로 정상적인 것으로 보이며 관절 분포는 이변 량 정상으로 보입니다. 그럼에도 불구하고 잔차의 균일 성은 QQ-PLOT에 나타납니다. 두 꼬리는 정규 분포에 비해 너무 빨리 떨어집니다 (실제로 그들은 필요합니다).


0

짧은 대답은 고전적인 단순 회귀 이론에 있으며 X는 고정되어 알려진 것으로 간주됩니다 (예 : http://www.theanalysisfactor.com/the-distribution-of-independent-variables-in-regression-models-2/ ), 측정 오류가없는 경우에도 최소 제곱 베타가 치우 치거나 일관성이 없을 수 있습니다 ( https://www.google.com/url?sa=t&source=web&rct=j&ei=Bd3sU4_kHfPjsATAm4LADA&url=https://files.nyu 참조) .edu / mrg217 / public / measurement_handouts.pdf & cd = 2 & ved = 0CCMQFjAB & usg = AFQjCNF_pZvocW1SzInQPYpQTifUsQ36kQ & sig2 = 4lAnOQO23FiZbZ7323jOzA ).

X를 변수로 만드는 것과 관련하여 Gauss-Markov 정리의 Wikipedia는 다음과 같이 간단히 요약합니다.

"대부분의 OLS 처리에서 데이터 X 는 고정 된 것으로 가정합니다.이 가정은 계량 경제학과 같은 비 실험적 과학에는 적합하지 않은 것으로 간주됩니다. [2] 대신 가우스-마코프 정리의 가정은 X에 조건부로 표시됩니다. "

과학에서 예술, 또는 예술 / 과학으로의 주요한 불변의 변형으로 읽습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.