«assumptions» 태그된 질문

통계 절차가 유효한 추정 및 / 또는 추론을 산출하는 조건을 나타냅니다. 예를 들어, 많은 통계 기법은 데이터가 임의의 방식으로 무작위로 샘플링된다는 가정을 요구합니다. 추정기에 대한 이론적 결과는 일반적으로 데이터 생성 메커니즘에 대한 가정을 요구합니다.

6
로지스틱 회귀 분석의 표본 크기?
설문 조사 데이터에서 물류 모델을 만들고 싶습니다. 응답자 154 명만 인터뷰 한 4 개의 거주지 식민지에 대한 소규모 조사입니다. 내 종속 변수는 "만족스러운 전환으로 작동"입니다. 154 명의 응답자 중 73 명은 만족스럽게 직장으로 전환했지만 나머지는 그렇지 않다는 것을 알았습니다. 따라서 종속 변수는 본질적으로 이진이며 로지스틱 회귀를 사용하기로 결정했습니다. 7 개의 …

4
R에서 가정 lmer / lme 혼합 모델 확인
반복 된 디자인을 실행하여 세 가지 작업에서 30 명의 남성과 30 명의 여성을 테스트했습니다. 나는 남성과 여성의 행동이 어떻게 다른지 그리고 그것이 어떻게 과제에 달려 있는지 이해하고 싶습니다. 나는 이것을 조사하기 위해 lmer와 lme4 패키지를 모두 사용했지만 두 가지 방법에 대한 가정을 확인하려고 노력하고 있습니다. 내가 실행하는 코드는 lm.full <- …

5
표본 분포가 비정규 일 때 독립 표본 t- 검정은 얼마나 강력합니까?
샘플 분포가 정규성을 벗어날 때 t- 검정 이 "합리적으로 강력" 하다는 것을 읽었습니다 . 물론 중요한 차이의 샘플링 분포입니다. 두 그룹에 대한 데이터가 있습니다. 그룹 중 하나가 종속 변수에 치우쳐 있습니다. 표본 크기는 두 그룹 모두에 대해 상당히 작습니다 (하나는 n = 33, 다른 하나는 45). 이러한 조건에서 내 t- …

5
선형 모형의 가정 및 잔차가 정규 분포가 아닌 경우 수행 할 작업
선형 회귀의 가정이 무엇인지 조금 혼란 스럽습니다. 지금까지 나는 여부를 확인했다. 모든 설명 변수는 응답 변수와 선형으로 상관됩니다. (이 경우였다) 설명 변수 사이에 공선 성이있었습니다. (공동성이 거의 없었습니다). 내 모델의 데이터 포인트의 Cook 거리가 1 미만입니다 (이 경우 모든 거리가 0.4 미만이므로 영향 지점이 없음). 잔차는 정규 분포입니다. (이것이 아닐 …

4
상관 관계의 기본 가정과 유의성 회귀 기울기 검정의 차이
내 질문은 다른 질문 에 대한 의견에서 @whuber와의 토론에서 자랐습니다 . 구체적으로 @whuber의 의견은 다음과 같습니다. 놀랍게도 한 가지 이유는 상관 관계 테스트와 회귀 기울기 테스트의 기본 가정이 다르기 때문에 상관 관계와 기울기가 실제로 같은 것을 측정한다는 것을 이해하더라도 p- 값이 동일한 이유는 무엇입니까? 이것은 과 가 수치 적으로 같아야하는 …

2
회귀선 추정의 목적으로 잔차의 정규성이 왜“거의 중요하지 않은가?”
Gelman and Hill (2006)은 p46에 다음과 같이 썼다. 일반적으로 가장 중요하지 않은 회귀 가정은 오류가 정규 분포되어 있다는 것입니다. 실제로 회귀선을 추정하기 위해서는 (개별 데이터 요소를 예측하는 것과 비교하여) 정규성의 가정이 전혀 중요하지 않습니다. 따라서 많은 회귀 교과서와 달리 회귀 잔차의 정규성을 진단하는 것은 권장하지 않습니다. Gelman과 Hill은이 점을 더 …

2
능선 회귀의 가정은 무엇이고 어떻게 테스트합니까?
다중 회귀 분석을위한 표준 모델 고려 때문에 정상, homoscedasticity 모든 홀드 오류를 uncorrelatedness.와이= Xβ+ ε와이=엑스β+εY=X\beta+\varepsilonε ∼ N( 0 , σ2나는엔)ε∼엔(0,σ2나는엔)\varepsilon \sim \mathcal N(0, \sigma^2I_n) 대각선의 모든 요소에 동일한 소량을 추가하여 능선 회귀를 수행한다고 가정합니다 .엑스엑스X βr i d g e= [ X'엑스+ k I]− 1엑스'와이β아르 자형나는디지이자형=[엑스'엑스+케이나는]−1엑스'와이\beta_\mathrm{ridge}=[X'X+kI]^{-1}X'Y 는 의 편향 추정기 …

5
다중 회귀 가정 : 정규 가정은 상수 분산 가정과 어떻게 다릅니 까?
다중 회귀 모델을 사용하기위한 조건이라는 것을 읽었습니다. 모형의 잔차는 거의 정상입니다. 잔차의 변동성은 거의 일정합니다 잔차는 독립적이며 각 변수는 결과와 선형으로 관련됩니다. 1과 2는 어떻게 다릅니 까? 여기서 하나를 볼 수 있습니다. 따라서 위의 그래프는 2 표준 편차 인 잔차가 Y-hat에서 10 떨어져 있다고합니다. 이는 잔차가 정규 분포를 따른다는 것을 …


2
-test와
배경 : 저는 가설 테스트 작업에서 동료들에게 프리젠 테이션을하고 있으며, 대부분의 내용을 잘 이해하고 있지만, 이해하고 다른 사람들에게 설명하기 위해 매듭을 짓고있는 한 가지 측면이 있습니다. 이것이 내가 생각하는 것입니다 (잘못되면 수정하십시오!) 분산이 알려진 경우 정상적인 통계 , 분산을 알 수없는 경우 ttt 분포를 따릅니다. CLT (Central Limit Theorem) : …

4
실제로 데이터가 가정을 완전히 충족하지 못하는 경우 사람들이 어떻게 분산을 처리합니까?
이것은 엄격하게 통계적인 질문이 아닙니다. 나는 분산 분석 가정에 대한 모든 교과서를 읽을 수 있습니다. 실제로 작동하는 분석가가 가정을 충족시키지 못하는 데이터를 어떻게 처리하는지 파악하려고합니다. 나는이 사이트에서 많은 답변을 찾고 있으며 ANOVA를 사용하지 않을 때 (추상적이고 이상적인 수학적 상황에서) 또는 R에서 아래에 설명 된 것들 중 일부를 수행하는 방법에 대한 …

1
예측 모델링-혼합 모델링에 관심을 가져야합니까?
예측 모델링의 경우 무작위 효과 및 비 독립적 관측치 (반복 측정)와 같은 통계 개념에 관심을 가져야합니까? 예를 들어 ... 다양한 속성과 구매 플래그가있는 5 개의 DM 캠페인 (1 년 동안 발생) 데이터가 있습니다. 이상적으로는이 모든 데이터를 결합하여 캠페인 당시 고객 속성이 지정된 구매 모델을 구축하는 것이 이상적입니다. 구매 이벤트가 드물기 …

2
로지스틱 회귀에 대한 iid 가정이 있습니까?
로지스틱 회귀의 반응 변수에 iid 가정이 있습니까? 예를 들어 데이터 포인트 가 있다고 가정 합니다. 응답 가 의 Bernoulli 분포에서 온 것 같습니다 . 따라서 매개 변수 가 다른 Bernoulli 분포 가 있어야합니다 .Y i p i = 로짓 ( β 0 + β 1 x i ) 1000 p100010001000와이나는와이나는Y_i피나는= …

1
LASSO 가정
LASSO 회귀 시나리오에서 와이= Xβ+ ϵ와이=엑스β+ϵy= X \beta + \epsilon , LASSO 추정치는 다음 최적화 문제에 의해 제공됩니다. 분β| | 와이− Xβ| | +τ| | β| |1분β||와이−엑스β||+τ||β||1 \min_\beta ||y - X \beta|| + \tau||\beta||_1 에 관한 배포 가정이 있습니까?ϵϵ\epsilon OLS 시나리오에서는 ϵϵ\epsilon 이 독립적이며 정규적으로 배포 될 것으로 예상합니다 . …

4
군집 분석 가정
초보적인 질문에 대한 사과, 나는이 형태의 분석에 익숙하지 않으며 지금까지 원리에 대한 이해가 매우 제한적입니다. 다변량 / 단 변량 검정에 대한 많은 파라 메트릭 가정이 군집 분석에 적용되는지 궁금합니다. 클러스터 분석과 관련하여 읽은 많은 정보 소스는 가정을 지정하지 않습니다. 특히 관측의 독립성에 관심이 있습니다. 내 이해는이 가정 (예 : ANOVA …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.