답변:
데이터 세트가 세트로 구성되어 가정 에 대한 전 = 1 , ... , n은 당신이의 의존성보고 싶지 Y 에 X .
사용자가 값을 찾을 가정 α 와 β 의 α 및 β 그 제곱의 합을 최소화 잔류 N Σ를 난 = 1 ( Y I - ( α + β X I ) ) 2 . 그럼 당신은
이제 총 제곱합을 분해하는 것을 고려하십시오 과N-1 개자유도, "설명"및 "불명"부분으로 : N Σ 난 = 1 ( ( α + β X I ) - ˉ Y ) 2 ⏟ 설명+ N Σ 난 = 1 ( Y I - ( α + β X I ) ) 2 ⏟ 불명. 와1
예측 변수가 범주 형일 때 종종 "분산 분석"이라는 용어를 만나므로 모형 적합합니다.
몇 가지 추가 사항 :
주요 차이점은 반응 변수입니다. 로지스틱 회귀 분석은 선형 회귀 분석 및 비선형 회귀 분석에서 이항 반응을 다루지 만 반응 변수는 연속적입니다. 연속 반응 변수와 기능적 관계가있는 변수 (일명 공변량)가 있습니다. 분산 분석에서 반응은 연속적이지만 몇 가지 다른 범주 (예 : 처리 그룹 및 제어 그룹)에 속합니다. 분산 분석에서 그룹 간 평균 반응의 차이를 찾습니다. 선형 회귀 분석에서는 공변량이 변함에 따라 반응이 어떻게 변하는 지 살펴 봅니다. 차이를 보는 또 다른 방법은 회귀 분석에서 공변량은 연속적이지만 분산 분석에서는 불연속 그룹이라는 것입니다.
분산 분석 (ANOVA)은 구조로 간주되는 관측치를 분석하는 통계적 방법의 본문입니다.
의 선형 조합으로 구성됩니다. 알 수없는 수량 더하기 오류 그리고 {}는 rv의 {}는 서로 관련이 없으며 동일한 평균을 가짐 그리고 분산 (알 수 없는).
즉 여기서 D 는 분산 행렬 또는 분산 공분산 행렬입니다.
, 여기서 계수 {}는 효과의 유무를 나타내는 카운터 변수 또는 지표 변수 의 값입니다.} 관찰 조건에서 : {} 횟수입니다 i 번째 관찰 에서 발생하며 일반적으로 또는 . 일반적으로 분산 분석에서 모든 요소는 정 성적으로 처리됩니다.
{}는 카운터 변수가 아니라 다음과 같은 연속 변수에 의해 관측 값에서 얻은 값입니다. = time,= 온도,등, 우리는 회귀 분석의 경우가 있습니다. 일반적으로, 회귀 분석에서 모든 요소는 정량적이며 정량적으로 처리됩니다.
주로이 두 종류는 분석의 두 종류입니다 .
회귀 분석에서는 하나의 변수가 고정되어 있으며 변수가 다른 변수와 어떻게 진행되는지 알고 싶습니다.
분산 분석에서 예를 들어 :이 특정 동물성 식품이 동물의 체중에 영향을 미치는 경우 ... 하나의 고정 변수와 다른 변수에 대한 영향.