분산 분석을 배우고 싶습니다. 알고리즘의 작동 방식 (계산이 수행되는 방식) 및 작동 방식을 배우기 전에 먼저 ANOVA로 어떤 문제를 해결하는지, 또는 어떤 대답을하려고하는지 알고 싶습니다. 다시 말해, 알고리즘의 입력과 출력은 무엇입니까?
입력으로 무엇을 사용하는지 이해합니다. 우리는 일련의 숫자를 가지고 있습니다. 각 숫자에는 하나 이상의 범주 형 변수 ( "인자"라고도 함) 값이 있습니다. 예를 들면 다음과 같습니다.
+------------+------------+-------+
| factor 1 | factor 2 | value |
+------------+------------+-------+
| "A" | "a" | 1.0 |
| "A" | "a" | 2.4 |
| "A" | "b" | 0.3 |
| "A" | "b" | 7.4 |
| "B" | "a" | 1.2 |
| "B" | "a" | 8.4 |
| "B" | "b" | 0.4 |
| "B" | "b" | 7.2 |
+------------+------------+-------+
ANOVA가 값의 평균에 대한 요인의 영향이 없다는 귀무 가설의 p- 값을 계산한다고 말하는 것이 맞습니까? 다시 말해, 우리는 위에서 주어진 데이터를 알고리즘에 제공하고 결과적으로 귀무 가설의 p- 값을 얻는가?
이 경우 p- 값을 계산하기 위해 실제로 어떤 측정 값을 사용합니까? 예를 들어, 귀무 가설을 감안할 때 M은 1 %의 경우 우연히 관찰 된 것보다 높을 수 있습니다. M은 무엇입니까?
또한 분산 분석의 요인을 개별적으로 조사하지 않습니까? ANOVA는 factor_1이 효과가 있지만 factor_2는 효과가 없다고 말할 수 있습니까? ANOVA는 값 "A", "B"및 "C"에 해당하는 주어진 요인 값에 대해 통계적으로 구별 할 수 없지만 (예를 들어 같은 평균을 가짐) 값 "D"가 영향을 미친다고 말할 수 있습니까?