치트 시트 ANOVA 알파벳 수프 및 회귀 분석


18

ANOVA 및 REGRESSION에 해당하는 베어링을 가져 오려고이 임시 (진행중인) 시도를 완료하는 데 도움을받을 수 있습니까? 이 두 가지 방법론의 개념, 명명법 및 구문을 조정하려고 노력했습니다. 이 사이트에는 공통점에 대한 많은 게시물이 있습니다 (예 : this 또는 this ). 그러나 시작할 때 빠른 "현재 위치"맵을 유지하는 것이 좋습니다.

이 게시물을 업데이트 할 계획이며 실수를 수정하는 데 도움이되기를 바랍니다.

일원 분산 분석 :

Structure:   DV is continuous; IV is ONE FACTOR with different LEVELS.
Scenario:    miles-per-gal. vs cylinders
             Note that Income vs Gender (M, F) is a t-test.
Syntax:      fit <- aov(mpg ~ as.factor(cyl), data = mtcars); summary(fit); TukeyHSD(fit)
Regression:  fit <- lm(mpg ~ as.factor(cyl), mtcars) 
             # with F dummy coded;
             summary(fit); anova(fit)

양방향 분산 분석 :

Structure:   DV is continuous; IV is > 1 FACTORS with different LEVELS.
Scenario:    mpg ~ cylinders & carburators
Syntax:      fit <- aov(mpg ~ as.factor(cyl) + as.factor(carb), mtcars); 
             summary(fit); TukeyHSD(fit)
Regression:  fit <- lm(mpg ~ as.factor(cyl) + as.factor(carb), mtcars) 
             # with F dummy coded; 
             summary(fit); anova(fit)

양방향 요인 분석 :

Structure:   All possible COMBINATIONS of LEVELS are considered.
Scenario:    mpg ~ cylinders + carburetors + (4cyl/1,...8cyl/4)
Syntax:      fit <- aov(mpg ~ as.factor(cyl) * as.factor(carb), mtcars); 
             summary(fit); TukeyHSD(fit)
Regression:  fit <- lm(mpg ~ as.factor(cyl) * as.factor(carb), mtcars) 
             # with F dummy coded; 
             summary(fit); anova(fit)

안 코바 :

Structure:   DV continuous ~ Factor and continuous COVARIATE.
Scenario:    mpg ~ cylinders + weight
Syntax:      fit <- aov(mpg ~ as.factor(cyl) + wt, mtcars); summary(fit)
Regression:  fit <- lm(mpg ~ as.factor(cyl) + wt, mtcars) 
             # with F dummy coded; 
             summary(fit); anova(fit)

MANOVA :

Structure:   > 1 DVs continuous ~ 1 FACTOR ("One-way") or 2 FACTORS ("Two-way MANOVA").
Scenario:    mpg and wt ~ cylinders
Syntax:      fit <- manova(cbind(mpg,wt) ~ as.factor(cyl), mtcars); summary(fit)
Regression:  N/A

만코 바 :

Structure:   > 1 DVs continuous ~ 1 FACTOR + 1 continuous (covariate) DV.
Scenario:    mpg and wt ~ cyl + displacement (cubic inches)
Syntax:      fit <- manova(cbind(mpg,wt) ~ as.factor(cyl) + disp, mtcars); summary(fit)
Regression:  N/A

요인 내 (또는 대상) 분산 분석 : ( 여기 코드 )

Structure:   DV continuous ~ FACTOR with each level * with subject (repeated observations).
             Extension paired t-test. Each subject measured at each level multiple times. 
Scenario:    Memory rate ~ Emotional value of words for Subjects @ Times
Syntax:      fit <- aov(Recall_Rate ~ Emtl_Value * Time + Error(Subject/Time), data); 
             summary(fit); print(model.tables(fit, "means"), digits=3);
             boxplot(Recall_Rate ~ Emtl_Value, data=data)
             with(data, interaction.plot(Time, Emtl_Value, Recall_Rate))
             with(data, interaction.plot(Subject, Emtl_Value, Recall_Rate))
             NOTE: Data should be in the LONG FORMAT (same subject in multiple rows)
Regression:  Mixed Effects
             require(lme4); require(lmerTest)
             fit <- lmer(Recall_Rate ~ Emtl_Value * Time + (1|Subject/Time), data); 
             anova(fit); summary(fit); coefficients(fit); confint(fit) 
or
             require(nlme)
             fit <- lme(Recall_Rate ~ Emtl_Value * Time, random = ~1|Subject/Time, data)
             summary(fit); anova(fit); coefficients(fit); confint(fit)

스플릿 플롯 : ( 여기 코드 )

Structure:   DV continuous ~ FACTOR/-S with RANDOM EFFECTS and pseudoreplication.
Scenario:    Harvest yield ~ Factors = Irrigation / Density of seeds / Fertilizer 
                 & RANDOM EFFECTS (Blocks and plots of land): 
Syntax:      fit <- aov(yield ~ irrigation * density * fertilizer + 
                 Error(block/irrigation/density), data); summary(fit)
Regression:  Mixed Effects
             require(lme4); require(lmerTest); 
             fit <- lmer(yield ~ irrigation * fertilizer + 
             (1|block/irrigation/density), data = splityield); 
             anova(fit); summary(fit); coefficients(fit); confint(fit)
or
             library(nlme)
             fit <- lme(yield ~ irrigation * variety, random=~1|field, irrigation)
             summary(fit); anova(fit)

필요한 디자인 : ( 여기 코드 )

Structure:   DV continuous ~ FACTOR/-S with pseudoreplication.
Scenario:    [Glycogen] ~ Factors = Treatment & RANDOM EFFECTS with Russian-doll effect: 
             Six rats (6 Livers)-> 3 Microscopic Slides/Liver-> 2 Readings/Slide). 
Syntax:      fit <- aov(Glycogen ~ Treatment + Error(Rat/Liver), data); summary(fit)
Regression:  Mixed Effects
             require(lme4); require(lmerTest)
             fit <- lmer(Glycogen ~ Treatment + (1|Rat/Liver), rats); 
             anova(fit); summary(fit); coefficients(fit); confint(fit)
or
             require(nlme)
             fit<-lme(Glycogen ~ Treatment, random=~1|Rat/Liver, rats)
             summary(fit); anova(fit); VarCorr(fit)

유용한 사이트 :

  1. RExRepos
  2. 성격 프로젝트
  3. 빠른 R
  4. R- 블로거
  5. M. Crawley의 중첩 분석 및 분할 플롯
  6. 여러 랜덤 효과가있는 모델
  7. 분할 플롯 모델
  8. M. Crawley의 R 책
  9. 그룹 내 및 반복 측정
  10. R의 측정 값 반복
  11. GLMM FAQ

한 가지 참고 사항 : 2-way ANOVA 예제 (직선 및 계승)의 경우 시나리오 / 구문은 cyl + hp입니다. Horespower는 지속적이므로 작동하지 않습니다. carb기화기의 수가 더 나은 선택이 될 것입니다.
그레고르

감사합니다! 부주의 한 실수. 메모 덕분에 cyl이 연속 처리 된 것으로 감지되어 as.factor로 변경했습니다. 그리고 TukeyHSD도 포함 시켰습니다.
Antoni Parellada

1
제목에서 '생존 (Survival)'을 삭제해야한다고 생각합니다. 왜냐하면 그것은 당신이 (매우 멋지게) 요약하는 것과는 전혀 관련이없는 매우 구체적인 통계 영역입니다.
Bryan Hanson

좋은 요약 Antoni! 어쩌면 당신은 또한 추가 할 수 있습니다 glmmFAQs 벤 Bolker에 의해 그리고 아마도 몇 가지 간단한 이항 및 포아송 예 (GLM 및 GLMM을). 그러나 나는 이것이 너무 많은 것을 복잡하게 할 수 있으며이 좋고 ​​간결한 요약에서 벗어나는 것을 이해합니다. 또는이 사이트의 예제에 링크 할 수 있습니다. 완전한 간단한 포아송 / 음 이항 예제의 경우 다음과 같이 작동합니다. stats.stackexchange.com/questions/325334/…
Stefan

답변:


2

좋은 목록, Antoni. 다음은 몇 가지 사소한 제안입니다.

일원 분산 분석 : IV는 3 개 이상의 수준을 가진 요인입니다. 이 항목에 예제 데이터 : mtcars 를 추가 할 수도 있습니다 . 비슷하게 모든 항목에 * Example Data "문을 추가하여 사용중인 데이터 세트를 더 명확하게 만들 수 있습니다.

양방향 Anova : IV1 및 IV2를 사용하고 두 개의 독립 변수가 각각 최소 두 가지 수준의 요인이어야한다고 설명해보십시오. 이 설명에 따르면 양방향 anova에는 무의미한 독립 변수 (또는 요인)가 2 개 이상 포함될 수 있습니다.

양방향 Anova의 경우 다음 두 하위 사례를 구분할 것입니다. 1. IV1 및 IV2의 주요 효과가있는 양방향 Anova 및 2. IV1과 IV2의 상호 작용이있는 양방향 Anova. 이 두 번째 항목은 두 가지 요인을 요인 계승 분산 분석법으로 참조하는 것입니다.)이 두 가지 하위 사례를 설명하는 더 좋은 방법은 다음과 같습니다. DV에 IV2에 따라 다릅니다. 회귀 설정에서 더미 코딩 된 독립 변수 IV1 및 IV2임을 더 명확하게 알 수 있습니다.

ANCOVA의 경우 현재 예제에서 단방향 ANCOVA 만 고려하고 있음을 명확히 할 수 있습니다. 완전성을 위해 IV1과 IV2 사이의 상호 작용이없고이 두 변수 사이의 상호 작용이있는 양방향 ANCOVA 예제를 추가 할 수 있습니다.

위의 모든 경우, 이러한 분석이 유용한시기를 설명하는 Purpose 라는 항목을 추가 할 수도 있습니다 . 예를 들면 다음과 같습니다.

목적 (단방향 anova의 목적) : DV의 평균값이 IV 수준에 따라 다른지 조사하십시오.

MANOVA의 경우, (a) 둘 이상의 DV와 (2) 요인 인 하나 이상의 IV가 필요하다는 것을 명확히 할 수 있습니까? 단방향 MANOVA (1 요인)와 양방향 MANOVA를 구별 할 수 있다고 생각하십니까? MANCOVA도 마찬가지입니다.

WITHIN-FACTOR ANOVA는 REPEATED MEASURES ANOVA로도 알려져 있으므로이 용어를 익숙한 사람들을 위해 목록에 추가 할 수 있습니다. 혼합 효과 모델링이 반복 측정 데이터를 모델링하는 다른 방법을 제공한다는 점을 명확히하는 것이 도움이 될 것입니다. 그렇지 않으면 독자는 두 가지 접근 방식의 차이를 인식하지 못할 수 있습니다.


편집하는 것보다 제안을 제공하는 것이 더 쉽습니다 .🤗
Isabella Ghement
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.