후속 조치 : ANOVA 사이의 혼합 된 플롯에서 추정 된 SE 또는 실제 SE?


14

나는 현재 논문을 완성하고 있으며 어제 부터이 질문에 우연히 빠져 나에게 같은 질문을 던졌다. 데이터 또는 실제 분산 분석에서 추정 된 실제 오차를 그래프에 제공하는 것이 더 낫습니까?
어제의 질문은 다소 구체적이지 않았고 내 것이 매우 구체적이기 때문에이 후속 질문을 제기하는 것이 적절하다고 생각했습니다.

세부 사항 :
나는 두 그룹 (유도 및 연역적 지시, 즉 주제 간 조작)과 두 개의 내부 주제 조작 (문제 유형 및 문제의 내용, 각 두 가지 요인 수준).

결과는 다음과 같습니다 (ANOVA 출력에서 ​​SE 추정치가있는 왼쪽 패널, 데이터에서 추정 된 SE가있는 오른쪽 패널) : 대체 텍스트
서로 다른 선은 두 개의 서로 다른 그룹 (예 : 개체 간 조작)과 피험자 조작은 x 축 (즉, 2x2 인자 수준)에 표시됩니다.

본문에서 나는 분산 분석의 각 결과를 제공하고 심지어 중간에 중요한 교차 상호 작용에 대한 계획된 비교를 제공합니다. SE는 독자에게 데이터의 가변성에 대한 힌트를 제공하기 위해 존재합니다. SD를 플로팅하는 것이 일반적이지 않기 때문에 표준 편차 및 신뢰 구간보다 SE를 선호하고 개체 내 및 개체 간 CI를 비교할 때 심각한 문제가 있습니다. 그들로부터).

내 질문을 반복하려면 : 분산 분석에서 추정 된 SE를 도표로 작성하는 것이 좋습니까? 아니면 원시 데이터에서 추정 된 SE를 도표로 작성해야합니까?

업데이트 :
예상되는 SE가 조금 더 명확해야한다고 생각합니다. SPSS의 ANOVA Output은 estimated marginal means해당 SE 및 CI를 제공합니다. 이것이 왼쪽 그래프에 그려진 것입니다. 내가 이것을 이해하는 한, 그것들은 잔차의 SD이어야합니다. 그러나 잔차를 저장할 때 SD는 예상 SE 근처에 있지 않습니다. 따라서 보조 (잠재적으로 SPSS에 특정한) 질문
은 다음과 같습니다.이 SE는 무엇입니까?


업데이트 2 : 마침내 마침내 자체적으로 좋아하는 플롯을 만들 수 있어야하는 R 함수를 작성할 수있었습니다 (허용 된 답변 참조). 누구든지 시간이 있다면, 당신이 그것을 볼 수 있다면 정말 감사하겠습니다. 여기있어.


1
예측 된 변수 "평균 승인"을 명확히 할 수 있습니까?. 참가자가 반응에 사용한 0-100 척도입니까, 아니면 참가자가 "예, 승인합니다"( "아니오, 보증하지 않습니다")라고 평가 한 시험 비율에 대한 척도입니다. 후자의 경우,이 데이터를 비율로 분석하는 것은 부적절합니다. 대신 이항 링크 함수가있는 혼합 효과 모델을 사용하여 원시 시험판 데이터를 분석해야합니다.
마이크 로렌스

이것을 생략하여 죄송합니다 : 0-100의 반응 척도입니다.
Henrik

0 또는 100이 많습니까? 그렇지 않다면 100으로 나누고 로짓 변환을 수행하여 극한의 범위 제한을 고려할 것입니다. 이것은 본질적으로 이진 데이터가있을 때 이항 링크 기능에 의해 달성되는 것이지만 여기에있는 것처럼 비례 형 데이터 만있는 경우 유용합니다. 그러나 변환 1 또는 0을 로짓 할 수 없으므로 100 또는 0의 응답을 던져야합니다.
Mike Lawrence

죄송합니다. 첫 번째 의견이 100 % 정확하지 않다는 것을 깨달았습니다. 각 플롯 평균은 0-100 스케일에서 두 반응의 평균을 나타냅니다. 이 데이터에는 100에 가까운 값이 많고 100에 직접 값이 있지만 실제로는 0과 0에 거의 없습니다. 권장 사항을 정당화하기위한 문헌이 있습니까?
Henrik

1
다른 데이터 시각화 사람들은 막대 그래프가 인류에 대한 범죄라고 주장 할 수 있습니다 : Op
Mike Lawrence

답변:


9

영감을 얻은 답변과 내 질문에 대한 토론의 결과로 모델 기반 매개 변수에 의존하지 않고 기본 데이터를 나타내는 다음 플롯을 구성했습니다.

그 이유는 내가 선택할 수있는 표준 오류의 종류와 상관없이 표준 오류는 모델 기반 매개 변수이기 때문입니다. 그렇다면 기본 데이터를 제공하여 더 많은 정보를 전송하지 않는 이유는 무엇입니까?

또한 분산 분석에서 SE를 선택하면 특정 문제에 대해 두 가지 문제가 발생합니다.
먼저 (적어도 나를 위해) SPSSANOVA Output 의 SE가 실제로 무엇인지 확실하지 않습니다 ( 의견 에서이 토론도 참조하십시오 ). 그들은 어떻게 든 MSE와 관련이 있지만 정확히 어떻게 알지 못합니다.
둘째, 기본 가정이 충족 될 때만 합리적입니다. 그러나 다음 그림에서 알 수 있듯이 분산의 동질성 가정은 명확하게 위반됩니다.

상자 그림이있는 플롯 : 대체 텍스트

모든 데이터 포인트가있는 플롯 : 대체 텍스트

두 그룹은 왼쪽이나 오른쪽으로 조금 움직입니다. 왼쪽은 연역적이며 오른쪽은 귀납적입니다. 평균은 여전히 ​​검은 색으로 표시되고 백그라운드의 데이터 또는 상자 그림은 회색으로 표시됩니다. 왼쪽과 오른쪽의 도표 사이의 차이점은 평균이 점이나 상자 그림과 같은 위치에 있거나 중심에 표시되는 경우입니다.
그래프의 품질이 최적화되지 않고 x 축 레이블이 누락되어 죄송합니다.

남아있는 질문은 위의 그림 중 어느 것이 지금 선택할 것인지입니다. 나는 그것에 대해 생각하고 우리 논문의 다른 저자에게 물어야합니다. 그러나 지금 당장은 "수단이 탈락 한 지점"을 선호합니다. 그리고 나는 여전히 의견에 매우 관심이 있습니다.


업데이트 : 일부 프로그래밍 후 마침내 R- 함수를 작성하여 평균과 같은 점이있는 점과 같은 플롯을 자동으로 작성했습니다. 그것을 확인하고 의견을 보내주십시오 !


훌륭한 헨리크. 나는 또한 "이탈 한 지점"을 선호한다. 선분을 가진 피사체를 연결하면 너무 복잡해 보일 수 있습니다. 동정. 분산의 동질성에 관해서는 조금 더 낙관적입니다. 분산 문제는 원시 데이터에서 보는 것처럼 나쁘지 않을 수 있습니다. 대부분의 경우 그룹 차이 내에서 대비를 비교한다고 생각합니다. 대비 분산은 원시 데이터의 분산보다 균질합니다. 다른 분산을 가진 미가공 측정치가 비교되는 경우 (예 : MP- 유효 및 그럴듯한 그룹의 유도 성 vs 연성) 비모수 적 테스트가 백업으로 사용될 수 있습니다.
Thylacoleo

1
나는 의미가 중앙에있는 점을 좋아합니다. 선을보다 정확하게 표현합니다. 포인트를 작게 만들 수 있습니다.
John

8

이러한 유형의 실험 설계에서는 추론 목적으로 적합한 단일 오차 막대를 찾을 수 없습니다. 이것은 명확한 해결책이없는 오래된 문제입니다.

당신이 여기에 예상 SE를 갖는 것은 불가능한 것 같습니다. 이러한 설계에는 S 오류와 S 오류의 두 가지 주요 오류가 있습니다. 그것들은 보통 서로 매우 다르며 비교할 수 없습니다. 실제로 데이터를 나타내는 좋은 단일 오류 막대는 없습니다.

데이터의 원시 SE 또는 SD가 추론 적 의미가 아닌 설명 적 의미에서 가장 중요하다고 주장 할 수 있습니다. 중앙 경향 추정 (SE)의 품질 또는 데이터의 변동성 (SD)에 대해 알려줍니다. 그러나 S 내에서 테스트하고 측정하는 것은 원시 값이 아니라 내부 S 변수의 효과이기 때문에 다소 불분명합니다. 따라서 미가공 값의 변동성을보고하는 것은 S 효과 내에서 의미가 없거나 오해의 소지가 있습니다.

나는 일반적으로 그러한 그래프와 효과의 변동성을 나타내는 인접 효과 그래프에서 오류 막대를 보증하지 않았습니다. 그 그래프에는 CI가 완벽하게 합리적 일 수 있습니다. 효과 그래프의 예는 Masson & Loftus (2003)를 참조하십시오. 표시되는 평균값 주위의 ((거의 완전히 쓸모없는) 오류 막대를 제거하고 효과 오류 막대 만 사용하면됩니다.

연구를 위해 먼저 데이터를 2 x 2 x 2 디자인 (2-panel 2x2)으로 다시 플롯 한 다음 유효성, 타당성, 지시 및 상호 작용 효과의 신뢰 구간을 사용하여 그래프 바로 옆에 플롯합니다. 명령어 그룹의 SD 및 SE를 표나 텍스트에 넣습니다.

(예상 혼합 효과 분석 응답을 기다리는 중)

업데이트 : 좋아, 편집 한 후에는 값 추정의 품질을 나타내는 데 사용되는 SE만이 확실하다는 것이 분명합니다. 이 경우 모델 값을 사용하십시오. 두 값 모두 모델을 기반으로하며 샘플에 'true'값이 없습니다. 데이터에 적용한 모델을 사용하십시오. 그러나 그림 캡션에서 독자에게 이러한 SE가 S 효과 나 상호 작용 내에서 어떠한 가치도 없다고 경고해야합니다.

업데이트 2 : 당신이 제시 한 데이터를 되돌아 보면 ... 처음에는 ANOVA로 분석해서는 안되는 백분율과 같은 것으로 보입니다. 존재하든 그렇지 않든, 최대 100의 변수이며 극단에서 분산을 줄 였으므로 여전히 분산 분석으로 분석해서는 안됩니다. 나는 당신의 rm.plot 플롯을 매우 좋아합니다. 나는 여전히 원시 데이터를 보여주는 조건과 S 변수가 제거 된 데이터를 보여주는 조건 내에서 별도의 조건을 그리는 유혹을 받고 있습니다.


1
그래프를 그대로 플롯해야하는 좋은 이유 (비 통계적 이유)가 있습니다. 연구 질문에 대한 답변을 직접 볼 수 있습니다. 또한, 나는 그 사이의 문제에 대해 알고있는 것처럼 추론 목적으로 오류 표시 줄을 찾지 않습니다. 그러나, 나를 Mason & Loftus로 다시 지적함으로써, 나는 그들이 혼합 된 예를 가지고 있다는 것을 잊었을 것입니다. 그것이 내 목적에 맞는지 생각해야합니다.
Henrik

7

이것은 매우 좋은 실험처럼 보입니다. 축하합니다.

나는 John Christie에 동의합니다.이 모델은 혼합 모델이지만 분산 분석 설계에서 올바르게 지정할 수 있다면 (& 균형이 잡 힙니다) 왜 그렇게 공식화 할 수 없는지 모르겠습니다. 피험자 사이의 두 요인과 한 요인이지만 피험자 간 요인 (유도 / 연관)은 피험자 내 효과와 명확하게 상호 작용 (수정)합니다. 플로팅 된 평균이 ANOVA 모델 (LHS)에서 온 것으로 가정하여 모델이 올바르게 지정되었습니다. 잘했습니다-이것은 사소한 것이 아닙니다!

1) "추정 된"대 "실제적인" "오류"는 잘못된 이분법입니다. 둘 다 기본 모델을 가정하고 그 기준으로 추정합니다. 모델이 합리적이라면 모델 기반 추정값을 사용하는 것이 좋습니다 (더 큰 샘플 풀링을 기반으로 함). 그러나 James가 언급했듯이 오류는 비교 한 내용에 따라 다르므로 간단한 표현은 불가능합니다.

2) 박스 플로트 또는 개별 데이터 포인트가 너무 많지 않은 경우, 약간의 측면 지터로 플롯되는 것을 선호하므로 동일한 값을 가진 포인트를 구별 할 수 있습니다.

http://en.wikipedia.org/wiki/Box_plot

3) 평균 오차의 추정치를 작성해야하는 경우 SD를 절대로 플롯하지 마십시오. 이는 표본의 표준 편차의 추정치이며 평균의 통계적 비교가 아니라 모집단 변동성과 관련이 있습니다. 일반적으로 SE보다는 95 % 신뢰 구간을 표시하는 것이 바람직하지만이 경우에는 그렇지 않습니다 (1 및 John의 요점 참조).

4) 저와 관련된이 데이터의 한 가지 문제는 "유효성 및 그럴듯한"MP 데이터가 특히 연 역자들에게 100 % 한계에 의해 명확하게 제한되어 있기 때문에 균일 분산의 가정이 위반되었을 가능성이 있다는 것입니다. 나는이 문제가 얼마나 중요한지 내 마음 속에 던지고있다. 혼합 효과 로짓 (이항 확률)으로 이동하는 것이 이상적인 솔루션 일 수 있지만 어려운 질문입니다. 다른 사람들이 대답하도록하는 것이 가장 좋습니다.


1의 권장 사항을 잘 모르겠습니다. 실제 SE [예 : SD / sqrt (n)]와 추정 된 SE는 모두 모델 기반이므로 모델 기반을 사용하는 것이 좋습니다. 그래서 어느 것? 또는 더 복잡한 모델을 사용하면 (여기서는 분산 분석) 두 모델 모두 합리적입니다.
Henrik

포인트 1에 완전히 동의
John

안녕 Henrik, 간단한 예-ND로 가정 된 두 그룹 (x1, x2)을 비교하십시오. 가정 및 모델 : 1) 독립적으로 샘플링 된 다른 분산. x1, x2에 대한 SE는 별도로 추정됩니다. 이것은 많은 그래픽 프레젠테이션에서 암시 적으로 가정 한 것입니다. 예상되는 SE는 다릅니다. 2) 깊이, 같은 var. 일반적인 ANOVA 가정. 풀링 된 RSS를 사용하여 SE를 추정합니다. 추정은보다 강력한 IF 가정이 정확합니다. 3) 각 x1에는 x2 쌍이 있습니다. x1-x2에서 추정 된 SE 효과적으로 플로팅하려면 차이 x1-x2를 플로팅해야합니다. 1)과 2)를 혼합하면 의미있는 SE 또는 CI를 작성하는 데 실제로 문제가 있습니다.
Thylacoleo

헨리크, 음모에 대한 의견. 몇 과목이 있습니까? 데이터를 개별적으로 플로팅하고 선 세그먼트를 사용하여 개인을 연결하는 것이 좋습니다. 선분 연결 수단은 기만적입니다. SE를 그릴 필요는 없습니다. 아이디어는 통계 분석을 시각적으로 지원하는 것입니다. 음모가 너무 어수선 해지지 않으면 독자는 (예를 들어) 대부분의 점수가 유도 그룹의 MP 유효 임펄스에서 AC- 유속-플레 우스로 올라가고 연 역자 그룹의 경우 다운됨을 알 수 있습니다. jstor.org/stable/2685323?seq=1 특히 그림 1 및 9 하단 패널을 참조하십시오 .
Thylacoleo

3

최근에 혼합 효과 분석을 사용하고 있으며 동반되는 시각적 데이터 분석 방법을 개발하려고 시도하는 동안 부트 스트랩 ( 여기서는 설명 참조)을 사용하여 문제가 발생하기 어려운 신뢰 구간을 생성했습니다. 기존 CI의

또한 위의 그래프에서와 같이 여러 변수를 동일한 시각적 미학에 매핑하지 마십시오. x 축에 매핑 된 3 개의 변수 (MP / AC, 유효 / 무효, 타당성 / 불가능)가있어 디자인과 패턴을 파싱하기가 다소 어렵습니다. 대신 MP / AC를 x 축에 매핑하고, 패싯 열에 유효 / 유효하지 않으며, 패싯 행에 그럴듯 / 비유 효성을 표현하는 것이 좋습니다. 이것을 쉽게 달성하기 위해 R에서 ggplot2를 확인하십시오.

library(ggplot2)
ggplot(
    data = my_data
    , mapping = aes(
        y = mean_endorsement
        , x = mp_ac
        , linetype = deductive_inductive
        , shape = deductive_inductive
)+
geom_point()+
geom_line()+
facet_grid(
    plausible_implausible ~ valid_invalid
)

Mike는 패키지 언어 R에서 pvals.fnc 함수는 MCMC를 통해 lmer 모델의 가설을 평가하지만 임의의 기울기를 갖는 설계를 처리하지는 않습니다. 어쨌든 문제가 있습니다. 그러한 문제가 없다는 것을 확실히 알고 있습니까?
russellpierce

나는 아직도 MCMC가 어떻게 작동하는지 알지 못했다는 것을 인정해야한다. 이것이 내가 부트 스트래핑을 선택한 이유 중 하나이다. 예상대로 임의의 기울기로 부트 스트랩이 가능해야하지만 pvals.fnc는 임의의 기울기가있는 모델에 대해 CI를 허용하지 않습니다. 왜냐하면 어떤 이유로 든 유효하지 않기 때문에이 무효가 확장 될 수 있기 때문입니다. 그런 모델을 부트 스트랩. 부트 스트래핑에 문제가 있다고 직관적으로 생각하지는 않지만 제한된 전문 지식의 기능 일 수 있습니다.
마이크 로렌스
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.