Welch t-test의 자유도보고

동일하지 않은 분산에 대한 Welch t- 검정 (Welch-Satterthwaite 또는 Welch-Aspin이라고도 함)은 일반적으로 정수 가 아닌 자유도를 갖습니다 . 테스트 결과를보고 할 때 이러한 자유도를 어떻게 인용해야합니까?

다양한 소스 *에 따르면 "표준 t 테이블을 컨설팅하기 전에 가장 가까운 정수로 내림하기 위해 기존의 것입니다."- 보수적 라운딩이 방향으로 의미가 ** 일부 오래된 통계 소프트웨어 (예 :도 이런 짓을 했을까 그래프 패드 프리즘 버전 전에 6 ) 일부 온라인 계산기는 여전히 작동합니다. 이 절차를 사용한 경우, 반올림 자유도를 보고하는 것이 적절 해 보입니다. 더 나은 소프트웨어를 사용하는 것이 더 적합 할 수도 있습니다!

그러나 현대 패키지의 대다수는 분수 부분을 사용 하므로이 경우 분수 부분을 인용해야합니다. 자유도의 천분의 일이 p- 값 에 무시할만한 영향을 미치기 때문에 소수점 이하 두 자리 이상을 인용하는 것이 적절하다는 것을 알 수 없습니다 .

Google 학자 주변을 살펴보면 df를 정수로 인용 한 논문을 소수점 이하 한 자리 또는 소수점 이하 두 자리로 인용 한 것을 볼 수 있습니다. 사용 정확도에 대한 지침이 있습니까? 소프트웨어 전체 소수부를 사용하는 경우에도, 상기 반올림 df라고 인용한다 아래 (예를 들어 도면의 원하는 개수 1 DP 또는 보수 계산을 적절한 있다는 정수 등) 나에게 더 합리적인 것 같이, 또는, (통상적으로 반올림 가장 가까운에 있도록) 1 DP하거나 $7.5845... \rightarrow 7.5$ $\rightarrow 7$ $7.5845... \rightarrow 7.6$ $\rightarrow 8$ 가장 가까운 정수로?

편집 : 정수가 아닌 df를보고하는 이론적으로 가장 건전한 방법을 아는 것 외에도 사람들이 실제로하는 일 을 아는 것도 좋습니다 . 아마도 저널과 스타일 가이드에는 자체 요구 사항이 있습니다. APA와 같은 영향력있는 스타일 가이드에 필요한 것이 궁금합니다. 내가 알 수있는 것 (매뉴얼은 온라인에서 자유롭게 구할 수 없음)에서 APA는 p- 값 (2 ~ 3 dp 일 수 있음)과 백분율 ( 가장 가까운 퍼센트)-회귀 기울기, t 통계, F 통계, $\chi^2$ 통계 등. 이것은 소수점 이하 둘째 자리가 매우 다른 중요한 수치를 차지하고 982.47과 2.47에서 매우 다른 정밀도를 제안하지만 비과학적인 표본에서 본 소수점 이하 두 자리 로 Welch df 의 수를 설명 할 수 있음을 염두에두고 상당히 비논리적입니다. .

예 : Ruxton, GD 불일치 분산 t- 검정은 학생의 t- 검정 및 Mann-Whitney U 검정 , 행동 생태학 (2006 년 7 월 / 8 월) 17 (4) : 688-690 doi : 10.1093 / beheco / 방주 016 $*$

Welch-Satterthwaite 근사 자체는 보수적 일 수도 있고 보수적이지 않을 수도 있지만 보수적이지 않은 경우 자유도를 반올림한다고해서 전체적인 보상을 보장 할 수는 없습니다. $**$

t-test degrees-of-freedom reporting

— 은어
소스

나는 실제 관행을 연구하지 않았기 때문에 이것이 해답이 아닌 의견이다. 그러나 나는 그것이 중요한 수치를보고하는 것과 관련된 판단에 근거 할 것으로 기대한다. 비교적 높은 df의 경우, 종종 첫 번째 소수점 자릿수를 변경해도 p- 값이 전혀보고되지 않은 정밀도 수준으로 변경되지 않으므로 정수로 반올림해도 좋습니다. df

매우 낮고

값이 극단 인 경우 미분

ν

$\nu$

t

$t$

이러한 경우에

는

자체보다 하나의 덜 중요한 수치로보고되어야한다는것을 제안하는

을 초과 할 수있다.

| \frac{\partial}{\partial ν} F_{ν} (t) |

$|\frac{\partial}{\partial\nu}F_\nu(t)|$

0.01

$0.01$

ν

$\nu$

p

$p$

— whuber

@whuber 특히 Glen_b의 답변과 함께 사용할 때 유용한 관찰입니다.

"매우 낮음"은 얼마나 됩니까? (내가 접한 논문의 샘플에 대한 나의 의혹은 많은 "실제 연습"이 "좋은 연습"과 같지 않을 수 있다는 것이다! 나는 지침을 따르는 로봇식이 판단만큼 많은 영향을 미친다고 생각한다. 일반적인보고 지침이 무엇인지 알 수 있습니다.

ν

$\nu$

— Silverfish

답변:

나는 실제 연습을 연구하지 않았 으므로이 답변은 질문의 그 측면을 해결할 수 없습니다. 일반적인 원칙으로서 나는 자유도 (df)를보고 할 때 유효 숫자를 처리하는 것이 유효 숫자와 관련된 판단에 기초 할 것으로 기대합니다.

원칙은 일관 되어야합니다. 다른 것과 관련하여 사용되는 정밀도에 적합한 한 수량의 정밀도를 사용하십시오. 특히, 가 작은 값 의 가장 가까운 배수 (예 : 에 값을보고 할 때 및 $x$ $y=f(x)$ $x$ $h$ 소수점 이하 6 자리에 대해),함수에 의해 매개되는의 상대 정밀도 $h=\frac{1}{2}\times 10^{-6}$ $y$ $f$ 는 다음과 같습니다.

sup_{- h \leq k \leq h} | f (x + k) - f (x) | \approx h | \frac{d}{d x} f (x) | .

$\sup_{-h \le k \le h} |f(x+k) - f(x)| \approx h | \frac{d}{dx} f(x) |.$

가 구간 에서 연속적으로 미분 가능한 경우 근사값이 적용됩니다 . $f$ $[x-h, x+h]$

본 출원에서, 은 IS -value는, 자유의 도인 $y$ $p$ $x$ $\nu$ 이고,

y = f (x) = f (ν) = F_{ν} (t)

$y = f(x) = f(\nu) = F_\nu(t)$

여기서 는 Welch-Satterthwaite 통계이고 는 자유도 가 스튜던트 분포 의 CDF입니다 . $t$ $F_\nu$ $t$ $\nu$

상대적으로 높은 안양를 들어 정수로 반올림 벌금 그래서 종종 소수점 첫째 자리에 변화가, (보고 정밀도 수준) 모두에서 p 값이 변경되지 것 ( 만 $\nu$ $h=1/2$ 매우 작습니다). 통계량의 매우 낮은 df 및 극단 값의 경우 미분 값 $h|\frac{d}{dx}f(x)|$ $t$ 초과 할되도록 경우 시사보다 적은 하나의 소수 자리로보고되어야자체. $|\frac{\partial}{\partial\nu}F_\nu(t)|$ $0.01$ $\nu$ $p$

자신에 대한 참조 가장 낮은 (합리적인) DF 및 범위에 대한 파생 상품의 크기의이 표시된 등고선 플롯으로 p- 값이 낮아질 수 있기 때문에 관심을 가질 것입니다. $|t|$

레이블은 도함수의 밑이 10 인 로그를 나타냅니다. 따라서 간의 점 및 이 플롯에서의보고 DF 변경 가능성 만에보고 된 p- 값을 바꿀 소수점 이후 장소 이상 및 장소. 예를 들어, 당신이 P 값을 반올림하는 가정 (여섯 개 소수점 장소). 통계 및 고려하십시오 . 이들은 근처에 위치하고 있습니다 $-k$ $-(k+1)$ $j^\text{th}$ $(j+k)^\text{th}$ $10^{-6}$ $\nu=2.5$ $t=8$ $-3$ $\nu$ $6+(-3)=3$

$k$ $\nu$

$4$ $30$

$\nu$ $p$ $\nu$

— 우버
소스

이것은 자유도를 반올림해야 할 원칙 (+50!)을 설정하는 데 매우 도움이되었습니다. 나중의 답변자가 실제 연습에 대한 격차를 메울 수 있기를 바랍니다.

— Silverfish

표준 t 테이블을 참조하기 전에 가장 가까운 정수로 내림하는 것이 일반적입니다.

규칙이 된 이유는 테이블에 정수가 아닌 df가 없기 때문입니다. 달리 할 이유가 없습니다.

이 조정은 보수적이므로 의미가 있습니다.

음, 통계는 실제로 t- 분포를 갖지 않습니다. 왜냐하면 그는 제곱 분모에 실제로 스케일 된 카이-제곱 분포가 없기 때문입니다. 특정 인스턴스에서 보수적이거나 그렇지 않을 수있는 근사치입니다. 특정 인스턴스에서 통계의 정확한 분포를 고려할 때 df를 반올림하는 것이 보수적 인 것은 아닙니다.

(보간 또는 실제로 df로 t- 분포의 숫자를 크 런칭하여?)

t- 분포의 p- 값 (cdf를 t- 통계량에 적용)은 다양한 매우 정확한 근사값으로 계산할 수 있으므로 보간보다는 효과적으로 계산됩니다.

소수점 이하 두 자리 이상을 인용하는 것이 적절하지 않습니다.

나는 동의한다.

사용 정확도에 대한 지침이 있습니까?

한 가지 가능성은 p- 값에 대한 Welch-Satterthwaite 근사가 분산 비율의 일반적인 영역에 얼마나 정확한지 조사하고 df에 제안 된 것보다 실질적으로 더 정확한 상대 인용을 인용하지 않는 것입니다. 분모 제곱의 카이 제곱은 어쨌든 카이 제곱이 아닌 것에 근사합니다.)

— Glen_b-복귀 모니카
소스

나는 "반올림은 보수적이다"라고 명확히했다. Welch-Satterthwaite 근사 자체는 보수적 일 수도 있고 아닐 수도 있습니다. 그러나 반올림하는 과정은 근사치로 시작하기에 보수적이지 않은 경우 반올림 한 후 최소한 나쁘지 않습니다. 반대로 반올림 (예 : "8에 가장 가까운 7.5845 라운드")은 보수적 인 조정이 아닙니다 . 나는 이것을 표현하는 더 좋은 방법을 찾는 것과 관련이 있지만 내 요점이 분명하기를 바랍니다!

— Silverfish

"하나의 가능성은 p- 값에 대한 Welch-Satterthwaite 근사값이 일반적인 분산 비율 영역에 얼마나 정확한지 조사하는 것입니다."-이것은 매우 합리적이고 원칙적인 접근 방식 인 것 같습니다. 이것은 일반적으로 수행됩니까? 구현에 대한 힌트가 좋을 것입니다. 실제로 나는 저널 스타일 가이드 라인이 종종 문제에 대한 최종 결정을 내릴 것으로 의심한다! 그러나 나는 그들이 무슨 말을하는지 모르겠다. 내 논문에서 밝혀진 논문에는 분명히 다양한 연습이 있었다.

— Silverfish

장래 독자들에게 혼란을 피하기 위해 질문 본문에서 보수적 인 반올림을 명확히하려고 노력했습니다. 태워 주셔서 감사합니다.

— 실버 피쉬

I don't think anything like it is commonly done, but I don't think that means it shouldn't be. How much of explaining why one rounds/truncates to a certain point gets into the paper would clearly depend on the journal/editor/referees.

— Glen_b -Reinstate Monica