임의 분포에서 p- 값 계산

나는 이것이 어리석은 질문이 아니기를 바랍니다. 임의의 연속 분포가 있다고 가정 해 봅시다. 또한 통계가 있으며이 임의 분포를 사용하여이 통계에 대한 p- 값을 얻고 싶습니다.

R에서 배포가 기본 제공되는 것 중 하나에 맞는 한이 작업을 쉽게 수행 할 수 있음을 알고 있습니다. 그러나 그러한 종류의 가정을하지 않고 주어진 분포로 이것을 수행하는 쉬운 방법이 있습니까?

r distributions p-value

— 앨런 H.
소스

답변:

누적 분포 함수 가있는 경우 주어진 통계량 대한 값을 계산하는 것은 단순히 입니다. 이는 R에서 간단 합니다. 반면에 확률 밀도 함수 가있는 경우 입니다. 이 적분을 분석적으로 또는 수치 적으로 찾을 수 있습니다. R에서는 다음과 같이 보일 것입니다 : $F$ $p$ $T$ $1-F(T)$ $F(x)=\int_{-\infty}^xp(t)dt$

dF <- function(x)dnorm(x)
pF <- function(q)integrate(dF,-Inf,q)$value 

> pF(1)
[1] 0.8413448
> pnorm(1)
[1] 0.8413447

integrate더 나은 정확도를 위해 튜닝 할 수 있습니다 . 적분이 제대로 작동하지 않는 경우에는 밀도 함수의 대부분에서 작동해야하는 특정 경우에는 물론 실패 할 수 있습니다.

pF여러 매개 변수 값을 사용해보고 dF매번 다시 정의하지 않으려는 경우 물론 매개 변수를로 전달할 수 있습니다 .

dF <- function(x,mean=0,sd=1)dnorm(x,mean=mean,sd=sd)
pF <- function(q,mean=0,sd=1)integrate(dF,-Inf,q,mean=mean,sd=sd)$value 

> pF(1,1,1)
[1] 0.5
> pnorm(1,1,1)
[1] 0.5

물론 @suncoolsu에서 설명한대로 Monte-Carlo 방법을 사용할 수도 있습니다. 이는 통합을위한 또 다른 수치 방법 일뿐입니다.

— mpiktas
소스

특히 통합하려는 기능에 제한이없는 경우 귀하의 방법이 내가 제안한 것보다 훨씬 쉽다고 생각합니다. 나는 수치 기술을 모른다. R.

— suncoolsu

예, 저는 이것이 현재 능력에 더 부합한다고 생각합니다. 감사!

— Alan H.

실제로 이러한 기능이 어떻게 작동하는지 잘 모르겠습니다. 예제는 정규 분포에 대한 결과를 제공하지만 확률 밀도 함수를 어디에 연결해야합니까?

— Alan H.

(테스트를했는데 데이터가 원격으로 정상적이지 않은 것 같습니다.)

— Alan H.

@Alan H.에서 밀도 함수를에 연결하십시오 dF. 즉 dF주어진 인수에 밀도 함수 값을 반환한다.

— mpiktas

예, 임의의 분포를 사용하여 모든 통계량에 대한 p- 값을 얻을 수 있습니다. 이론적으로 그리고 실제적으로이 공식에 의해 (단면) p- 값을 계산할 수 있습니다.

피 - V ㅏ 엘 유 이자형 = 피 [티 > 티_{영형 비 에스 이자형 아르 자형 V 이자형 디} | H_{0} h 영형 엘 디 에스]

$\mathrm{p-value} = P[T > T_{observed} | H_0 \quad \mathrm{holds}]$

$T$ $T_{observed}$

$T$ $H_0$ $T$

여기에서 유일하게 가정하는 것은-당신 은 T 의 null 분포 를 알고 있습니다 (표준 R 난수 생성기 형식이 아닐 수도 있음). null 분포를 아는 한 p- 값을 계산할 수 있습니다.

— 선 쿨수
소스

나는 주목해야한다-이것이 p- 값이 너무 인기 있고 오해되기 쉬운 이유 중 하나이다. (IMHO)

— suncoolsu

좋습니다. 나는 널 분포에 대한 좋은 평가라고 생각합니다. R에서 이것을 구현하는 방법에 대한 힌트가 있습니까? 감사!

— Alan H.

@Alan-Null 분포에서 임의의 값을 생성하는 방법을 알고 있습니까? 만약 그렇다면,-T = c (T1, ..., TN)은 널 분포에서 도출된다고 가정합니다. p- 값 = sum (T> T_obs) / N. 생성 방법을 모르는 경우 T1 ... TN을 얻기 위해 Metropolis Sampling 또는 Gibbs Sampling을 사용해야 할 수도 있지만 매우 가능합니다.

— suncoolsu