왜 '무작위'신뢰 또는 신뢰할만한 간격을 사용합니까?


16

나는 최근에 자신감과 믿을만한 간격으로 무작위성을 포함하는 논문을 읽고 있었고 이것이 표준인지 (그리고 그렇다면 합당한 일인지) 궁금했습니다. 표기법을 설정하려면 데이터가 xX 이고 매개 변수 구간을 만드는 데 관심 이 있다고 가정하십시오 θΘ. 함수를 작성하여 구성되는 신뢰 / 신뢰성 간격에 익숙합니다.

fx:Θ{0,1}

구간을 I={θΘ:fx(θ)=1} 입니다.

이것은 데이터에 의존한다는 점에서 무작위이지만 데이터에 따라 조건은 간격 일뿐입니다. 이 논문은 대신에

gx:Θ[0,1]

또한 IID 균일 확률 변수의 집합 {Uθ}θΘ[0,1] . 연관된 간격을 I = { θ Θ로 정의합니다.I={θΘ:fx(θ)Uθ} . 이것은 데이터에서 오는 것 이상으로 보조 무작위성에 크게 의존한다는 점에 유의하십시오.

왜 이런 일을하는지 궁금합니다. 나는 와 같은 함수에서 g x 와 같은 함수 까지의 간격 개념을 '휴식'하는 것이 의미가 있다고 생각합니다 . 가중 신뢰 구간의 일종입니다. 나는 그것에 대한 어떤 언급도 알지 못하고 (포인터를 높이 평가할 것입니다), 꽤 자연스러운 것 같습니다. 그러나 보조 임의성을 추가 해야하는 이유는 생각할 수 없습니다.fxgx

이를 수행하는 문헌 / 이유에 대한 모든 의견을 부탁드립니다!


5
(+1)이를 무작위 절차 라고 합니다. 그것들은 통계적 추정 및 테스트 프레임 워크의 표준 부분이므로 설명을 제공하기 위해 거의 모든 엄격한 교과서에 의존 할 수 있습니다. 그들의 사용에 대한 추가 동기는 게임 이론 문헌에서 찾을 수 있습니다.
whuber

답변 주셔서 감사합니다. 나는이 의견을 읽은 후에 예를 들어 부트 스트래핑 이이 프레임 워크에 적합하다는 것을 알았지 만 그 상황에서는 무작위 화의 이유가 분명합니다 (f에 액세스 할 수는 없지만 g). 필자의 경우 저자는 명시 적으로 계산 하고 THEN은 g x를 봅니다. 통계 교과서가 많이 있지만 이것을 어디에도 보이지 않습니다 ... 제안 된 텍스트가 있습니까? fxgx
QQQ

3
실제로 부트 스트랩은 무작위 절차 가 아닙니다 . 그것은 인 확정 그 절차 근사 계산 랜덤 샘플링에 의해 수행된다.
whuber

답변:


4

무작위 화 된 절차는 이론 을 단순화하기 때문에 이론에서 종종 사용됩니다 . 일반적인 통계 문제에서는 실제로는 의미가 없지만 게임 이론 설정에서는 의미가 있습니다.

실제로 그것을 사용하는 것을 볼 수있는 유일한 이유는 계산을 단순화하는 것입니다.

이론적으로는 충분 성 원칙 에서 사용해서는 안된다고 주장 할 수있다 . 통계적 결론은 데이터의 충분한 요약에 기초해야하며, 무작위 화는 데이터 의 충분한 요약의 일부가 아닌 이질적인 임의 의존성을 유발한다.U

UPDATE  

아래에 인용 된 whuber의 의견에 답하기 위해 다음과 같이 인용했습니다. "무작위 절차는 왜 실제로 이해가되지 않습니까?" "따라서 데이터 분석에 무작위 화를 사용하는 것과 다른 점 (비현실적이거나 불쾌한 점)은 무엇입니까?"

음, 데이터를 얻기위한 실험의 무작위 화는 주로 인과 관계를 끊기위한 목적으로 수행됩니다. 그것이 언제 효과적인지 또 다른 토론입니다. 분석의 일부로 무작위 추출을 사용하는 목적은 무엇입니까? 내가 본 유일한 이유는 그것이 수학 이론을 더 완벽하게 만든다는 것입니다! 그래도 괜찮습니다. 게임 이론적 맥락에서, 실제 적이있을 때, 무작위 화는 그를 혼란스럽게한다. 실제 의사 결정 상황 (판매 또는 판매하지 않습니까?)에서 결정을 내려야하며, 데이터에 증거가 없으면 동전을 던질 수 있습니다. 그러나 과학적 맥락에서 질문은 우리가 배울있는 것입니다데이터에서 무작위 배정이 잘못된 것 같습니다. 나는 그것으로부터 진정한 이점을 볼 수 없습니다! 동의하지 않으면 생물학 자나 화학자를 설득 할 수있는 논쟁이 있습니까? (여기서는 부트 스트랩이나 MCMC의 일부로 시뮬레이션을 생각하지 않습니다.)


1
무작위 절차가 "실제로 이해가되지 않는"이유는 무엇입니까? 다른 사람들이 지적했듯이, 실험자들은 무작위 배정 처리 및 제어와 같은 실험 데이터 구성 에 무작위 배정을 완벽하게 기꺼이 사용 하므로 데이터 분석 에 무작위 배정을 사용하는 것과 다른 점 (비실용적이거나 불쾌한) ?
whuber

1
@kjetil 나는 당신이 충분 성 원리에 대한 당신의 진술을 완성하지 않았을 것이라고 생각합니다. 그것은 문장 중간에서 잘린 것 같습니다 ( "통계적인 결론은 ...").
Silverfish

1
(+1) 그러나 나는 충분 성 원칙을 불러 일으키는 질문을하고 있다고 생각합니다. 충분한 통계량의 관측 된 값을 알고 나면 데이터의 다른 측면을 고려 하는 것은 불필요한 랜덤을 도입하는 것과 같습니다. U . 따라서이를 제안하는 사람은 충분 성 원칙에 대한 그림을 제공하지 않습니다. 또한 Basu (1978), "통계 실험에서의 무작위 화", FSU 통계 보고서 M466 에서 본격적으로 제안 된 몇 가지 무작위 절차를 참조하십시오.
Scortchi-Monica Monica 복원

1
@ whuber : 데이터를 얻는 데있어 무작위 화가 유리할 수 있다는 분명하고 원칙적인 주장입니다. 인과 사슬을 끊습니다. 분석의 일부로 무작위 추출을 사용한다는 원칙적인 주장은 무엇입니까?
kjetil b halvorsen 10

1
Kjetil : 원하는 기능이 아닌 위험 기능 (공칭 크기 및 전력의 형태)을 수용하는 대신 의도 한 위험 기능을 달성 할 수 있습니다. 더욱이, 절차가 "이론적으로"유용하다면, 실행 불가능 성 (보통 무작위 화 된 절차의 경우는 아님) 이외의 실제 사용에 반대 할 수는 없다. 따라서 무작위 질문을 사용하는 데 문제가 있음을 입증 해야 할 책임이 있습니다 . 자신을 모순하지 않고 어떻게 그렇게합니까?
whuber

3

이 아이디어는 테스트를 의미하지만 테스트 및 신뢰 구간의 이중성을 고려할 때 CI에도 동일한 논리가 적용됩니다.

기본적으로 무작위 테스트는 이산 값 실험에서도 주어진 크기의 테스트를 얻을 수 있는지 확인합니다.

α=0.05pH0:p=0.5H1:p<0.5n=10

H0k=2ppbinom(2,10,.5)k=1H0

k=2


이것은 무작위 사용에 대한 좋은 설명이지만, 왜 우리가 임의의 달성에 관심이 있는지 설명하면 좋을 것입니다 α처음에. 왜 바람직한 목표입니까?
Silverfish

글쎄, 나는 RA Fisher가 어느 정도의 초기 증거가 추가 연구를 필요로하는지 결정하기 위해 5 %의 유의 수준으로 자발적으로 결정하기로 결정했을 때 통계의 역사로 되돌아 간다고 생각합니다. 우리가 알다시피, 5 %는 훌륭한 의사 결정 이론적 기초가 부족하더라도 많은 분야에서 일종의 금 표준으로 변모했습니다.
Christoph Hanck
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.