계산 통계에서 난수 생성기 (RNG)가 어떻게 그리고 왜 중요합니까?
나는 어느 가설에 대한 편견을 피하기 위해 많은 통계 테스트를 위해 샘플을 선택할 때 무작위성이 중요하다는 것을 이해하지만 난수 생성기가 중요한 다른 계산 통계 영역이 있습니까?
계산 통계에서 난수 생성기 (RNG)가 어떻게 그리고 왜 중요합니까?
나는 어느 가설에 대한 편견을 피하기 위해 많은 통계 테스트를 위해 샘플을 선택할 때 무작위성이 중요하다는 것을 이해하지만 난수 생성기가 중요한 다른 계산 통계 영역이 있습니까?
답변:
많은 예가 있습니다. 목록에 너무 많은 방법이 있고, 누군가가 완전히 알기에는 너무 많은 방법 일 것입니다.
언급 한 바와 같이, 통제 된 실험 에서 피험자를 치료군과 대조군으로 무작위로 분할함으로써 표본 추출 편향을 피합니다.
부트 스트랩 에서는 고정 샘플에서 대체로 무작위로 샘플링하여 모집단의 반복 샘플링을 근사화합니다. 이를 통해 무엇보다도 추정치의 분산을 추정 할 수 있습니다.
에서 교차 검증 우리는 무작위로 조각으로 우리의 데이터를 분할하고 임의 훈련을 조립 세트를 테스트하여 추정의 샘플 부족 오류를 예상하고있다.
순열 검정 에서는 귀무 가설 하에서 샘플링하기 위해 임의 순열을 사용하여 다양한 상황에서 비모수 적 가설 검정을 수행 할 수 있습니다.
배깅 에서는 훈련 데이터의 부트 스트랩 샘플에 대해 반복적으로 추정을 수행 한 다음 결과를 평균화하여 추정의 분산을 제어합니다.
랜덤 포레스트 에서는 모든 결정 지점에서 사용 가능한 예측 변수로부터 랜덤으로 샘플링하여 추정의 분산을 추가로 제어합니다.
에서 시뮬레이션을 무작위로 우리가 모델에서 유효성 검사 적합성 및 가정을 돕고, 훈련이나 테스트 데이터를 비교할 수있는 새로운 데이터 세트를 생성하기 위해 우리는 적합한 모델을 부탁드립니다.
Markov 체인 Monte Carlo 에서는 Markov 체인을 사용하여 가능한 결과의 공간을 탐색하여 분포에서 표본을 추출합니다 (이 예제의 @Ben Bolker 덕분에).
그것들은 즉시 떠오르는 일반적인 일상 응용 프로그램입니다. 깊이 파고 들었다면 아마도 그 목록의 길이를 두 배로 늘릴 수있을 것입니다. 무작위성은 연구의 중요한 대상이자 휘두르는 중요한 도구입니다.
이것은 모두 사실이지만 주된 문제를 해결 하지 못합니다. 시퀀스에 결과 구조 또는 예측 가능성이 있는 PRNG 는 시뮬레이션에 실패합니다. Carl Witthoft 1 월 31 일 15:51
이것이 귀하의 관심사 인 경우 질문 제목을 "Monte Carlo 결과에 대한 RNG 선택의 영향"또는 이와 유사한 것으로 변경해야합니다. 이 경우 이미 SE cross validation 에서 고려한 몇 가지 지침이 있습니다.