상자 세트의 데이터가 있다고 가정하십시오. 데이터는 길이 (L), 너비 (W), 높이 (H) 및 볼륨 (V)으로 구성됩니다.
상자 / 형상에 대해 잘 모르면 모델을 사용해 볼 수 있습니다.
V = a*L + b*W + c*H + e
이 모델에는 변동될 수있는 세 가지 매개 변수 (a, b, c)와 가설이 데이터에 얼마나 잘 맞는지를 설명하는 오류 / 비용 항 (e)이 있습니다. 모수 값의 각 조합은 다른 가설로 간주됩니다. 선택된 "기본"매개 변수 값은 일반적으로 0이며, 위의 예에서 V와 L, W, H 사이의 "관계 없음"에 해당합니다.
사람들이하는 일은 e가 어떤 컷오프 값을 초과하는지 확인하여, 일반적으로 모형 적합 주위의 정규 분포 오차를 가정하여 p- 값을 계산하여이 "기본"가설을 테스트하는 것입니다. 해당 가설이 기각되면 가능성을 최대화하는 a, b, c 매개 변수의 조합을 찾고 이것이 가장 가능성이 높은 가설임을 나타냅니다. 이들이 베이지안 인 경우, 각 모수 값 세트에 대해 사전에 곱할 가능성을 곱하고 사후 확률을 최대화하는 해를 선택합니다.
분명히이 전략은 모형이 가산 성을 가정한다는 점에서 최적이 아니며 올바른 가설이 다음과 같다는 점을 놓치게됩니다.
V = L*W*H + e
편집 :
@Pinocchio
어쩌면 누군가가 가능한 한 많은 기능 중에서 하나 / 몇 가지 기능을 선택해야 할 합리적인 이유가 없거나 (가설 : "가설 클래스") 가설 검정이 최적이 아니라는 주장에 동의하지 않았을 수도 있습니다. 물론 이것은 사소한 사실이며, "최적"은 제한된 비용으로 "비용 함수와 공급 선택에 따라 최적"이라는 제한적인 의미로 사용될 수 있습니다. 그 의견은 모델 사양의 문제가 수업 노트에서 어떻게 돋보이는지를 싫어했기 때문에 내 대답으로 만들었습니다. 알고리즘이없는 대부분의 과학 종사자들이 직면 한 주요 문제입니다.
또한 역사를 이해할 때까지 p- 값, 가설 검정 등을 이해할 수 없었으므로 아마도 도움이 될 것입니다. 잦은 가설 테스트를 둘러싼 여러 가지 혼란의 원인이 있습니다 (베이지 변형의 역사에 익숙하지 않습니다).
Neyman-Pearson 의미에서 원래 "가설 테스트", Ronald Fisher가 개발 한 "의미 테스트"및 과학 전반에 걸쳐 널리 사용되는이 두 가지 전략에 대해 잘못 정의 된 적이없는 "하이브리드"라고 불렀습니다. 위의 용어 또는 "가설 가설 검정"을 사용하여 참조 할 수 있습니다. 위키 백과 페이지를 권위있는 것으로 권장하지는 않지만 여기 에서 이러한 문제에 대해 논의하는 많은 출처를 찾을 수 있습니다 . 몇 가지 주요 사항 :
"기본"가정의 사용은 원래의 가정 테스트 절차의 일부가 아니라 사용자가 고려중인 모델을 결정하기 위해 사전 지식을 사용해야합니다. 주어진 가설 세트를 비교할 특별한 이유가없는 경우 어떻게해야하는지에 대해이 모델의 지지자들이 명시 적으로 권장하는 것을 본 적이 없습니다. 이 방법은 일부 측정을 비교할 수있는 허용 오차가있는 경우 품질 관리에 적합하다고 종종 말합니다.
Fisher의 "유의성 테스트"패러다임에는 대체 가설이 없으며 귀무 가설 만 있으며, 데이터가 주어지지 않을 경우 거부 될 수 있습니다. 필자가 읽은 바에 따르면 Fisher 자신은 기본 귀무 가설 사용에 대해 모호했습니다. 나는 그가 그 문제에 대해 명시 적으로 언급하는 것을 결코 찾을 수 없었지만, 이것이 이것이 유일한 귀무 가설이어야한다고 권장하지는 않았습니다.
기본 귀무 가설을 사용하는 것은 때때로 가설 검정의 "남용"으로 해석되지만 이는 널리 알려진 하이브리드 방법의 핵심입니다. 이 관행은 종종 "무용 한 예비"라고 주장한다.
"연구원은 이론적 인 예측, 일반적으로 효과의 방향을 공식화합니다 ... 실제로 데이터가 예측 된 방향성 결과를 보여줄 때, 이것은 가설을 확인하는 것으로 보입니다. 연구원은 효과가 실제로 '밀짚 사람'귀무 가설을 검정합니다. .05 수준 (또는 일부 변형)에서 후자를 거부 할 수없는 경우 이론의 명백한 확인을 주장 할 수 없습니다 ...이 유형의 테스트에서 일반적인 오류는 실제로 얻은 유의 수준을 혼동하는 것입니다. 원래 이론에 도달 한 확인 수준으로 밀짚 사람 널을 거부하는 것 ... 확인의 강도는 실제로 밀짚 사람 널에 대해 얻은 유의 수준이 아니라 [연구자의 수치 예측의 선명도]에 달려있다. "
귀무 가설은 심리학의 논란을 테스트합니다. 데이비드 H Krantz. 미국 통계 협회 저널; 1999 년 12 월; 94, 448; 1372-1381
칸 아카데미 비디오는이 하이브리드 방식의 한 예이며, 그 인용문에 언급 된 오류를 저지르는 것은 유죄입니다. 그 비디오에서 이용할 수있는 정보로부터, 우리는 주사 된 쥐가 주사되지 않은 쥐와 다르다는 결론을 내릴 수있는 반면, 비디오는 우리가 "약물이 확실히 어떤 영향을 미쳤다"고 결론을 내릴 수 있다고 주장 할 수 있습니다. 약간의 반성으로 인해 시험 된 쥐가 주사되지 않은 쥐보다 나이가 많은 것으로 생각할 수 있습니다. 우리는 이론에 대한 증거를 주장하기 전에 그럴듯한 대안 설명을 배제해야합니다. 이론 의 예측이 덜 구체적 일수록이를 달성하기가 더 어렵다.
편집 2 :
아마도 당신의 의학적 진단에 대한 예를 들어 보면 도움이 될 것입니다. 환자가 "정상적"이거나 "고혈압 위기"에 있다고 가정하십시오.
우리는 1 %만이 고혈압 위기에 처해 있다는 사전 정보를 가지고 있습니다. 고혈압 위기의 사람들은 수축기 혈압이 평균 = 180이고 sd = 10 인 정규 분포를 따릅니다. 한편, 정상인의 평균 분포는 평균 120, sd = 10입니다. 사람이 정상일 때 평범한 사람을 판단하는 비용은 0이고, 진단을 놓치는 비용은 1이며, 치료로 인한 부작용으로 인한 비용은 위기에 관계없이 0.2입니다. 그런 다음 다음 R 코드는 임계 값 (eta)과 가능성 비율을 계산합니다. 우도 비율이 임계 값보다 크면 처리하지 않기로 결정합니다.
#Prior probabilities
P0=.99 #Prior probability patient is normal
P1=1-P0 #Prior probability patient is in crisis
#Hypotheses
H0<-dnorm(x=50:250, mean=120, sd=10) #H0: Patient is normal
H1<-dnorm(x=50:250, mean=180, sd=10) #H1: Patient in hypertensive crisis
#Costs
C00=0 #Decide normal when normal
C01=1 #Decide normal when in crisis
C10=.2 #Decide crisis when normal
C11=.2 #Decide crisis when in crisis
#Threshold
eta=P0*(C10-C00)/ P1*(C01-C11)
#Blood Pressure Measurements
y<-rnorm(3, 150, 20)
#Calculate Likelihood of Each Datapoint Given Each Hypothesis
L0vec=dnorm(x=y, mean=120, sd=10) #Vector of Likelihoods under H0
L1vec=dnorm(x=y, mean=180, sd=10) #Vector of Likelihoods under H1
#P(y|H) is the product of the likelihoods under each hypothesis
L0<-prod(L0vec)
L1<-prod(L1vec)
#L(y) is the ratio of the two likelihoods
LikRatio<-L1/L0
#Plot
plot(50:250, H0, type="l", col="Green", lwd=4,
xlab=" Systolic Blood Pressure", ylab="Probability Density Given Model",
main=paste0("L=",signif(LikRatio,3)," eta=", signif(eta,3)))
lines(50:250, H1, col="Red", lwd=4)
abline(v=y)
#Decision
if(LikRatio>eta){
print("L > eta ---> Decision: Treat Patient")
}else{
print("L < eta ---> Do Not Treat Patient")
}
위 시나리오에서 임계 값 eta = 15.84입니다. 우리가 세 번 혈압을 측정하고 139.9237, 125.2278, 190.3765를 얻는다면, 가능성 비율은 H1 : 고혈압 위기 환자입니다. 27.6이 처리하기로 선택한 임계 값보다 크기 때문에. 그래프는 정상 가설을 녹색으로, 고혈압을 빨강으로 표시합니다. 검은 색 세로줄은 관측 값을 나타냅니다.
