베이지안 가설 검정은 추론 및 결정 이론의 틀에서 무엇을 의미합니까?


15

저의 배경은 주로 기계 학습에 있으며 Bayesian Hypothesis 테스트의 의미를 배우려고했습니다. 나는 확률에 대한 베이지안 해석에 문제가 없으며 확률 적 그래픽 모델의 맥락에서 그것을 잘 알고 있습니다. 그러나 나를 혼동하는 것은 통계적 추론의 맥락에서 "가설"이라는 단어의 의미입니다.

나는 기계 학습에서 일반적으로 사용되는 어휘와 통계 및 추론에서 일반적으로 사용되는 어휘에 대해 혼란스러워하고 있다고 생각합니다.

지도 학습 의 맥락에서 , 나는 일반적으로 가설을 레이블에 매핑하는 예측 함수 (예 : 합니다. 그러나 내가하고있는 독서에서 가설이라는 용어는 같은 의미가없는 것 같습니다. 내가 읽고있는 판독 값의 추출을 붙여 드리겠습니다.h:XY

여기에 이미지 설명을 입력하십시오

주의 깊게 읽으면 다음과 같이 말합니다.

관측 된 데이터에 대해 다른 모델이 있습니다 ...

그들은 단어 모델을 사용 했습니까? 나를 위해 단어 모델은 특정 예측 함수를 선택했다는 함수 집합을 생각하게 해줍니다. 즉 가설 함수 클래스. 예를 들어, 는 2 차 함수의 가설 클래스 일 수 있습니다 (2 차 다항식). 그러나 그들은이 추출에서 동의어로 단어 모델과 가설을 사용하는 것으로 보입니다 (나를 위해 그들은 완전히 다른 단어입니다).Hd2

그런 다음 우리는 가설보다 우선 순위를 둘 수 있다고 언급합니다 (베이지 환경에서해야 할 일).

pH(Hm),     m={0,1,...,M1}

또한 현재 가설을 사용하여 데이터를 특성화 할 수 있습니다.

py|H(|Hm),     m={0,1,...,M1}

일부 데이터 (및 Baye의 규칙)가 주어진 현재의 생각을 업데이트하십시오.

pH|y(Hm|y),     m={0,1,...,M1}

그러나 나는 전체 가설 클래스가 아닌 가설 클래스 의 특정 매개 변수 (예 : )에 베이지안 추정치를 넣는 데 더 익숙하다고 생각 합니다. 기본적으로 이러한 "가설"은 내가 익숙한 기계 학습 컨텍스트와 동일한 가설이 아닌 것 같으므로이 가설은 가설 클래스보다 특정 매개 변수 와 더 유사합니다 .θθ

이 시점에서 나는 "가설"이 예측 함수와 같은 것을 의미한다고 확신 했지만 (예를 들어 매개 변수 의해 매개 변수화 됨 ), 나는 내가 틀렸다고 생각합니다 ...θ

나의 혼란을 더욱 악화시키기 위해, 나중에이 같은 독서는 그들이 관찰 한 각 훈련 예제에 특정한 "가설"을 지정하기 위해 나아 갔다. 내가 의미하는 것의 추출물을 붙여 보겠습니다.

여기에 이미지 설명을 입력하십시오

이것이 나를 혼란스럽게하는 이유는 가설을 매개 변수로 해석하면 각 샘플 값에 대해 특정 매개 변수를 지정하는 것이 의미가 없기 때문입니다. 이 시점에서 나는 그들이 가설이 무엇을 의미하는지 몰랐기 때문에이 질문을 게시했습니다.

그러나 나는 완전히 포기하지 않았고, 잦은 통계에서 가설이 무엇을 의미하는지 연구 하고 다음 칸 아카데미 비디오를 발견했습니다 . 그 비디오는 실제로 나에게 많은 이해 어쩌면 당신은 빈도주의입니다 (! :) . 그러나 데이터 집합 (예 : "샘플 집합")이 많고 샘플 집합의 속성에 따라 데이터에 대한 귀무 가설을 수락할지 거부할지 결정합니다. 그러나 내가 읽고 있는 베이지안 맥락 에서 관찰 된 각 데이터 [포인트] 벡터 에 대해 "우도 비율 테스트"에 대한 가설로 "라벨 표시" 하는 것으로 보입니다 .

여기에 이미지 설명을 입력하십시오

그들이 각 데이터 샘플에 가설을 할당하는 방식은 심지어 우리가 각 학습 세트에 레이블을 부착하는 경우 감독 학습 설정처럼 보입니다. 그러나 나는 이것이 그들이이 맥락에서하고있는 것이라고 생각하지 않습니다. 그들은 무엇을하고 있습니까? 각 데이터 샘플에 가설을 할당한다는 것은 무엇을 의미합니까? 가설의 의미는 무엇입니까? 단어 모델은 무엇을 의미합니까?

기본적으로, 나의 혼란에 대한이 긴 설명 후에 누군가가이 맥락에서 베이지안 가설 검정이 무엇을 의미하는지 알고 있습니까?


내 질문을 개선하기 위해 설명이 필요하거나 질문이 이해가 되려면 기꺼이 도와 드리겠습니다. :)


답을 찾아 보면서 통계적 가설 검정과 관련된 유용한 것들을 발견했습니다.

CS와 같은 배경에서 온 경우이 주제에 대한 좋은 소개를 제공합니다.

컴퓨터 과학자를위한 통계적 가설 검정에 대한 좋은 소개는 무엇입니까?

어느 시점에서 나는 "기본 매개 변수"에 대해 물었습니다 (내가 의미하는 것을 정의해야합니다. 나는 그것이 표준 용어라고 생각했지만 그렇지 않습니다. 여기에서 다루겠습니다) 각 가설에 대한 모수를 지정하십시오. 예를 들어 귀무 가설이 무엇인지와 매개 변수를 어떻게 결정합니까? 그와 관련된 질문이 있습니다.

가설 검정에서 귀무 가설을 지정하는 방법


@ Xi'an 다음 위키 백과 기사를 읽었습니다. en.wikipedia.org/wiki/Statistical_model 은 모델과 가설이 무엇을 의미합니까? 인내심 btw에 대한 thnx :)
피노키오

3
저는 여러분의 문제가 실제로 베이지안 틀에서 가설 검정이 무엇인지에 대한 것이 아니라 가설 검정이 원칙적으로 무엇을 의미하는지 이해하는 것이 문제라고 생각하기 때문에 주저하고 있습니다. 이를 돕기 위해 Geisser의 "파라 메트릭 통계적 추론 모드"책을 살펴 보는 것이 좋습니다. books.google.ca/…
rocinante

@rocinante 나는 당신과 동의한다고 생각합니다. 나는 일반적으로 가설 테스트에 대해 확실히 혼란스러워합니다 (베이지 프레임 워크는 전혀 도움이되지 않습니다). 나는 그것을 분명히 살펴볼 것입니다. 양해 해 주셔서 감사합니다. 대단히 감사합니다.
Pinocchio

간결하게 표현하기가 쉽지 않기 때문에 이해하기 쉽지 않습니다. 이것을지도와 같은 추상적 인 용어로 생각하기보다는 더 간단한
예제로

1
2/2 동전이 있고 그것이 공평한 지 알고 싶을 때, 그것을 50 번 뒤집습니다. 이제 추론하려는 데이터 세트가 있습니다 (즉, 코인 편향 여부). 논리적으로 동전이 공정하면 던지기의 절반 정도가 머리가되어야합니다. (이것은 통계 도출이 아니라 자신의 논리적 추론입니다). 그것이 당신의 가설입니다. 이 가설은 베이지안 방식과 빈번한 방식의 두 가지 방법으로 테스트 할 수 있습니다.
rocinante

답변:


10

통계 모델은 확률 분포를 가정하여 설명한다. 모형이 파라 메트릭 인 경우이 패밀리는 알 수없는 매개 변수로 색인화됩니다. : F = { f ( | θ ) ; θ Θ } H 0 과 같이 θ에 대한 가설을 검정하려는 경우 :θ

에프={에프(|θ); θΘ}
θ , 두 모델이 반대되는 것을 고려할 수있다 : F F 0 = { f ( | θ ) ; θ Θ 0 } 에서내 베이지안 관점에서, 나는 데이터 뒤에 모델의 인덱스에 대한 추론을 그리기하고 M . 따라서 나는이 지수 ρ 0 ρ a 와두 모델의 파라미터, Θ 0 π에 대한 π 0 ( θ ) 에 우선 순위 두었다H0:θΘ0에프
에프0={에프(|θ); θΘ0}
미디엄ρ0ρπ0(θ)Θ0Θ 이상 a ( θ ) . 그런 다음이 지수의 사후 분포를 추론합니다. π ( m = 0 | x ) = ρ 0 Θ 0 f ( x | θ ) π 0 ( θ ) d θπa(θ)Θ 연결문서가 훨씬 자세한 내용으로 들어갑니다 전체 베이지안 서적을 감당할 수 없다면 가설의 통계적 테스트에 선택해야합니다. 또는 기계 학습 서적
π(m=0|x)=ρ0Θ0f(x|θ)π0(θ)dθρ0Θ0f(x|θ)π0(θ)dθ+(1ρ0)Θf(x|θ)πa(θ)dθ
케빈 머피 등 의.

예를 들어, 환경에서 가설을 시험하는 경우, 관찰된다 H 0 : θ = 0 , 사후 확률 θ = 0 모델 데이터가 생성하는 사후 확률이고 N ( 0 , 1 ) . 위의 공식에 따르면, θ 에 대한 사전 분포 가 θ N ( 0 , 10 ) 이고 두 가설, 즉 ρ 에 동일한 가중치를 적용하면엑스(θ,1)H0:θ=0θ=0(0,1)θθ(0,10) 이 사후 확률이 π ( m = 0 | X )ρ0=1/2

π(m=0|x)=12πexp{x2/2}12πexp{x2/2}+R12πexp{(xθ)2/2}12π×10exp{θ2/20}dθ=exp{x2/2}exp{x2/2}+111exp{x2/22}

H(H0)에프0θ에프0와이|H(와이|H0)H0H0

H미디엄θ에프미디엄H미디엄=(θ,에프미디엄)θ에프미디엄

ϱ0H0에프0ϱ0=0π0(θ)θH0

가설이 제안 된 통계 모델과 기본 모수의 튜플 인 경우 기본 모수는 어떻게 선택됩니까?
피노키오

θ=0

4

훌륭한 질문입니다. 나는 당신의 혼란이 "자주 주의자"와 "바이아 식인"관점 사이의 기본적인 차이점들 때문에 생길 수 있다고 생각합니다. 나는 전자에 대해 많은 경험을 가지고 있으며 나중에 새로운 것이기 때문에 몇 가지 간단한 관찰을 시도해도 나에게 도움이 될 수 있습니다. 적어도 이해하면서 몇 가지 차이점을 분명히하기 위해 귀하의 질문을 편집했습니다. 나는 당신이 상관하지 않기를 바랍니다! 내가 잘못한 경우 질문을 다시 편집하거나이 응답에 대한 의견을 추가 할 수 있습니다.

1) 다소 초등하게 들릴 위험이 있습니다. 모델은 "아침 아침 팬케이크를 먹었다면 화요일이어야합니다."와 같은 현실에 대한 설명을 시도하는 진술입니다. 따라서 모델은 가설입니다. George Box의 유명한 인용문 : "모든 모델이 잘못되었으며 일부 모델이 유용합니다." 모델이 유용하려면 테스트 할 방법이 있어야합니다. 경쟁 가설의 개념과 질문 중 하나에 대한 답을 입력하십시오. "... 통계적 추론의 맥락에서"가설은 유용하고 수학적으로 테스트 할 수있는 모델이라고 제안합니다. 따라서 가설 검정은 모형이 유용하지 않은지 여부를 결정하는 수단입니다. 요약하면, 가설은 고려중인 모델입니다. 동일한 기능 또는 다른 기능의 다른 매개 변수 값일 수 있습니다.

2) 칸 (Kahn) 비디오는 베이지안 (Bayesian)이 가설 검정에 대한 "자주 주의적 (Frequentist)"접근법이라고 부르는 것의 예이므로 베이지안 인 강의 노트에 적용하려고 할 때 혼란 스러울 수 있습니다. 나는 두 가지 접근법의 적용 (위험 할 수 있음) 사이에 간단한 차이점을 생각해 내려고 노력했다. 나는 철학적 차이를 합리적으로 잘 이해한다고 생각합니다. 내가 본 것에서 "Frequentist"는 데이터에 임의의 구성 요소를 가정하고 관찰 된 데이터에 비 랜덤 매개 변수가 제공 될 가능성을 테스트합니다. "Bayesian"은 데이터가 고정 된 것으로 가정하고 가장 가능성이 높은 임의의 매개 변수 값을 결정합니다. 이 차이는 다른 테스트 방법으로 이어집니다.

"Frequentist"가설 검정에서 유용 할 수있는 모델은 일부 효과를 설명하므로 효과가없는 모델 인 "널 가설"과 비교됩니다. 효과가없는 모델과 상호 배타적 인 유용한 모델을 설정하려고합니다. 그런 다음 테스트는 효과가 없다고 가정하여 데이터를 관찰 할 가능성이 있습니다. 해당 확률이 낮 으면 귀무 가설이 기각되고 대안이 남습니다. (순수 주의자는 귀무 가설을 "수락하지"않을뿐 아니라 "거부하지 않는 것"만하지는 않는다는 점에 유의하십시오. 천사들이 핀 머리에서 춤추는 것처럼 들릴 수 있지만 구별은 근본적인 철학적 인 것입니다. 가장 간단한 예 : "두 그룹이 다릅니다."그것들이 다르지 않다는 것을 감안할 때 무작위 실험에 의해 측정 된 것 이상 으로. 이것은 일반적으로 귀무 가설이 평균의 차이가 0이라는 t- 검정입니다. 따라서 매개 변수는 고정 값 0의 평균입니다.

Bayesian은 "1 분 동안 측정을했는데 측정 값 다르므로 얼마나 될까요?"라고 말합니다. 그들은 (현재) 랜덤 모수의 모든 값에 대한 확률을 계산하고 가장 높은 값을 선택합니다. 어떤 의미에서 매개 변수의 모든 가능한 값은 별도의 모델입니다. 그러나 이제는 확률이 가장 높은 모형이 중요 할만큼 다른지 여부를 결정하는 방법이 필요합니다. 이것이 강의 노트에 비용 함수가 도입 된 이유입니다. 올바른 결정을하려면 잘못된 결정을 내린 결과에 대한 일부 가정이 필요합니다.

3) "각 데이터 샘플에 가설을 할당한다는 것은 무엇을 의미합니까?" 나는 그들이 생각하지 않습니다. "샘플 포인트"의 의미에주의하십시오. 나는 그들이 특정 샘플 벡터를 참조하고 있다고 생각하며 각 가설이 샘플 공간의 모든 샘플 벡터에 대해 얼마나 가능성이 있는지 알고 싶습니다. 식 (14)와 (15)는 특정 샘플 벡터에 대한 두 가설을 비교하는 방법을 보여줍니다. 그래서 그들은 단지 두 가지만을 비교하는 방법을 보여줌으로써 여러 가설을 비교하는 일반적인 주장을 단순화하고 있습니다.


0

상자 세트의 데이터가 있다고 가정하십시오. 데이터는 길이 (L), 너비 (W), 높이 (H) 및 볼륨 (V)으로 구성됩니다.

상자 / 형상에 대해 잘 모르면 모델을 사용해 볼 수 있습니다.

V = a*L + b*W + c*H + e

이 모델에는 변동될 수있는 세 가지 매개 변수 (a, b, c)와 가설이 데이터에 얼마나 잘 맞는지를 설명하는 오류 / 비용 항 (e)이 있습니다. 모수 값의 각 조합은 다른 가설로 간주됩니다. 선택된 "기본"매개 변수 값은 일반적으로 0이며, 위의 예에서 V와 L, W, H 사이의 "관계 없음"에 해당합니다.

사람들이하는 일은 e가 어떤 컷오프 값을 초과하는지 확인하여, 일반적으로 모형 적합 주위의 정규 분포 오차를 가정하여 p- 값을 계산하여이 "기본"가설을 테스트하는 것입니다. 해당 가설이 기각되면 가능성을 최대화하는 a, b, c 매개 변수의 조합을 찾고 이것이 가장 가능성이 높은 가설임을 나타냅니다. 이들이 베이지안 인 경우, 각 모수 값 세트에 대해 사전에 곱할 가능성을 곱하고 사후 확률을 최대화하는 해를 선택합니다.

분명히이 전략은 모형이 가산 성을 가정한다는 점에서 최적이 아니며 올바른 가설이 다음과 같다는 점을 놓치게됩니다.

V = L*W*H + e

편집 : @Pinocchio

어쩌면 누군가가 가능한 한 많은 기능 중에서 하나 / 몇 가지 기능을 선택해야 할 합리적인 이유가 없거나 (가설 : "가설 클래스") 가설 검정이 최적이 아니라는 주장에 동의하지 않았을 수도 있습니다. 물론 이것은 사소한 사실이며, "최적"은 제한된 비용으로 "비용 함수와 공급 선택에 따라 최적"이라는 제한적인 의미로 사용될 수 있습니다. 그 의견은 모델 사양의 문제가 수업 노트에서 어떻게 돋보이는지를 싫어했기 때문에 내 대답으로 만들었습니다. 알고리즘이없는 대부분의 과학 종사자들이 직면 한 주요 문제입니다.

또한 역사를 이해할 때까지 p- 값, 가설 검정 등을 이해할 수 없었으므로 아마도 도움이 될 것입니다. 잦은 가설 테스트를 둘러싼 여러 가지 혼란의 원인이 있습니다 (베이지 변형의 역사에 익숙하지 않습니다).

Neyman-Pearson 의미에서 원래 "가설 테스트", Ronald Fisher가 개발 한 "의미 테스트"및 과학 전반에 걸쳐 널리 사용되는이 두 가지 전략에 대해 잘못 정의 된 적이없는 "하이브리드"라고 불렀습니다. 위의 용어 또는 "가설 가설 검정"을 사용하여 참조 할 수 있습니다. 위키 백과 페이지를 권위있는 것으로 권장하지는 않지만 여기 에서 이러한 문제에 대해 논의하는 많은 출처를 찾을 수 있습니다 . 몇 가지 주요 사항 :

  1. "기본"가정의 사용은 원래의 가정 테스트 절차의 일부가 아니라 사용자가 고려중인 모델을 결정하기 위해 사전 지식을 사용해야합니다. 주어진 가설 세트를 비교할 특별한 이유가없는 경우 어떻게해야하는지에 대해이 모델의 지지자들이 명시 적으로 권장하는 것을 본 적이 없습니다. 이 방법은 일부 측정을 비교할 수있는 허용 오차가있는 경우 품질 관리에 적합하다고 종종 말합니다.

  2. Fisher의 "유의성 테스트"패러다임에는 대체 가설이 없으며 귀무 가설 만 있으며, 데이터가 주어지지 않을 경우 거부 될 수 있습니다. 필자가 읽은 바에 따르면 Fisher 자신은 기본 귀무 가설 사용에 대해 모호했습니다. 나는 그가 그 문제에 대해 명시 적으로 언급하는 것을 결코 찾을 수 없었지만, 이것이 이것이 유일한 귀무 가설이어야한다고 권장하지는 않았습니다.

  3. 기본 귀무 가설을 사용하는 것은 때때로 가설 검정의 "남용"으로 해석되지만 이는 널리 알려진 하이브리드 방법의 핵심입니다. 이 관행은 종종 "무용 한 예비"라고 주장한다.

    "연구원은 이론적 인 예측, 일반적으로 효과의 방향을 공식화합니다 ... 실제로 데이터가 예측 된 방향성 결과를 보여줄 때, 이것은 가설을 확인하는 것으로 보입니다. 연구원은 효과가 실제로 '밀짚 사람'귀무 가설을 검정합니다. .05 수준 (또는 일부 변형)에서 후자를 거부 할 수없는 경우 이론의 명백한 확인을 주장 할 수 없습니다 ...이 유형의 테스트에서 일반적인 오류는 실제로 얻은 유의 수준을 혼동하는 것입니다. 원래 이론에 도달 한 확인 수준으로 밀짚 사람 널을 거부하는 것 ... 확인의 강도는 실제로 밀짚 사람 널에 대해 얻은 유의 수준이 아니라 [연구자의 수치 예측의 선명도]에 달려있다. "

    귀무 가설은 심리학의 논란을 테스트합니다. 데이비드 H Krantz. 미국 통계 협회 저널; 1999 년 12 월; 94, 448; 1372-1381

칸 아카데미 비디오는이 하이브리드 방식의 한 예이며, 그 인용문에 언급 된 오류를 저지르는 것은 유죄입니다. 그 비디오에서 이용할 수있는 정보로부터, 우리는 주사 된 쥐가 주사되지 않은 쥐와 다르다는 결론을 내릴 수있는 반면, 비디오는 우리가 "약물이 확실히 어떤 영향을 미쳤다"고 결론을 내릴 수 있다고 주장 할 수 있습니다. 약간의 반성으로 인해 시험 된 쥐가 주사되지 않은 쥐보다 나이가 많은 것으로 생각할 수 있습니다. 우리는 이론에 대한 증거를 주장하기 전에 그럴듯한 대안 설명을 배제해야합니다. 이론 의 예측이 덜 구체적 일수록이를 달성하기가 더 어렵다.

편집 2 :

아마도 당신의 의학적 진단에 대한 예를 들어 보면 도움이 될 것입니다. 환자가 "정상적"이거나 "고혈압 위기"에 있다고 가정하십시오.

우리는 1 %만이 고혈압 위기에 처해 있다는 사전 정보를 가지고 있습니다. 고혈압 위기의 사람들은 수축기 혈압이 평균 = 180이고 sd = 10 인 정규 분포를 따릅니다. 한편, 정상인의 평균 분포는 평균 120, sd = 10입니다. 사람이 정상일 때 평범한 사람을 판단하는 비용은 0이고, 진단을 놓치는 비용은 1이며, 치료로 인한 부작용으로 인한 비용은 위기에 관계없이 0.2입니다. 그런 다음 다음 R 코드는 임계 값 (eta)과 가능성 비율을 계산합니다. 우도 비율이 임계 값보다 크면 처리하지 않기로 결정합니다.

#Prior probabilities
P0=.99 #Prior probability patient is normal
P1=1-P0 #Prior probability patient is in crisis

#Hypotheses
H0<-dnorm(x=50:250, mean=120, sd=10) #H0: Patient is normal
H1<-dnorm(x=50:250, mean=180, sd=10) #H1: Patient in hypertensive crisis

#Costs
C00=0 #Decide normal when normal
C01=1 #Decide normal when in crisis
C10=.2 #Decide crisis when normal
C11=.2 #Decide crisis when in crisis

#Threshold
eta=P0*(C10-C00)/ P1*(C01-C11)

#Blood Pressure Measurements
y<-rnorm(3, 150, 20)

#Calculate Likelihood of Each Datapoint Given Each Hypothesis
L0vec=dnorm(x=y, mean=120, sd=10) #Vector of Likelihoods under H0
L1vec=dnorm(x=y, mean=180, sd=10) #Vector of Likelihoods under H1

#P(y|H) is the product of the likelihoods under each hypothesis
L0<-prod(L0vec)
L1<-prod(L1vec)

#L(y) is the ratio of the two likelihoods
LikRatio<-L1/L0


#Plot
plot(50:250, H0, type="l", col="Green", lwd=4, 
     xlab=" Systolic Blood Pressure", ylab="Probability Density Given Model",
     main=paste0("L=",signif(LikRatio,3)," eta=", signif(eta,3)))
lines(50:250, H1, col="Red", lwd=4)
abline(v=y)

#Decision
if(LikRatio>eta){
  print("L > eta  ---> Decision: Treat Patient")
}else{
  print("L < eta  ---> Do Not Treat Patient")
}

위 시나리오에서 임계 값 eta = 15.84입니다. 우리가 세 번 혈압을 측정하고 139.9237, 125.2278, 190.3765를 얻는다면, 가능성 비율은 H1 : 고혈압 위기 환자입니다. 27.6이 처리하기로 선택한 임계 값보다 크기 때문에. 그래프는 정상 가설을 녹색으로, 고혈압을 빨강으로 표시합니다. 검은 색 세로줄은 관측 값을 나타냅니다.

여기에 이미지 설명을 입력하십시오


아래로 투표 한 사람이 설명 할 수 있습니까? 이 답변에 어떤 문제가 있습니까? : S
피노키오

@Pinocchio 나는 대답에서 일부 역사를 가진 것들을 명확히하려고 시도했다. "가설 테스트"는 그로 인해 명확하게 논의하기 어려운 주제이다. 모델 / 가설이 어떻게 사용되는지에 관한 질문에 답했지만 '각 데이터 샘플에 가설을 할당한다는 것은 무엇을 의미합니까?'
Livid

이 답변이 다운 보트 된 이유와 왜 더 많이지지되지 않는지 이해할 수 없습니다. 정말 우수합니다. 이론적 정의를 조금 더 사용할 수는 있지만 통계 학자보다 더 많은 독자를 대상으로하고 있습니다. GLM을 사용하는 첫 번째 예는 특히 깨달았으며 전적으로 (많은) 학업 수치와 일치했습니다. 결론은 빈번한 가정과 베이지안 가설 검정의 주요 차이점은 MLE 대신 MAP를 계산하기 위해 이전의 설명이라는 것입니다.
gaborous September

GLM을 사용한 첫 번째 예제의 그래픽 표현은 훌륭하고 매우 깨달았을 것입니다. 어쩌면 일종의 레버리지 플롯을 사용하고 있습니까?
gaborous September
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.