조지 박스에서 Galit Shmueli와 과학적인 방법은?


16

(이 질문은 Philosophy SE에 더 적합한 것처럼 보일 수 있습니다. 통계학자가 Box 및 Shmueli의 진술에 대한 나의 오해를 분명히 할 수 있기를 바랍니다.

ARIMA 명성의 George Box는 다음과 같이 말했습니다.

"모든 모델이 잘못되었지만 일부는 유용합니다."

Galit Shmueli는 유명한 논문 인 "설명하거나 예측하기 위해"에서 다음 과 같이 주장한다.

설명과 예측은 동일하지 않으며 일부 모델은 예측이 좋지 않은 경우에도 설명을 잘 수행합니다.

나는 이것들이 원칙에 어긋난다 고 생각한다.

모형이 잘 예측되지 않으면 유용합니까?

더 중요한 것은, 모델이 잘 설명하고 있지만 반드시 잘 예측하지 못하는 경우 어떤 식 으로든 사실이어야합니다 (즉, 잘못되지 않아야 함). 그러면 Box의 "모든 모델이 잘못되었습니다"라는 메시는 어떻습니까?

마지막으로, 모델이 잘 설명하지만 잘 예측하지 못하면 어떻게 과학적일까요? 대부분의 과학적 경계 기준 (검증주의, 허위주의 등)은 과학적 진술이 예측력 또는 구어체를 가져야 함을 암시합니다. 이론 또는 모델은 경험적으로 테스트 (또는 위조) 될 수있는 경우에만 정확합니다. 미래의 결과를 예측해야합니다.

내 질문 :

  • Box의 진술과 Shmueli의 아이디어는 실제로 모순되거나, 또는 모델이 아직 예측력을 갖지 않아도 여전히 유용 할 수있는 것을 놓치고 있습니까?
  • Box와 Shmueli의 진술이 모순 되지 않으면 모델이 잘못되어 잘 예측되지 않고 설명력이 있다는 것은 무엇을 의미합니까? 다르게 말하자면 : 정확성과 예측 능력을 모두 빼앗아 가면 모델의 남은 것은 무엇입니까?

모형에 설명력이 있지만 예측력이없는 경우 어떤 경험적 검증이 가능합니까? Shmueli는 설명을 위해 AIC를 사용하고 예측을 위해 BIC를 사용하는 등의 것을 언급하지만 문제가 어떻게 해결되는지는 알 수 없습니다. 예측 모델을 사용하면 AIC, BIC, R2 또는 정규화 등을 사용할 수 있지만 궁극적으로 샘플 테스트 및 생산 성능에서 모델의 품질이 결정됩니다. 그러나 잘 설명하는 모델의 경우 손실 함수가 어떻게 모델을 실제로 평가할 수 있는지 알 수 없습니다. 과학 철학에는 과소 결정 의 개념이 있습니다.L1L L p < 0.05 p < 0.1 p < 0.01주어진 데이터 세트 에 대해 데이터에 맞는 방식으로 항상 일부 분포 (또는 분포의 혼합)와 손실 함수 을 신중하게 선택할 수 있습니다 (따라서 설명 할 수 있음). 또한, 임계치가 모델이 적절하게 데이터를 임의로 설명 주장 누군가 미만이어야 (종류, P 값 등, 이유는 아닌 또는 ?).LLp<0.05p<0.1p<0.01

  • 위의 내용을 바탕으로 샘플 테스트가 불가능하기 때문에 잘 설명하지만 잘 예측하지 못하는 모델을 어떻게 객관적으로 검증 할 수 있습니까?


3
내가 Shmueli를 기억할 수있는 한, 그녀 는 기능적 형태를 올바르게 설명 한다는 것을 의미하지만 (기능적 형태의 매개 변수에 관해서는 큰 추정치가 부정확 할 수 있음), 잘 예측 한다는 것은 편향-분산 트레이드 오프를 얻는 것을 의미합니다 권리 (추정 정밀도를 높이기 위해 기능적 형태에 타협). 또한 철학적 태그 가 유용 할 수 있습니다.
Richard Hardy

1
나는 "또는"이 배타적 일 필요는 없다고 생각한다. 단순성과 통일은 동일한 예측 가치 이론에 대한 논란의 여지가없는 선택 기준이며, 그렇다면 많은 맥락에서 그것들에 대한 정확성의 희생이 정당화 될 수있다. Box의 좌우명은 van Fraassen의 과학 이미지 (및 Kant로 돌아 가기)에서 발전된 과학에 대한 다른 관점을 반영합니다. 관찰 할 수없는 "현실"에 대한 문자 그대로 진실한 이야기를 말하지 않고 관찰 된 내용에 대한 적절하고 유용한 설명을 구성하는 것입니다. 많은 작업에는 거친 적합성이 충분할 수 있으며 "올바른 모델"은 순진한 인물 일 수 있습니다.
Conifold 2018 년

2
@Conifold 실제로, 복잡한 인과 시스템에 대한 Richard Levins의 루프 분석 (통계 예측과 직접 관련된 애플리케이션이 있지만 통계적 방법은 아님) 모델 현실성 (변수 및 시스템 간의 관계) 및 일반성을 선호하여 거의 모든 정밀도를 희생합니다. (동일한 인과 구조를 공유하는 모든 변수에 대한 모델의 분석 결과 적용 가능성). Levins, R. (1966) 참조. 인구 생물학에서 모델 구축 전략 . 미국 과학자 , 54 (4), 421–431.
Alexis

(+1. 여기에 답변을 게시 할 시간을 찾기를 여전히 기대하고 있습니다 ...)
amoeba는 Reinstate Monica

답변:


9

조지 박스 (George Box)는 "모든 모델이 잘못되었지만 일부는 유용하다"는 말을 인용하면서 시작하겠습니다. 이 진술은 과학에 큰 영향을 미치는 철학적 접근 방식 인 "긍정주의"의 방법 론적 접근 방식을 요약 한 것입니다. 이 접근법은 Friedman (1966) 의 고전적인 방법론 에세이 (경제 이론의 맥락에서)에 자세히 설명되어있다 . 그 논문에서 프리드먼은 유용한 과학적 이론은 반드시 현실의 단순화를 구성한다고 주장하며, 따라서 그 가정은 항상 현실에서 어느 정도 벗어나야하며 심지어 현실에서 실질적으로 벗어날 수도 있다고 주장한다.세계의 복잡성을 관리 가능한 원칙 세트로 줄이고 현실에 대한 예측을하는 데있어 정확성 을 높이고 현실에 대한 새로운 테스트 가능한 가설을 생성합니다. 따라서 Friedman은 "모두가 틀렸다"고 주장하지만 현실을 단순화하는 가정을 포함하지만 현실에 대한 유용한 예측을 할 수있는 간단한 틀을 제공하는 한 "일부는 유용하다"고 주장한다.

이제 Box (1976) ( "모든 모델이 틀렸다"고 처음으로 언급 한 논문 ) 을 읽으면 Friedman을 인용하지 않거나 방법 론적 긍정주의를 언급하지 않는다는 것을 알 수 있습니다. 그럼에도 불구하고 과학적 방법과 그 특성에 대한 그의 설명은 Friedman이 개발 한 것과 매우 유사합니다. 특히, 두 저자는 과학 이론이 관측 된 사실에 대해 테스트 될 수있는 현실에 대한 예측을 할 것이며, 예측의 오류는 이론 수정의 기초로 사용될 수 있다고 강조합니다.

이제 Shmueli (2001)의 Galit Shmueli가 논의한 이분법에 대해 살펴 보자 . 이 백서에서 Shmueli는 인과 된 설명과 관찰 된 결과에 대한 예측을 비교하여 이들이 별개의 활동이라고 주장합니다. 특히, 인과 관계는 측정 가능한 결과에서 직접적으로 드러나지 않는 기본 구성체를 기반으로하므로 "측정 가능한 데이터는 기본 구성체의 정확한 표현이 아니다"(p. 293) 고 주장한다. 따라서 그녀는 통계적 분석의 측면에서 관측 할 수없는 결과의 실질적인 차이로 드러나지 않는 관측 할 수없는 근본적인 인과 관계에 대한 추론을 포함한다고 주장한다.

내가 무언가를 오해하지 않는 한, Box에 의해 인용 된 Box와 Friedman에 대한 긍정적 인 견해와 함께이 아이디어가 긴장하고 있다고 말하는 것이 공정하다고 생각합니다. 실증 주의적 견해는 본질적으로 측정 가능한 결과로 나타나는 것 이상으로 허용되는 형이상학 적 "구조"가 없다고 말한다. 포지티브는 관측 가능한 데이터와이 데이터에 기반한 개념을 고려하는 데 그 친다. 그것은 선험적 고려를 배제한다형이상학 적 개념. 따라서, 실증주의자는 인과 관계의 개념은 그것이 실제로 측정 가능한 결과의 관점에서 정의 된 범위 내에서만 유효 할 수 있다고 주장 할 것이다. 이것은 형이상학 적 추론으로 간주되며 과학적 담론에서 허용되지 않는 것으로 취급 될 것이다.

따라서 여러분이 옳다고 생각합니다.이 두 가지 접근 방식은 본질적으로 충돌합니다. Box에 의해 사용 된 positivist 접근법은 유효한 과학적 개념은 실제적으로 그들의 표현에 전적으로 근거하고 있다고 주장하지만 Shmueli에 의해 사용 된 대안 적 접근은 중요한 과학적 개념 (설명하고자하는)이지만 "설명하고자하는" "일부"가 있다고 말한다 그들이 실제적으로 측정 가능한 결과와 관련하여 "운영"될 때 완벽하게 대변됩니다.


바로 그거죠!!! Shmueli는 과학적 진술이 무엇인지에 대한 대부분의 긍정 주의자 (및 위조 론자)의 정의와 모순되는 것 같으며, 그녀의 의도가 참으로 대담한 철학적 진술을 할 것인지 궁금합니다. 또는 통계 학자로서 그녀의 진술이 실제로 얼마나 과감한 지 알지 못하는가?
Skander H.-복원 모니카


1
실증주의와 실용주의는 반 현실 주의적 특성을 공유하지만, Box의 접근법은 후자이며, 적어도 1960 년대 후반 이래로 과학에 긍정적 인 영향을 미치지는 않는다. 이것이 Box가 Friedman이나 다른 긍정적 인 사람들을 언급하지 않는 이유입니다. 실용주의는 관측 가능한 데이터에 국한되지 않으며 선험적 개념이나 형이상학 적 구성 에는 문제가 없습니다 . 그것은 단지 그들이 "현실"에 접근하는 것으로 보지 않기 때문에, 고유 한 "올바른"기능을 목표로하므로 복수, 작업에 따라 다를 수 있고 수정 될 수 있습니다. 인과 관계는 그러한 구성이므로 Box와 Shmueli 사이에는 충돌이 없습니다.
Conifold

박스가 실용 주의자인지 아닌지에, 그가 여기에 제시하는 특정 인용문은 실용주의보다 실증주의에 더 도움이된다고 생각합니다. 후자의 철학은 형이상학에 대한 다원적 관점을 취하는데, 현실을 개념화하는 여러 가지 일관된 방법이 있으며, 이러한 모든 것은 현실의 유용한 개념화라는 의미에서 "참"이다. 따라서 실증주의는 "모든 모델이 잘못되었지만 일부는 유용하다"고 말하지만 실용주의의 최대치는 "유용하기 때문에 많은 모델이 옳다"에 더 가깝다.
복원 Monica Monica

유용한 것으로 진실을 식별하는 것은 실용주의에 대한 민중 오해 일뿐입니다. "올바른"것은 실용 주의자들이 부인하는 것에 상응하는 무언가가 있음을 시사하기 때문에 모든 모델은 잘못되었다. 그리고 관용의 원칙은 "모델이 목적에 부합하는 한 옳다"는 것은 논리적 양성의 아버지 인 카나 프 때문이다.
Conifold 2018 년

4

사물을 설명하는 데 사용되는 모델은 현실을 단순화 한 것입니다. 단순화는 "유용한 방법으로 잘못되었다"는 또 다른 단어 일뿐입니다. 예를 들어 숫자 3.1415926535898을 3.14로 반올림하면 오류가 발생하지만이 오류를 통해 인간은 해당 숫자의 가장 중요한 부분에 집중할 수 있습니다. 이것은 모델이 설명에 사용되는 방법이며, 어떤 문제에 대한 통찰력을 제공하지만, 필연적으로 다른 많은 것들과 추상화되어야합니다. 우리가 주로 예측에 관심이 있다면 가능할 때마다 그 수천 가지를 포함하고 싶지만 트레이드 오프를 설명하면 다릅니다.


1
π

1
@SkanderH. "우아하고 직관적 인 그래프"가 공학 응용 프로그램 또는 새로운 이론의 개발을 용이하게하는 한, 그 가치는 순전히 주관적이거나 비 과학적이지 않으며 실용적입니다. 통일, 해설 력, 단순성 및 일관성은 미학적 가치가 아닌 전염병 으로 널리 인정되고있다 . Lorentz의 에테르 이론과 특수 상대성 이론 사이의 선택은 그러한 고려 사항에 기초하여 이루어졌으며, 이들은 예측 적으로 동일합니다.
Conifold 2018 년

3

예측이 뛰어나지 만 설명이없는 모델의 예는 Wikipedia 기사“ 모든 모델이 잘못되었습니다 ”에 나와 있습니다. 예는 뉴턴의 중력 모델입니다. 뉴턴의 모델은 거의 항상 경험적 관찰과 구별 할 수없는 예측을 제공합니다. 그러나이 모델은 엄청나게 타당하지 않습니다. 임의로 거리가 멀어지면 즉시 작용할 수있는 힘을 가정하기 때문입니다.

뉴턴의 모델은 아인슈타인의 일반 상대성 이론에 제시된 모델로 대체되었습니다. 일반적인 상대성으로 중력은 공간을 통해 유한 속도 (빛의 속도)로 이동합니다.

뉴턴의 모델은 일반 상대 론적 모델의 단순화가 아닙니다. 이를 설명하기 위해 사과가 나무에서 떨어지는 것을 고려하십시오. 일반적인 상대성 이론에 따르면, 사과는 지구에 사과에 힘을 가하지 않고 떨어집니다. (사과가 떨어지는 주된 이유는 지구가 시간을 왜곡하여 나무 밑면 근처의 시계가 나무의 시계보다 느리게 실행되기 때문입니다.) 따라서 Wikipedia 기사에서 알 수 있듯이 Newton의 모델은 설명에서 완전히 틀 렸습니다. 원근법.

Shmueli [2010]의 논문은 예측과 설명이라는 두 가지 모델 목적이 있다고 가정합니다. 실제로 몇몇 저자들은 세 가지 목적이 있다고 언급했다 (예 : Konishi & Kitagawa [ Information Criteria and Statistical Modeling , 2008 : §1.1] 및 Friendly & Meyer [ Discrete Data Analysis 참조) , 2016 : §11.6] 참조). 세 가지 목적은 세 가지 종류의 논리적 추론에 해당합니다.

  • 예측 (공제에 해당);
  • 파라미터 추정 (유도에 해당);
  • 구조 설명 (납치에 해당).

뉴턴의 중력 모델이 "아무것도 설명하지 않는다"고 말하는 것은 솔직히 어리석은 일입니다. -1.
아메바는 모니카가

뉴턴의 모델 인 아메바 (Amoeba)는 일반적인 상대성이 정확하다는 가정하에 중력이 어떻게 작용하는지에 대해서는 전혀 설명하지 않습니다. 사과가 떨어지면 뉴턴의 모델은 지구가 사과에 힘을가한다고 가정하고 그 가정은 완전히 거짓이라고 가정합니다. 나는 당신이 내 대답을 더 고려하도록 요청합니다. 여전히 이해가 안된다면 불분명 한 점을 친절하게 말씀하십시오.
SolidPhase

당신이 말하는 것은 분명하지만 나는 그것에 동의하지 않습니다.
amoeba는

아메바, 왜 당신이 동의하지 않는지 설명 해달라고 부탁합니다. 이유가 있습니까? (응답에 추가 문장을 추가했습니다.)
SolidPhase

감사. 당신이 언급 한 참고 문헌을 찾아 볼 것입니다. 설명하지 않아도 모델이 어떻게 예측할 수 있는지 이해합니다. 내가 얻지 못하는 것은 반대 방향입니다. 모델이 예측하지 않고 설명하는 방법. 아인슈타인 대 아인슈타인의 사례는 모든 것을 더 혼란스럽게합니다. 아인슈타인의 이론이 뉴턴을 대체 한 이유는 그것이 더 잘 예측 되었기 때문입니다. 다른 방법으로 살펴보십시오. 경쟁 설명 모델이있는 경우 가장 예측력이있는 모델을 테스트하지 않는 한 어떻게 평가할 수 있습니까?
Skander H.-복 직원 모니카

1

저는 통계학 학사이므로 전문가라고 부르지는 않지만 여기에는 2 센트가 있습니다.

모델은 스스로를 설명하지 않습니다. 인간은 그것들을 해석합니다. 선형 모델은 신경망 및 임의의 포리스트보다 이해하기 쉽습니다. 의사 결정 방법에 더 가깝기 때문입니다. 실제로 ANN은 인간의 두뇌를 모방하지만 일련의 행렬 곱셈을 수행하여 내일 어떤 식당을 갈지 결정하지 않습니다. 대신, 당신은 마음의 일부 요소를 중요성에 의해 가중치를 부여하는데, 이는 본질적으로 선형 조합입니다.

"예측력"은 모델이 인간의 직관에 얼마나 잘 부합하는지 측정하는 반면 "예측력"은 해당 프로세스의 기본 메커니즘에 얼마나 잘 부합되는지 측정합니다. 그들 사이의 모순은 본질적으로 세상이 무엇인지와 어떻게 우리가 그것을 인식 / 이해할 수 있는지 사이의 간격입니다. 이것이 왜 "일부 모델이 예측에 좋지 않은 역할을하더라도 설명을 잘하는 이유"를 설명하기를 희망합니다.

이안 스튜어트 (Ian Stewart)는 "우리의 뇌가 뇌를 이해하기에 충분히 단순하다면 우리는 너무 단순해서 우리가 할 수 없을 것"이라고 말했다. 불행하게도, 우리의 작은 인간의 뇌는 실제로 우주 나 심지어는 주식 시장 (많은 뇌를 포함하는)에 비해 매우 단순합니다. 지금까지 모든 모델은 인간 두뇌의 산물이므로 다소 부정확해야합니다. 따라서 Box의 "모든 모델이 잘못되었습니다." 반면에, 모델이 유용하기 위해 기술적으로 정확할 필요는 없습니다. 예를 들어, 아인슈타인은 뉴턴의 운동 법칙을 반박했지만, 물체가 엄청나게 크거나 빠르지 않은 경우에도 유용합니다.

귀하의 질문을 해결하기 위해 솔직히 Box와 Shmueli의 요점 사이의 비 호환성을 볼 수 없습니다. "설명력"과 "예측력"을 이항 특성으로 생각하는 것 같습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.