파시 모니가 여전히 황금 표준이어야합니까?


31

그냥 생각 :

Parsimonious 모델은 항상 모델 선택에서 기본으로 사용되었지만이 방법은 어느 정도 구식입니까? parsimony에 대한 우리의 경향이 abaci와 슬라이드 규칙의 시간 (또는 더 심각하지 않은 현대 컴퓨터)의 유물인지 궁금합니다. 오늘날의 컴퓨팅 성능을 통해 예측 능력이 더욱 강화 된 복잡한 모델을 구축 할 수 있습니다. 이러한 컴퓨팅 성능의 상한이 높아짐에 따라 우리는 여전히 단순성으로 나아가 야합니까?

물론 더 간단한 모델은 이해하고 해석하기가 더 쉬워 지지만 점점 더 많은 변수를 가진 데이터 세트 시대와 예측 기능에 더 중점을두고있는 시대에는 더 이상 달성 할 수 없거나 필요하지 않을 수도 있습니다.

생각?


4
Richard Hamming에게 사과와 함께 : 모델링의 목적은 숫자가 아니라 통찰력입니다. 복잡한 모델은 통찰력을 방해합니다.
Eric Towers

12
지나치게 단순화 된 모델은 통찰력을 훨씬 더 방해합니다.
Frank Harrell

6
응용 프로그램에 따라 다를 수 있습니다. 물리학에서, 나는 parsimony에 대한 논쟁이 강력한 근거를 가질 것이라고 생각합니다. 그러나 많은 응용 프로그램에서는 제거 할 수없는 여러 가지 작은 효과가 있습니다 (예 : 정치적 선호도에 대한 모델 고려). 많은 근로자들은 변수를 제거하는 대신 정규화 (예 : 축소 또는 여러 응용 프로그램에서 차이 축소 또는 둘 다를 유도하는 방법)를 사용하는 것이 더 합리적이라고 제안합니다. 다른 것은 일부 선택과 일부 축소에 의존합니다 (예 : LASSO는 둘 다 수행).
Glen_b-복지 주 모니카

3
Parsimonious 모델은 모델 선택에서 "가는" 것이 아닙니다 . 그렇지 않으면 우리는 항상 샘플 평균으로 모든 것을 모델링하고 하루라고 부릅니다.
shadowtalker

1
또한 생각 할만한 음식 : Mease and Wyner (2008) 는 약간 직관적이지 않은 AdaBoost의 풍부한 학습자를 추천 합니다. 이 연구 라인에서 열린 의문은 거만한 기초 학습자가 실제로 거만한 앙상블로 이어지는 지 아닌 것 같습니다.
shadowtalker

답변:


25

@Matt의 원래 답변 은 parsimony의 이점 중 하나를 설명하는 데 큰 도움이되지만 실제로 귀하의 질문에 대답하지는 않습니다. 실제로, parsimony는 금본위 제가 아닙니다. 지금도 아니었다. parsimony와 관련된 "골드 표준"은 일반화 오류입니다. 우리는 지나치게 적합하지 않은 모델을 개발하고 싶습니다. 이는 샘플에서와 같이 샘플에서 예측 (또는 해석 가능하거나 최소 오류)에 유용합니다. parsimony는 실제로 일반화 오류에 대한 훌륭한 대리자라는 것이 밝혀졌습니다 (그러나 위에 배치 된 것들 때문에).

실제로 교차 검증 또는 부트 스트랩 또는 교육 / 테스트 세트를 사용하는 이유를 생각해보십시오. 목표는 일반화 정확도가 좋은 모델을 만드는 것입니다. 많은 시간 동안, 샘플 성능을 추정하는 이러한 방법은 복잡성이 낮지 만 항상 그런 것은 아닌 모델을 선택하게됩니다. 극단적 인 예로 오라클이 우리에게 진실하지만 매우 복잡한 모델과 가난하지만 포만적인 모델을 제시한다고 상상해보십시오. 만약 parsimony가 정말로 우리의 목표라면 우리는 두 번째를 선택하지만 실제로는 첫 번째가 우리가 할 수 있는지 배우고 싶은 것입니다. 불행히도 마지막 문장은 "우리가 할 수 있다면"키커입니다.


"원래 답변"은 무엇입니까?
mattdm

:) 충분합니다. 매트의 의견.
Nick Thieme

22

Parsimonious 모델은 컴퓨팅 요구 사항뿐만 아니라 일반화 성능으로 인해 바람직합니다. 샘플 공간을 완벽하고 정확하게 커버하는 무한한 데이터의 이상을 달성하는 것은 불가능합니다. 이는 비 유례 적 모델이 샘플 모집단에서 노이즈 또는 특유성을 과적 합하고 모델링 할 가능성이 있음을 의미합니다.

수백만 개의 변수로 모델을 만들 수는 있지만 출력에 영향을 미치지 않는 변수를 사용하여 시스템을 모델링 할 수 있습니다. 훈련 데이터 세트에서 예측 성능을 크게 달성 할 수 있지만 관련이없는 변수는 보이지 않는 테스트 세트에서 성능을 저하시킬 가능성이 높습니다.

출력 변수가 실제로 백만 개의 입력 변수의 결과 인 경우 충분한 데이터가있는 경우에만 예측 모델에 모두 넣는 것이 좋습니다 . 이 크기의 모델을 정확하게 구축하려면 최소한 수백만 개의 데이터 포인트가 필요합니다. 많은 실제 시스템에서이 크기의 데이터 집합을 사용할 수없고 결과는 상대적으로 적은 수의 변수에 의해 결정되므로 Parsimonious 모델은 유용합니다.


5
+1. 이 문제에 대해 자세히 설명하는 통계 학습의 요소 (웹에서 무료로 사용 가능)를 읽는 것이 좋습니다 .
S. Kolassa-복원 Monica Monica

3
반면에 수백만 개의 변수와 적은 수의 개체가있는 경우 순전히 우연히 일부 변수가 실제 상호 작용에 대한 결과를 설명하는 데 도움이 될 수 있습니다. 그러한 경우에, 파르 모니 기반 모델링은 무차별 접근 방식보다 과적 합에 더 취약 할 것입니다.

@CagdasOzgenc 예를 들어 큰 임의의 부분 공간 앙상블.

올가미 접근 방식이 여기에 적용될 수 있다고 생각합니다.
theforestecologist

17

이전 답변이 중요한 지적을하는 데 도움이된다고 생각합니다.

  • Parsimonious 모델은 일반화 특성이 더 나은 경향이 있습니다.
  • Parsimony는 진정한 황금 표준이 아니라 고려 사항입니다.

나는 일상적인 업무 경험에서 나오는 몇 가지 의견을 추가하고 싶습니다.

예측 정확도 논증의 일반화는 물론 강력하지만, 학문적으로 초점이 맞습니다. 일반적으로 통계 모델을 생성 할 때 경제는 예측 성능이 완전히 지배적 인 고려 사항이 아닙니다. 주어진 응용 프로그램에 유용한 모델이 어떻게 보이는지에 대한 큰 외부 제약이 종종 있습니다.

  • 모델은 기존 프레임 워크 또는 시스템 내에서 구현할 수 있어야합니다 .
  • 비 기술적 실체가 모델을 이해할 수 있어야합니다 .
  • 모델은 계산적 으로 효율적 이어야합니다 .
  • 모델은 문서화 가능 해야합니다 .
  • 모델은 규제 제약 조건을 통과해야합니다 .

실제 응용 프로그램 도메인에서 모든 이러한 고려 사항의 경우 많은 사람들이 와서 전에 하지, 및 모델의 형태와 매개 변수의 최적화한다 - 예측 성능, 제약 이 욕망에 의해. 이러한 각 제약 조건은 과학자를 파시 모니쪽으로 편향시킵니다.

많은 영역에서 이러한 제약이 점차 높아지고있는 것이 사실 일 수 있습니다. 그러나 그것들을 무시하게 된 것은 운이 좋게 과학자 인 것이 일반화 오류를 최소화하는 데 전적으로 초점을 맞추고 있습니다.

이것은 처음으로 과학자에게 매우 실망 스러울 수 있습니다. 학교 밖에서 새로 온 것입니다. 그러나 결국 허용 할 수없는 제품을 생산하기 위해 열심히 노력하는 것은 낭비이며 이는 과학적 자부심에 대한 욕구보다 더 나쁘게 느껴집니다.


2
고려 사항이 아닙니다. 건전한 추론 절차는 데이터를 똑같이 잘 설명한다면 비 (非) 비 유적 모델보다 비 유적 모델의 순위를 매겨 야합니다. 그렇지 않으면 모델의 총 압축 코드 길이와 모델에 의해 인코딩 된 데이터가 가장 작지 않습니다. 그렇습니다. 그것은 금본위 제입니다.
Cagdas Ozgenc

3
Parsimony는 "골드 표준"이 아닙니다! 그 말은 터무니 없다 그것이 사실이라면 왜 우리는 항상 무조건적인 의미에 맞지 않는 모델을 만들지 않습니까? 우리는 테스트 세트 또는 완전히 새로운 관찰과 관련하여 편견과 분산을 거래하며, 우리는 해당 분야, 조직 및 법률의 제약 내에서 그렇게합니다. 때로는 순진한 예측을하기에 충분한 정보 만있는 경우가 있습니다. 때로는 복잡성을 추가하기에 충분합니다.
충돌 평형

1
@BrashEquilibrium 나는 Cagdas가 말하는 것과 동일하게 예측하는 모델 중에서 선택할 때 가장 포용적인 모델을 선택해야한다고 생각합니다.
Matthew Drury

1
아 그것은 다른 것입니다. 그렇습니다.이 경우 가장 교묘 한 모델을 선택하십시오. 나는 여전히 그것이 "골드 표준"인 parsimony에 해당한다고 생각하지 않습니다.
Brash Equilibrium

1
@MatthewDrury Brash, Cagdas. 흥미 롭군 아마도 parsimony는 금본위 제의 한 요소 일 것입니다. 그것은 아마도 포괄 이라는 개념에 근거하여 더 좋을 것 입니다. 이 아이디어의 좋은 설명은 다음 Yale의 천체 물리학 강의에서 제공됩니다 : oyc.yale.edu/astronomy/astr-160/lecture-11 . 7:04 이후. 이 아이디어는 David Hendry와 Grayham Mizon의 계량 경제 / 예측 문헌에도 나와 있습니다. 그들은 포괄이 진보적 연구 전략의 일부라고 주장하며, 그 중 하나는 파시 모니 (parsimony)입니다.
Graeme Walsh

14

나는 이것이 매우 좋은 질문이라고 생각합니다. 제 생각에는 parsimony가 과대 평가되었습니다. 자연이 거의 포용 적이 지 않으므로 정확한 예측 또는 설명 모델이 반드시 필요한 것은 아닙니다. 해석의 문제와 관련하여 현실을 이해할 수 있기 때문에 현실에만 적합하도록 단순한 모델을 선택하면 정확히 무엇을 이해하고 있습니까? 더 복잡한 모형이 더 나은 예측력을 가졌다 고 가정하면 실제 사실에 더 가까운 것으로 보입니다.


8
잘 @dsaxton 말했다. parsimony에 대한 큰 오해와 휘발성 기능 선택의 정도에 대한 과소 평가가 있습니다. Parsimony는 사전 사양에서 나온 결과가 좋습니다. 데이터 준설로 발생하는 대부분의 포로 마니는 오해의 소지가 있으며 잘못 되었기 때문에 이해해야합니다.
Frank Harrell

2
@FrankHarrell "잘못 이해했기 때문에"이해하거나 이전에 작성한 것에 대한 링크를 작성 하시겠습니까? 이것은 내가 이해하고 싶은 흥미로운 포인트입니다.
gui11aume

8
이것은 극단적 인 예이지만 인종 프로파일 링에 참여하는 사람들은 단일 기능 (예 : 피부색)으로 누군가의 가치를 이해한다고 생각합니다. 그들에게 대답은 간단합니다. 그들은 지나치게 단순화함으로써 잘못된 판단을 내리기 때문에 그것을 이해합니다. Parsimony는 일반적으로 환상입니다 (뉴턴 역학 및 기타 일부 지역 제외).
Frank Harrell

1
"자연은 거의 포용 적이 지 않다": 자연이 특히 비 유례 적이라는 점은 개인이다 (우리의 전형적인 표본 크기와는 반대로)! 진화는 매 세대마다 완전히 새로운 개인의 새로운 인구를 사용합니다 ... parsimony (Frank Harrell의 사전 지정된 유형-모델에 n 개의 사용 가능한 기능을 허용하는 것은 실제로 매우 복잡한 모델입니다-n << m, 이것은 원래 검색 공간의 작은 부분이 아닙니다)) 우리는 너무 작은 데이터 집합에서 적어도 무언가를 얻는 방법입니다.
cbeleites는 Monica를 지원합니다.

2

Parsimony는 금빛 시작이 아닙니다. 모델링의 한 측면입니다. 모델링 및 특히 예측은 스크립팅 할 수 없습니다. 즉, 스크립트를 모델러에게 전달하여 수행 할 수는 없습니다. 모델링 프로세스의 기반이되는 원칙을 정의하십시오. 따라서, parsimony는 이러한 원칙 중 하나이며, 적용 할 수 없습니다 (다시!). 모델러는 모델을 선택할 때 복잡성을 고려합니다.

계산력은 이와 관련이 없습니다. 업계에 종사하는 경우 비즈니스 담당자, 제품 담당자, 전화를 건 사람이 모델을 소비하게됩니다. 당신은해야한다, 그들에게 모델을 설명해야 감각을 그들에게. parsimonious 모델을 갖는 것은 이와 관련하여 도움이됩니다.

예를 들어 제품 판매를 예측하고 있습니다. 영업 의 원동력 과 그 작동 방식 을 설명 할 수 있어야합니다 . 비즈니스와 관련된 개념과 관련이 있어야하며 비즈니스가 상관 관계 를 이해하고 수용해야합니다. 복잡한 모형을 사용하면 모형의 결과를 해석하거나 실제와의 차이를 나타내는 것이 매우 어려울 수 있습니다. 비즈니스에 모델을 설명 할 수없는 경우 가치가 없습니다.

예측에 특히 중요한 것이 하나 더 있습니다. 모델이 N 외인성 변수에 의존한다고 가정 해 봅시다. 즉, 종속 변수를 예측하려면 먼저 이러한 변수의 예측을 얻어야합니다. N이 작을수록 삶이 더 쉬워 지므로 더 간단한 모델을 사용하는 것이 더 쉽습니다.


예측을 언급했지만 대부분의 답변은 설명 적 모델링에만 적용되는 것으로 보입니다.
rolando2

@ rolando2, 내 도메인에서는 단순히 예측을 사용자에게 전달할 수 없기 때문에 들립니다. 일기 예보를 설명하고 운전자 등에 게 연결해야합니다. 일기 예보를받을 때 보통 50 % 확률로 정확히 비가 올 것이라고 생각하는 이유를 설명자에게 설명하도록 요구하지 않습니다. 제 경우에는해야 할뿐만 아니라 소비자가 매일 처리하는 비즈니스 동인과 연결하여 결과를 이해하는 방식으로 처리해야합니다. 그래서 parsimony는 그 자체로 가치가 있습니다
Aksakal

1

어제 세렌디피티에 의해서만 발견 된 개념 인 Akaike Information Criterion에 대한 리뷰가있을 것 입니다. AIC는 기본적인 Occam 's Razor 또는 parsimony 접근법보다는 현재 관측에 가장 적합한 설명이되는 모델과 몇 개의 매개 변수를 식별하려고합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.