모델에 데이터를 피팅하는 것과 데이터에 모델을 피팅하는 것 사이에 개념적 또는 절차상의 차이가 있습니까? 제 표현의 예에서 알 수 https://courses.washington.edu/matlab1/ModelFitting.html 하고, 두 번째의 https://reference.wolfram.com/applications/eda/FittingDataToLinearModelsByLeast-SquaresTechniques.html .
모델에 데이터를 피팅하는 것과 데이터에 모델을 피팅하는 것 사이에 개념적 또는 절차상의 차이가 있습니까? 제 표현의 예에서 알 수 https://courses.washington.edu/matlab1/ModelFitting.html 하고, 두 번째의 https://reference.wolfram.com/applications/eda/FittingDataToLinearModelsByLeast-SquaresTechniques.html .
답변:
내가 연결 한 Wolfram 소스를 제외하고 내가 상호 작용 한 거의 모든 소스 나 사람 은 프로세스를 모델에 데이터에 맞추는 것으로 언급한다 . 모델은 동적 객체이고 데이터는 정적 (일명 고정 및 상수)이기 때문에 이치에 맞습니다.
그것을 강조하기 위해 Larry Wasserman의 접근 방식이 마음에 듭니다. 그의 말에 따르면 통계 모델 은 분포의 모음입니다. 예를 들어 모든 정규 분포의 모음은 다음과 같습니다.
또는 모든 포아송 분포 세트 :
분포를 데이터에 피팅하는 것은 통계 모델과 일련의 데이터 (데이터가 고정됨)를 결합하는 알고리즘이며 데이터에서 "가장 잘"반영된 모델로 분포에서 정확히 하나를 선택합니다.
모델은 변화하는 것입니다 (일종) : 우리는 전체 가능성 모음에서 단일 최선의 선택으로 모델을 축소하고 있습니다. 데이터는 단지 데이터입니다. 전혀 아무 일도 일어나지 않습니다.
Rasch 모델링 분야에서는 데이터를 모델에 맞추는 것이 일반적입니다. 모델이 올바른 것으로 가정하고이를 따르는 데이터를 찾는 것은 분석가의 작업입니다. Rasch 의 Wikipedia 기사 에는 방법과 이유에 대한 자세한 내용이 포함되어 있습니다.
그러나 다른 사람들은 일반적으로 통계에서 모델을 변경할 수 있기 때문에 모델에 데이터를 맞추는 데 동의하지만 데이터를 선택하거나 수정하는 것은 나쁜 형식이라고 생각합니다.
일반적으로 관측 된 데이터는 모형을 변경할 수있는 동안 고정되며 (예 : 모수를 추정하기 때문에) 다른 방식이 아닌 데이터에 적합하도록 만들어진 모형입니다 . (보통 사람들은 두 표현 중 하나를 말할 때이 경우를 의미합니다.)
사람들이 데이터를 모델에 적합하다고 말하면 데이터에 대한 도대체 무슨 일을 하려고 했는지 스스로 알 수 있습니까? .
[이제 당신이 데이터를 변환 하고 있다면 그것은 아마도 '모델에 데이터를 맞추는 것'일 것입니다. 그러나 사람들은이 경우에 대해 그런 말을 거의하지 않습니다.]