간단히 말해서 : 탐색 데이터 분석에 대한 베이지안 접근 방식과 빈번한 접근 방식에 차이가 있습니까?
히스토그램은 히스토그램, 산점도는 산점도 등으로 EDA 방법에 내재 된 편견이 없음을 알고 있으며 EDA가 가르치거나 제시되는 방법의 차이점에 대한 예를 찾지 못했습니다 (특히 A. Gelman의 이론적 논문은 무시). . 마지막으로, 적용되는 모든 것들의 중재자 인 CRAN을 살펴 봤습니다. 베이지안 접근 방식에 맞는 패키지를 찾지 못했습니다. 그러나 나는 CV가 이것에 대해 밝힐 수있는 몇 명의 사람들이있을 것이라고 생각했습니다.
왜 차이점이 있습니까?
우선 :
- 적절한 이전 분포를 식별 할 때이를 시각적으로 조사해서는 안됩니까?
- 데이터를 요약하고 잦은 모델을 사용할지 아니면 베이지안 모델을 사용할지 제안 할 때 EDA가 어느 방향으로 가야합니까?
- 두 가지 접근 방식은 혼합 모델을 처리하는 방법에 대해 매우 분명한 차이점이 있습니다. 표본이 모집단의 혼합에서 나온 것임을 확인하는 것은 어렵고 혼합 매개 변수를 추정하는 데 사용 된 방법과 직접 관련이 있습니다.
- 두 가지 접근 방식 모두 확률 론적 모델을 통합하고 있으며 데이터 선택을 통해 모델 선택이 이루어집니다. 더 복잡한 데이터 또는 더 복잡한 모델은 EDA에서 더 많은 시간이 필요합니다. 확률 론적 모델들 또는 생성 과정들 사이의 이러한 차이점들로 인해, EDA 활동들에는 차이가 있으므로, 다른 확률 론적 접근들로부터 발생하는 차이점들이 있지 않아야 하는가?
참고 1 : "캠프"의 철학에 관심이 없습니다. EDA 툴킷과 방법의 차이 만 해결하고 싶습니다.