데이터 마이닝과 통계 분석의 차이점은 무엇입니까?
어떤 배경에서는 통계 교육이 다소 전통적이라고 생각합니다. 특정 질문이 제기되고 연구가 설계되며 데이터가 수집 및 분석되어 해당 질문에 대한 통찰력을 제공합니다. 결과적으로, 나는 항상 "데이터 준설 (data dredging)", 즉 큰 데이터 세트에서 패턴을 찾고 이러한 패턴을 사용하여 결론을 도출하는 것에 대해 회의적이었습니다. 나는 후자를 데이터 마이닝과 연관시키는 경향이 있으며 (알고리즘 변수 선택 루틴과 같은 것들과 함께) 항상 다소 원칙적이라고 생각했습니다.
그럼에도 불구하고 데이터 마이닝에 대한 문헌이 크게 증가하고 있습니다. 종종이 레이블은 클러스터링, 트리 기반 분류 등과 같은 특정 기술을 참조하는 것으로 보입니다. 그러나 적어도 제 관점에서 볼 때 이러한 기술은 데이터 집합에서 "느슨하게 설정"되거나 구조적 방식으로 사용될 수 있습니다. 질문. 전 데이터 마이닝과 후자를 통계 분석이라고합니다.
나는 학업 관리에서 일하고 문제와 기회를 식별하기 위해 "데이터 마이닝"을 수행하도록 요청 받았습니다. 나의 배경과 일치하게, 나의 첫 번째 질문은 무엇을 배우고 싶고 당신이 이슈에 기여한다고 생각하는 것들은 무엇입니까? 그들의 답변으로부터, 저와 그 질문을하는 사람은 데이터 마이닝의 본질과 가치에 대해 다른 아이디어를 가지고 있음이 분명했습니다.