우리는 항상 통계가 단지 데이터를 다루고 있다고 말합니다. 그러나 우리는 정보학이 데이터 분석으로부터 지식을 얻고 있다는 것도 알고 있습니다. 예를 들어, 생물 정보학 사람들은 생물학적 통계없이 완전히 갈 수 있습니다. 통계와 정보학의 본질적인 차이점이 무엇인지 알고 싶습니다.
우리는 항상 통계가 단지 데이터를 다루고 있다고 말합니다. 그러나 우리는 정보학이 데이터 분석으로부터 지식을 얻고 있다는 것도 알고 있습니다. 예를 들어, 생물 정보학 사람들은 생물학적 통계없이 완전히 갈 수 있습니다. 통계와 정보학의 본질적인 차이점이 무엇인지 알고 싶습니다.
답변:
훌륭한 질문 !!
생물 정보 학자들이 통계없이, 심지어 통계 없이도 갈 수 있다고 여러 번 들었습니다. 그것은 거짓이 될 때까지 완벽하게 사실입니다. 내 생각에, Keith Baggerly가 보여 주듯이 통계 지식의 일반적인 부족은 현장에서 치명적인 영향을 미칩니다 . 이론의 깊은 지식없이, 그들이에 휠과 리조트 재발견하는 경향이 : 나는 또한 장기적으로 bioinformaticians의 침체의 원인은 통계의 기본 지식 (선형 대수학)의 부족을 관찰 할 수있는 임시 해결 솔루션을 그들 만의 문제 일뿐입니다.
그러나 지금 귀하의 질문에 대답하기 위해, 그 당시 컴퓨터가 없으면 통계가 전체적으로 불가능하다는 데 동의합니다. 그러나 통계의 주요 측면 중 하나는 추론 이며 컴퓨터와는 아무런 관련이 없습니다. 통계적 추론 은 실제로 통계를 과학으로 만드는 것인데, 다른 맥락에서 결론을 내릴지 여부를 알려주기 때문입니다.
간단히 말해, 데이터에서 지옥을 분석 할 수 있지만, 분석 을 기반으로 수행 할 예측 또는 결정 의 유효성 을 알기 위해서는 통계가 필요합니다 .
필자는 필드 사이에 상당한 양의 겹치는 부분이 있지만 중요한 차이점도 있다고 생각합니다. 일반적으로 통계학 학생 (높은 수준)은 정보학 학생보다 더 많은 이론 수업 (수학 및 수학 통계)을 수강하지만 정보학 학생은 컴퓨팅 (특히 데이터베이스 부분) 측면에 대해 더 많이 배우게됩니다.
새로운 통계 테스트를 개발하면 정보 전문가보다 통계 학자에게 더 많이 떨어질 수 있지만 사용자가 데이터를 입력하고 테이블과 플롯을 생성 할 수있는 인터페이스를 디자인하면 통계 전문가보다 정보 전문가에게 더 많이 떨어질 것입니다.
통계 학자에게 컴퓨터는 통계를 도와주는 도구입니다. 정보 학자에게 통계는 (일반적으로 컴퓨터를 통해) 정보를 수집하고 배포하는 데 도움이되는 도구입니다.
여기 아래 편집 -----
확장하기 위해 여기에 예가 있습니다. 나는 의사가 환자에 대한 정보를 사용하여 어떤 상태의 위험을 예측하는 데 사용되는 시스템 (예 : 혈액 응고 현상)을 갖고 싶어하는 정보 학자 (통계 학자)와 프로젝트를 수행했으며 위험에 대해 알리십시오. 프로젝트 (통계 학자 역할)에서 나의 역할은 예측 변수가 주어진 위험을 예측하는 모델을 개발하는 것입니다 (물류 회귀 모델은 그러한 모델 중 하나입니다). 프로젝트에서 정보 주의적 역할은 예측 변수를 수집하고 내 모델을 사용한 다음 결과를 의사에게 보내는 도구를 개발하는 것입니다. 데이터는 전자 의료 기록 또는 간호사가 입력 할 수있는 데이터 입력 화면을 통해 수집 될 수 있습니다.
이제 나는 (그리고 다른 많은 통계 학자들) 데이터베이스를 쿼리하여 예측 변수를 얻고 어떤 유형의 경고를 만들 수있는 프로그래밍에 대해 충분히 알고 있지만, 정보 학자에게 맡기면 기쁘다. 로지스틱 회귀 모델에 맞는 충분한 통계를 알고있는 정보 학자가 있습니다. 따라서이 프로젝트의 간단한 버전은 통계학 자나 정보 학자 만 수행 할 수 있지만 둘 다 함께 작업 할 때 가장 좋습니다. 이 프로젝트를보고 모델링 부분이 재미있는 부분이고 데이터 수집, 경보 및 기타 인터페이스가 정보를 모델과주고받는 도구 일 뿐이라고 생각하면 통계 전문가가 될 수 있습니다. 인터페이스 디자인, 데이터 검색 최적화, 다양한 유형의 경고 테스트 등이 보이면
통계 는 데이터에서 추론 합니다. 정보학 은 데이터에서 작동 합니다. 물론 그것들은 겹치지 만 더 큰 범위를 가진 문제는 답이 없습니다.