통계와 정보학의 차이점은 무엇입니까?


10

우리는 항상 통계가 단지 데이터를 다루고 있다고 말합니다. 그러나 우리는 정보학이 데이터 분석으로부터 지식을 얻고 있다는 것도 알고 있습니다. 예를 들어, 생물 정보학 사람들은 생물학적 통계없이 완전히 갈 수 있습니다. 통계와 정보학의 본질적인 차이점이 무엇인지 알고 싶습니다.


7
아니, 이것은 단지 "정보학"이라는 단어가 결정적인 의미를 완전히 잃어 버렸기 때문입니다. "생물 정보학"은 "컴퓨터에서 만들어진 생물학"을 위해서만 만들어졌으며, 이것에 대한 깊은 것은 없습니다.

1
@mbq 동의합니다. "정보학"과 "생물 정보학"은 의미있는 정의를 잃었습니다.
Fomite

명확한 방법으로 생물 정보학 (결과를 생물학적 방법으로 관찰하기 위해 결과를 적용하십시오)
Kamal Alblwei

답변:


20

훌륭한 질문 !!

생물 정보 학자들이 통계없이, 심지어 통계 없이도 갈 수 있다고 여러 번 들었습니다. 그것은 거짓이 될 때까지 완벽하게 사실입니다. 내 생각에, Keith Baggerly가 보여 주듯이 통계 지식의 일반적인 부족은 현장에서 치명적인 영향을 미칩니다 . 이론의 깊은 지식없이, 그들이에 휠과 리조트 재발견하는 경향이 : 나는 또한 장기적으로 bioinformaticians의 침체의 원인은 통계의 기본 지식 (선형 대수학)의 부족을 관찰 할 수있는 임시 해결 솔루션을 그들 만의 문제 일뿐입니다.

그러나 지금 귀하의 질문에 대답하기 위해, 그 당시 컴퓨터가 없으면 통계가 전체적으로 불가능하다는 데 동의합니다. 그러나 통계의 주요 측면 중 하나는 추론 이며 컴퓨터와는 아무런 관련이 없습니다. 통계적 추론 은 실제로 통계를 과학으로 만드는 것인데, 다른 맥락에서 결론을 내릴지 여부를 알려주기 때문입니다.

간단히 말해, 데이터에서 지옥을 분석 할 수 있지만, 분석 을 기반으로 수행 할 예측 또는 결정 의 유효성 을 알기 위해서는 통계가 필요합니다 .


감사. 생물 정보학의 기본 원리가 무엇인지 규율하는 데 대해 더 설명 할 수 있습니까? 통계의 경우 일반적으로 두 가지 주요 부분이 있습니다. 하나는 순수한 데이터 조작이고 다른 하나는 확률을 기반으로하는 통계 추론입니다. 하나는 순수한 수학 중 하나입니다. 통계 모델 (확률 모델)을 기반으로 통계 담당자는 과학을 수행 할 수 있습니다. 생물 정보학은 어떻습니까?
Honglang Wang

4
생물 정보학은 단순히 생물학적 질문을 연구하기 위해 컴퓨터를 사용하는 것입니다. 훈련은 일반적으로 방법이 아닌 질문에 의해 정의되므로 생물 정보학은 생물학의 일부가되어야한다고 생각합니다. 생물학자는 컴퓨터에 매우 나쁘기 때문에 특별한 이름을 가지고 있으므로 그것을 할 수있는 사람들에게는 특별한 레이블이 있어야합니다. 생물학자가 IT와 수학에 능숙 할 때 50 년이 지나도 여전히 생물 정보학이 존재할 것이라고 확신하지 않습니다.
gui11aume

2
다른 사람이 Keith의 노력에 감사하는 것을 보게되어 기쁘다. 그는 논란이나 어렵고 불편한 전문적인 상황에서 벗어나지 않았다.
추기경

@cardinal 키이스가 1 ~ 2 년 전에 APHA 회의에서 연설하는 것을 보았다. 내가 본 최고의 대화 중 하나였습니다.
Fomite

9

필자는 필드 사이에 상당한 양의 겹치는 부분이 있지만 중요한 차이점도 있다고 생각합니다. 일반적으로 통계학 학생 (높은 수준)은 정보학 학생보다 더 많은 이론 수업 (수학 및 수학 통계)을 수강하지만 정보학 학생은 컴퓨팅 (특히 데이터베이스 부분) 측면에 대해 더 많이 배우게됩니다.

새로운 통계 테스트를 개발하면 정보 전문가보다 통계 학자에게 더 많이 떨어질 수 있지만 사용자가 데이터를 입력하고 테이블과 플롯을 생성 할 수있는 인터페이스를 디자인하면 통계 전문가보다 정보 전문가에게 더 많이 떨어질 것입니다.

통계 학자에게 컴퓨터는 통계를 도와주는 도구입니다. 정보 학자에게 통계는 (일반적으로 컴퓨터를 통해) 정보를 수집하고 배포하는 데 도움이되는 도구입니다.

여기 아래 편집 -----

확장하기 위해 여기에 예가 있습니다. 나는 의사가 환자에 대한 정보를 사용하여 어떤 상태의 위험을 예측하는 데 사용되는 시스템 (예 : 혈액 응고 현상)을 갖고 싶어하는 정보 학자 (통계 학자)와 프로젝트를 수행했으며 위험에 대해 알리십시오. 프로젝트 (통계 학자 역할)에서 나의 역할은 예측 변수가 주어진 위험을 예측하는 모델을 개발하는 것입니다 (물류 회귀 모델은 그러한 모델 중 하나입니다). 프로젝트에서 정보 주의적 역할은 예측 변수를 수집하고 내 모델을 사용한 다음 결과를 의사에게 보내는 도구를 개발하는 것입니다. 데이터는 전자 의료 기록 또는 간호사가 입력 할 수있는 데이터 입력 화면을 통해 수집 될 수 있습니다.

이제 나는 (그리고 다른 많은 통계 학자들) 데이터베이스를 쿼리하여 예측 변수를 얻고 어떤 유형의 경고를 만들 수있는 프로그래밍에 대해 충분히 알고 있지만, 정보 학자에게 맡기면 기쁘다. 로지스틱 회귀 모델에 맞는 충분한 통계를 알고있는 정보 학자가 있습니다. 따라서이 프로젝트의 간단한 버전은 통계학 자나 정보 학자 만 수행 할 수 있지만 둘 다 함께 작업 할 때 가장 좋습니다. 이 프로젝트를보고 모델링 부분이 재미있는 부분이고 데이터 수집, 경보 및 기타 인터페이스가 정보를 모델과주고받는 도구 일 뿐이라고 생각하면 통계 전문가가 될 수 있습니다. 인터페이스 디자인, 데이터 검색 최적화, 다양한 유형의 경고 테스트 등이 보이면


(+1) 나는이 답변의 균형을 좋아합니다. 나는 마지막 문장의 의도를 확실히 이해하지 못합니다.
추기경

1
나는 당신의 모범이 매우 훌륭하다고 생각합니다. 나는 그 부분을 위해 그것을 다시 공표 할 수 있기를 바란다. 건배.
추기경

당신의 예는 정말 멋지다. 고마워 이제 하나의 질문이 궁금합니다. 통계학 자의 경우 모든 통계 모델에 신뢰 구간 또는 가설 검정과 같은 추론 부분이 있어야하므로 확률 모델을 기반으로해야하는지 여부 그렇지 않으면, 플로팅 및 요약을 통해서만 데이터 세트를 조작합니다.
Honglang Wang 2016

9

통계 데이터에서 추론 합니다. 정보학 데이터에서 작동 합니다. 물론 그것들은 겹치지 만 더 큰 범위를 가진 문제는 답이 없습니다.


"통계는 데이터에서 추론하고 정보학은 데이터에서 작동합니다." 이것이 정말로 확인하고 싶은 것입니다. 추론의 경우 항상 확률 분포를 기반으로 신뢰 구간 또는 가설 검정을 포함해야합니다. 그렇지 않으면, 당신은 단지 데이터를 조작하고 있습니다.
Honglang Wang
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.