통계 및 빅 데이터

통계, 기계 학습, 데이터 분석, 데이터 마이닝 및 데이터 시각화에 관심있는 사람들을위한 Q & A


8
인과 관계는 상관 관계를 의미합니까?
상관 관계에 대한 많은 설명이있을 수 있으므로 상관 관계는 원인을 암시하지 않습니다. 그러나 인과 관계는 상관 관계를 의미합니까? 직관적으로, 인과 관계가 존재한다는 것은 반드시 상관 관계가 있음을 의미한다고 생각합니다. 그러나 내 직감이 통계에서 항상 나에게 도움이되지는 않았습니다. 인과 관계는 상관 관계를 의미합니까?

5
정규화와 표준화의 차이점은 무엇입니까?
직장 상사가 정규화에 대해 들어 본 적이 없으므로 직장에서 이것을 논의했습니다. 선형 대수에서 정규화는 벡터를 길이로 나누는 것으로 나타납니다. 통계에서 표준화는 평균을 빼고 SD로 나눈 것을 말합니다. 그러나 그들은 다른 가능성과도 상호 교환 가능한 것처럼 보입니다. 어떤 종류의 범용 점수를 만들 때 , 다른 수단과 다른 SD를 가진 가지 다른 …

9
선형 회귀 모형에서 절편을 제거해도되는 시점은 언제입니까?
선형 회귀 모델을 실행하고 절편 항을 제거하기위한 조건이 무엇인지 궁금합니다. 하나는 절편이 있고 다른 하나는 절편이없는 두 개의 서로 다른 회귀 분석 결과를 비교할 때 절편이없는 함수 의 가 훨씬 높다는 것을 알 수 있습니다. 절편 항의 제거가 유효한지 확인하기 위해 따라야하는 특정 조건이나 가정이 있습니까?아르 자형2R2R^2

9
기대 최대화를 이해하기위한 수치 예
EM 알고리즘을 잘 이해하고 구현하고 사용할 수 있도록 노력하고 있습니다. 나는 하루 종일 레이더에서 오는 위치 정보를 사용하여 항공기를 추적하는 데 EM과 이론을 읽었습니다. 솔직히 나는 기본 아이디어를 완전히 이해하지 못한다고 생각합니다. 누군가 가우시안 분포의 매개 변수 또는 정현파 시리즈의 시퀀스를 추정하거나 선을 맞추는 것과 같이 간단한 문제에 대해 EM의 …



16
1000 명 중 900 명이 자동차가 파란색이라고 말하면 파란색 일 확률은 얼마입니까?
처음에는 자연 텍스트를 분류하기 위해 모델에서 수행하는 일부 작업과 관련하여 발생했지만 단순화했습니다. 아마도 너무 많습니다. 당신은 파란 차를 가지고 있습니다 (일부 객관적인 과학적 척도-파란색입니다). 1000 명에게 보여줍니다. 900은 파란색이라고 말합니다. 하지 마십시오. 차를 볼 수없는 사람에게이 정보를 제공합니다. 그들이 아는 것은 900 명이 파란색이라고 말하고 100 명은 그렇지 않다는 것입니다. …
114 probability 



13
XKCD의 Frequentists vs. Bayesians 만화에 어떤 문제가 있습니까?
이 xkcd 만화 (Frequentists vs. Bayesians) 는 명백히 잘못된 결과를 도출하는 잦은 통계학자를 재미있게 만듭니다. 그러나 그의 추론은 그것이 표준 잦은 방법론을 따른다는 점에서 실제로 올바른 것 같습니다. 그래서 제 질문은 "자주주의 방법론을 올바르게 적용하고 있습니까?"입니다. 그렇지 않은 경우 :이 시나리오에서 올바른 잦은 추론은 무엇입니까? 잦은 방법론에서 태양 안정성에 대한 …

10
신경망과 딥 신경망의 차이점은 무엇이며 왜 깊은 네트워크가 더 잘 작동합니까?
이 용어로 질문이 정확하게 언급 된 것을 보지 못했기 때문에 새로운 질문을합니다. 내가 알고 싶은 것은 신경망의 정의가 아니라 깊은 신경망과의 실제 차이점을 이해하는 것입니다. 자세한 내용은 신경망이 무엇인지, 역 전파가 어떻게 작동하는지 알고 있습니다. DNN에 숨겨진 레이어가 여러 개 있어야한다는 것을 알고 있습니다. 그러나 10 년 전 클래스 I에서 …


1
PCA를 되돌리고 여러 주요 구성 요소에서 원래 변수를 재구성하는 방법은 무엇입니까?
PCA (Principal Component Analysis)를 사용하여 치수를 줄일 수 있습니다. 이러한 차원 축소가 수행 된 후 소수의 주요 구성 요소에서 원래 변수 / 기능을 어떻게 대략 재구성 할 수 있습니까? 또는 데이터에서 여러 주요 구성 요소를 어떻게 제거하거나 버릴 수 있습니까? 다시 말해 PCA를 어떻게 바꾸는가? PCA가 SVD (Singular Value Decomposition)와 …

19
가장 흥미로운 통계 역설
나는 그들이 매력적이라는 것을 알기 때문에,이 공동체의 사람들이 가장 흥미로운 통계적 역설과 그 이유를 알고 싶습니다.
112 paradox 

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.