통계 및 빅 데이터

27

무료 통계 교과서가 있습니까?

119 teaching references

8

상관 관계에 대한 많은 설명이있을 수 있으므로 상관 관계는 원인을 암시하지 않습니다. 그러나 인과 관계는 상관 관계를 의미합니까? 직관적으로, 인과 관계가 존재한다는 것은 반드시 상관 관계가 있음을 의미한다고 생각합니다. 그러나 내 직감이 통계에서 항상 나에게 도움이되지는 않았습니다. 인과 관계는 상관 관계를 의미합니까?

118 correlation causality

5

정규화와 표준화의 차이점은 무엇입니까?

직장 상사가 정규화에 대해 들어 본 적이 없으므로 직장에서 이것을 논의했습니다. 선형 대수에서 정규화는 벡터를 길이로 나누는 것으로 나타납니다. 통계에서 표준화는 평균을 빼고 SD로 나눈 것을 말합니다. 그러나 그들은 다른 가능성과도 상호 교환 가능한 것처럼 보입니다. 어떤 종류의 범용 점수를 만들 때 , 다른 수단과 다른 SD를 가진 가지 다른 …

118 descriptive-statistics normalization standardization

9

선형 회귀 모형에서 절편을 제거해도되는 시점은 언제입니까?

선형 회귀 모델을 실행하고 절편 항을 제거하기위한 조건이 무엇인지 궁금합니다. 하나는 절편이 있고 다른 하나는 절편이없는 두 개의 서로 다른 회귀 분석 결과를 비교할 때 절편이없는 함수 의 가 훨씬 높다는 것을 알 수 있습니다. 절편 항의 제거가 유효한지 확인하기 위해 따라야하는 특정 조건이나 가정이 있습니까?아르 자형2R2R^2

118 regression linear-model r-squared intercept

9

기대 최대화를 이해하기위한 수치 예

EM 알고리즘을 잘 이해하고 구현하고 사용할 수 있도록 노력하고 있습니다. 나는 하루 종일 레이더에서 오는 위치 정보를 사용하여 항공기를 추적하는 데 EM과 이론을 읽었습니다. 솔직히 나는 기본 아이디어를 완전히 이해하지 못한다고 생각합니다. 누군가 가우시안 분포의 매개 변수 또는 정현파 시리즈의 시퀀스를 추정하거나 선을 맞추는 것과 같이 간단한 문제에 대해 EM의 …

117 regression probability mathematical-statistics intuition expectation-maximization

21

확률과 통계의 차이점은 무엇입니까?

확률과 통계의 차이점은 무엇이며 함께 연구하는 이유는 무엇입니까?

116 probability teaching mathematical-statistics

6

귀무 가설 하에서 p- 값이 균일하게 분포되는 이유는 무엇입니까?

최근에 나는 Klammer 등 의 논문 에서 발견했다 . p- 값이 균일하게 분포되어야한다는 진술. 저자들을 믿지만 왜 그런지 이해할 수 없습니다. Klammer, AA, Park, CY 및 Stafford Noble, W. (2009) SEQUEST XCorr 함수의 통계 보정 . 프로테옴 연구 저널 . 8 (4) : 2106-2113.

115 p-value uniform

16

1000 명 중 900 명이 자동차가 파란색이라고 말하면 파란색 일 확률은 얼마입니까?

처음에는 자연 텍스트를 분류하기 위해 모델에서 수행하는 일부 작업과 관련하여 발생했지만 단순화했습니다. 아마도 너무 많습니다. 당신은 파란 차를 가지고 있습니다 (일부 객관적인 과학적 척도-파란색입니다). 1000 명에게 보여줍니다. 900은 파란색이라고 말합니다. 하지 마십시오. 차를 볼 수없는 사람에게이 정보를 제공합니다. 그들이 아는 것은 900 명이 파란색이라고 말하고 100 명은 그렇지 않다는 것입니다. …

114 probability

3

회귀 분석에서 계수의 표준 오차는 어떻게 계산됩니까?

내 자신의 이해를 위해, 예를 들어의 lm()함수 출력과 함께 추정 계수의 표준 오차 계산을 수동으로 복제하는 데 관심이 R있지만 핀을 고정시킬 수는 없었습니다. 사용 된 공식 / 구현물은 무엇입니까?

114 r regression standard-error lm

2

다변량 정규 분포의 조건부 분포 도출

다변량 법선 벡터 있습니다. 칸막이 고려 \ boldsymbol의 \ (μ) 및 {\ boldsymbol Y를} 로 = \ {bmatrix} \ boldsymbol \ mu_1 \\ \ boldsymbol \ mu_2 \ 단부 {bmatrix}을 시작 \ boldsymbol MU \ {{\ boldsymbol Y가} = \ {bmatrix} 시작할 \ boldsymbol y} _1 \\ {\ boldsymbol y} …

114 normal-distribution conditional-probability

13

XKCD의 Frequentists vs. Bayesians 만화에 어떤 문제가 있습니까?

이 xkcd 만화 (Frequentists vs. Bayesians) 는 명백히 잘못된 결과를 도출하는 잦은 통계학자를 재미있게 만듭니다. 그러나 그의 추론은 그것이 표준 잦은 방법론을 따른다는 점에서 실제로 올바른 것 같습니다. 그래서 제 질문은 "자주주의 방법론을 올바르게 적용하고 있습니까?"입니다. 그렇지 않은 경우 :이 시나리오에서 올바른 잦은 추론은 무엇입니까? 잦은 방법론에서 태양 안정성에 대한 …

113 bayesian frequentist

10

신경망과 딥 신경망의 차이점은 무엇이며 왜 깊은 네트워크가 더 잘 작동합니까?

이 용어로 질문이 정확하게 언급 된 것을 보지 못했기 때문에 새로운 질문을합니다. 내가 알고 싶은 것은 신경망의 정의가 아니라 깊은 신경망과의 실제 차이점을 이해하는 것입니다. 자세한 내용은 신경망이 무엇인지, 역 전파가 어떻게 작동하는지 알고 있습니다. DNN에 숨겨진 레이어가 여러 개 있어야한다는 것을 알고 있습니다. 그러나 10 년 전 클래스 I에서 …

113 neural-networks deep-learning

4

비정규 데이터와 Pearson 또는 Spearman의 상관 관계

통계 컨설팅 작업에서이 질문을 충분히 자주 받았으며 여기에 게시 할 것이라고 생각했습니다. 나는 아래에 게시 된 답변을 받았지만 다른 사람들의 말을 듣고 싶어했습니다. 질문 : 정규 분포가 아닌 두 개의 변수가있는 경우 상관 관계에 Spearman 's rho를 사용해야합니까?

113 correlation normality-assumption pearson-r spearman-rho

1

PCA를 되돌리고 여러 주요 구성 요소에서 원래 변수를 재구성하는 방법은 무엇입니까?

PCA (Principal Component Analysis)를 사용하여 치수를 줄일 수 있습니다. 이러한 차원 축소가 수행 된 후 소수의 주요 구성 요소에서 원래 변수 / 기능을 어떻게 대략 재구성 할 수 있습니까? 또는 데이터에서 여러 주요 구성 요소를 어떻게 제거하거나 버릴 수 있습니까? 다시 말해 PCA를 어떻게 바꾸는가? PCA가 SVD (Singular Value Decomposition)와 …

113 pca dimensionality-reduction svd

19

가장 흥미로운 통계 역설

나는 그들이 매력적이라는 것을 알기 때문에,이 공동체의 사람들이 가장 흥미로운 통계적 역설과 그 이유를 알고 싶습니다.

112 paradox