통계 및 빅 데이터

1

내가 들었던 다음 이미지는 사후 확률 분포가 어떻게 사전 분포와 우도 분포의 조합인지를 보여줍니다. 이미지에 문제가 있다는 말을 들었습니다. 즉, 사후 분포는 우도 함수의 형태로 주어진 형태를 가질 수 없습니다. 그러나 나는 이미지에 무엇이 잘못되었는지 생각하기 위해 고심하고 있습니다. 후자는 가능성이있는 것으로 보이지만 이전 분포에 의해 오른쪽으로 당겨집니다. 이것은 무엇이 …

17 distributions posterior

2

숫자 / 범주 값을 모두 사용하여 R에서 순서 형 로지스틱 회귀 분석을 어떻게 실행합니까?

기본 데이터 : '1,'[good] '2,'[middle] 또는 '3'[bad]와 같이 평가 대상으로 ~ 1,000 명을 보유하고 있습니다. 이는 미래에 사람들에게 예측하려는 값입니다. . 또한 성별 (범주 : M / F), 연령 (숫자 : 17-80) 및 인종 (범주 : 흑인 / 백인 / 라티노)과 같은 인구 통계 정보가 있습니다. 주로 네 가지 질문이 …

17 r regression logistic missing-data ordered-logit

2

이 적합치 대 잔차 그림을 어떻게 해석합니까?

나는 이분산성을 정말로 이해하지 못한다. 이 플롯에 따라 모델이 적합한 지 여부를 알고 싶습니다.

17 r regression residuals heteroscedasticity independence

3

자동 인코더가 필요한 이유는 무엇입니까?

최근에는 자동 인코더를 연구하고 있습니다. 내가 올바르게 이해한다면, 자동 인코더는 입력 레이어가 출력 레이어와 동일한 신경망입니다. 따라서 신경망은 입력을 황금 표준으로 사용하여 출력을 예측하려고 시도합니다. 이 모델의 유용성은 무엇입니까? 일부 출력 요소를 재구성하여 입력 요소와 최대한 동일하게 만들면 어떤 이점이 있습니까? 왜이 기계를 모두 사용하여 같은 출발점에 도달해야합니까?

17 neural-networks autoencoders

2

Poisson GLM이 정수가 아닌 숫자를 어떻게 받아 들일 수 있습니까?

Poisson GLM이 정수가 아닌 숫자를 허용한다는 사실에 정말 놀랐습니다! 보기: 데이터 (의 내용 data.txt) : 1 2001 0.25 1 1 2002 0.5 1 1 2003 1 1 2 2001 0.25 1 2 2002 0.5 1 2 2003 1 1 R 스크립트 : t <- read.table("data.txt") names(t) <- c('site', 'year', 'count', …

17 r generalized-linear-model poisson-distribution poisson-regression

4

사이의 관계

R 2 사이에 관계가 있는지 궁금합니다R2R2R^2 와 F-Test . 일반적으로 R2=∑(Y^t−Y¯)2/T−1∑(Yt−Y¯)2/T−1R2=∑(Y^t−Y¯)2/T−1∑(Yt−Y¯)2/T−1R^2=\frac {\sum (\hat Y_t - \bar Y)^2 / T-1} {\sum( Y_t - \bar Y)^2 / T-1} 이며 회귀에서 선형 관계의 강도를 측정합니다. F- 검정은 단지 가설을 입증합니다. R2R2R^2 와 F- 검정 사이에는 관계가 있습니까?

17 regression hypothesis-testing least-squares goodness-of-fit

3

다차원 클러스터 데이터를 시각적으로 표시

16 개의 변수가있는 데이터 세트가 있으며 kmeans로 클러스터링 한 후 두 그룹을 플로팅하려고합니다. 두 군집을 시각적으로 표현하기 위해 어떤 도표를 제안 하시겠습니까?

17 data-visualization clustering k-means

1

Borel의 역설을 정신적으로 어떻게 다루어야합니까?

나는 Borel의 역설과 조건부 확률을 다루는 다른 "역설"을 정신적으로 다루는 방법에 약간 불안감을 느낀다. 잘 모르는 사람은 이 링크를 참조하십시오 . 이 시점까지의 나의 정신적 반응은 아무도 그것에 대해 이야기하는 것 같지 않기 때문에 그것을 무시하는 것이었지만, 나는 이것을 교정해야한다고 생각합니다. 우리는이 역설이 존재한다는 것을 알고 있지만 실제로는 (예를 들어 …

17 probability conditional-probability conditional-expectation

5

k- 평균이 왜 세계 최소값을 제공하지 않습니까?

k- 평균 알고리즘은 전역 최소값이 아닌 로컬 최소값으로 만 수렴된다는 것을 읽었습니다. 왜 이런거야? 논리적으로 초기화가 최종 클러스터링에 영향을 줄 수있는 방법을 생각할 수 있으며 하위 최적 클러스터링의 가능성이 있지만 수학적으로 증명할 수있는 것은 찾지 못했습니다. 또한 k- 평균은 왜 반복 과정입니까? 목적 함수 wrt를 중심과 부분적으로 구별 할 수없고,이 …

17 clustering k-means convergence gradient-descent minimum

3

R의 피팅 t- 분포 : 스케일링 파라미터

t- 분포의 모수, 즉 정규 분포의 '평균'및 '표준 편차'에 해당하는 모수를 어떻게 적합합니까? 나는 그것들을 t- 분포에 대해 '평균'과 '확장 / 자유도'라고 부릅니다. 다음 코드는 종종 '최적화 실패'오류를 발생시킵니다. library(MASS) fitdistr(x, "t") x를 먼저 스케일하거나 확률로 변환해야합니까? 최선을 다하는 방법?

17 r distributions maximum-likelihood fitting robust

5

t- 통계량이 너무 클 때 R- 제곱이 왜 이렇게 낮습니까?

나는 4 개의 변수로 회귀를 실행했으며 T 값이 ≈7,9,26≈7,9,26\approx 7,9,26 및 313131 모든 통계적으로 매우 중요 합니다 (십진수를 포함하지 않는 것처럼 보이므로 라고 말합니다 ). 매우 높고 명확합니다. 그러나 는 단지 .2284입니다. 여기서 t 값을 잘못 해석하여 그렇지 않은 것을 의미합니까? t 값을 보았을 때의 첫 번째 반응은 가 상당히 …

17 regression hypothesis-testing econometrics

1

모멘트 생성 기능과 특성 기능 간의 연결

모멘트 생성 기능과 특성 기능 간의 연결을 이해하려고합니다. 모멘트 생성 함수는 다음과 같이 정의됩니다 : MX(t)=E(exp(tX))=1+tE(X)1+t2E(X2)2!+⋯+tnE(Xn)n!MX(t)=E(exp⁡(tX))=1+tE(X)1+t2E(X2)2!+⋯+tnE(Xn)n! M_X(t) = E(\exp(tX)) = 1 + \frac{t E(X)}{1} + \frac{t^2 E(X^2)}{2!} + \dots + \frac{t^n E(X^n)}{n!} exp ( t X ) 의 연속 확장 사용 = ∑ ∞ 0 ( t ) n ⋅ …

17 probability moments mgf method-of-moments characteristic-function

1

정렬 된 로지스틱 회귀 분석에서 음의 계수

우리는 순서 응답이 가정 변수의 집합 X : = [ X 1 , X 2 , X 3 ] 우리가 생각하는 것을 설명 할 것이다 Y를 . 그런 다음 y 에 대해 X (디자인 행렬) 의 순서화 된 로지스틱 회귀 분석을 수행합니다.y:{Bad, Neutral, Good}→{1,2,3}y:{Bad, Neutral, Good}→{1,2,3}y:\{\text{Bad, Neutral, Good}\} \rightarrow \{1,2,3\}X:=[x1,x2,x3]X:=[x1,x2,x3]X:=[x_1,x_2,x_3]yyyXXXyyy …

17 logit odds-ratio ordered-logit

8

보간은 회귀 개념과 어떤 관련이 있습니까?

보간이란 무엇을 의미하며 회귀 개념과 어떤 관련이 있습니까? 보간은 표의 선 사이를 읽는 기술이며, 기초 수학에서이 용어는 일반적으로 해당 함수의 주어진 값 또는 테이블 값 세트에서 함수의 중간 값을 계산하는 프로세스를 나타냅니다. 나는 두 번째 질문에 대한 답을 줄 수 없습니다. 도와주세요

17 regression self-study interpolation

3

표준 오류는 어떻게 작동합니까?

나는 최근에 표준 오류의 내부 작동을 조사해 왔으며 그것이 어떻게 작동하는지 이해할 수 없다는 것을 알게되었습니다. 표준 오차에 대한 나의 이해는 그것이 표본 평균 분포의 표준 편차라는 것입니다. 내 질문은 : • 일반적으로 단일 표본 만 채취 할 때 표준 오차가 표본 평균의 표준 편차임을 어떻게 알 수 있습니까? • …

17 standard-error