통계 및 빅 데이터

통계, 기계 학습, 데이터 분석, 데이터 마이닝 및 데이터 시각화에 관심있는 사람들을위한 Q & A

1
이 사후 분포의 예에서 무엇이 문제입니까?
내가 들었던 다음 이미지는 사후 확률 분포가 어떻게 사전 분포와 우도 분포의 조합인지를 보여줍니다. 이미지에 문제가 있다는 말을 들었습니다. 즉, 사후 분포는 우도 함수의 형태로 주어진 형태를 가질 수 없습니다. 그러나 나는 이미지에 무엇이 잘못되었는지 생각하기 위해 고심하고 있습니다. 후자는 가능성이있는 것으로 보이지만 이전 분포에 의해 오른쪽으로 당겨집니다. 이것은 무엇이 …

2
숫자 / 범주 값을 모두 사용하여 R에서 순서 형 로지스틱 회귀 분석을 어떻게 실행합니까?
기본 데이터 : '1,'[good] '2,'[middle] 또는 '3'[bad]와 같이 평가 대상으로 ~ 1,000 명을 보유하고 있습니다. 이는 미래에 사람들에게 예측하려는 값입니다. . 또한 성별 (범주 : M / F), 연령 (숫자 : 17-80) 및 인종 (범주 : 흑인 / 백인 / 라티노)과 같은 인구 통계 정보가 있습니다. 주로 네 가지 질문이 …


3
자동 인코더가 필요한 이유는 무엇입니까?
최근에는 자동 인코더를 연구하고 있습니다. 내가 올바르게 이해한다면, 자동 인코더는 입력 레이어가 출력 레이어와 동일한 신경망입니다. 따라서 신경망은 입력을 황금 표준으로 사용하여 출력을 예측하려고 시도합니다. 이 모델의 유용성은 무엇입니까? 일부 출력 요소를 재구성하여 입력 요소와 최대한 동일하게 만들면 어떤 이점이 있습니까? 왜이 기계를 모두 사용하여 같은 출발점에 도달해야합니까?


4
사이의 관계
R 2 사이에 관계가 있는지 궁금합니다R2R2R^2 와 F-Test . 일반적으로 R2=∑(Y^t−Y¯)2/T−1∑(Yt−Y¯)2/T−1R2=∑(Y^t−Y¯)2/T−1∑(Yt−Y¯)2/T−1R^2=\frac {\sum (\hat Y_t - \bar Y)^2 / T-1} {\sum( Y_t - \bar Y)^2 / T-1} 이며 회귀에서 선형 관계의 강도를 측정합니다. F- 검정은 단지 가설을 입증합니다. R2R2R^2 와 F- 검정 사이에는 관계가 있습니까?


1
Borel의 역설을 정신적으로 어떻게 다루어야합니까?
나는 Borel의 역설과 조건부 확률을 다루는 다른 "역설"을 정신적으로 다루는 방법에 약간 불안감을 느낀다. 잘 모르는 사람은 이 링크를 참조하십시오 . 이 시점까지의 나의 정신적 반응은 아무도 그것에 대해 이야기하는 것 같지 않기 때문에 그것을 무시하는 것이었지만, 나는 이것을 교정해야한다고 생각합니다. 우리는이 역설이 존재한다는 것을 알고 있지만 실제로는 (예를 들어 …

5
k- 평균이 왜 세계 최소값을 제공하지 않습니까?
k- 평균 알고리즘은 전역 최소값이 아닌 로컬 최소값으로 만 수렴된다는 것을 읽었습니다. 왜 이런거야? 논리적으로 초기화가 최종 클러스터링에 영향을 줄 수있는 방법을 생각할 수 있으며 하위 최적 클러스터링의 가능성이 있지만 수학적으로 증명할 수있는 것은 찾지 못했습니다. 또한 k- 평균은 왜 반복 과정입니까? 목적 함수 wrt를 중심과 부분적으로 구별 할 수없고,이 …

3
R의 피팅 t- 분포 : 스케일링 파라미터
t- 분포의 모수, 즉 정규 분포의 '평균'및 '표준 편차'에 해당하는 모수를 어떻게 적합합니까? 나는 그것들을 t- 분포에 대해 '평균'과 '확장 / 자유도'라고 부릅니다. 다음 코드는 종종 '최적화 실패'오류를 발생시킵니다. library(MASS) fitdistr(x, "t") x를 먼저 스케일하거나 확률로 변환해야합니까? 최선을 다하는 방법?

5
t- 통계량이 너무 클 때 R- 제곱이 왜 이렇게 낮습니까?
나는 4 개의 변수로 회귀를 실행했으며 T 값이 ≈7,9,26≈7,9,26\approx 7,9,26 및 313131 모든 통계적으로 매우 중요 합니다 (십진수를 포함하지 않는 것처럼 보이므로 라고 말합니다 ). 매우 높고 명확합니다. 그러나 는 단지 .2284입니다. 여기서 t 값을 잘못 해석하여 그렇지 않은 것을 의미합니까? t 값을 보았을 때의 첫 번째 반응은 가 상당히 …

1
모멘트 생성 기능과 특성 기능 간의 연결
모멘트 생성 기능과 특성 기능 간의 연결을 이해하려고합니다. 모멘트 생성 함수는 다음과 같이 정의됩니다 : MX(t)=E(exp(tX))=1+tE(X)1+t2E(X2)2!+⋯+tnE(Xn)n!MX(t)=E(exp⁡(tX))=1+tE(X)1+t2E(X2)2!+⋯+tnE(Xn)n! M_X(t) = E(\exp(tX)) = 1 + \frac{t E(X)}{1} + \frac{t^2 E(X^2)}{2!} + \dots + \frac{t^n E(X^n)}{n!} exp ( t X ) 의 연속 확장 사용 = ∑ ∞ 0 ( t ) n ⋅ …

1
정렬 된 로지스틱 회귀 분석에서 음의 계수
우리는 순서 응답이 가정 변수의 집합 X : = [ X 1 , X 2 , X 3 ] 우리가 생각하는 것을 설명 할 것이다 Y를 . 그런 다음 y 에 대해 X (디자인 행렬) 의 순서화 된 로지스틱 회귀 분석을 수행합니다.y:{Bad, Neutral, Good}→{1,2,3}y:{Bad, Neutral, Good}→{1,2,3}y:\{\text{Bad, Neutral, Good}\} \rightarrow \{1,2,3\}X:=[x1,x2,x3]X:=[x1,x2,x3]X:=[x_1,x_2,x_3]yyyXXXyyy …

8
보간은 회귀 개념과 어떤 관련이 있습니까?
보간이란 무엇을 의미하며 회귀 개념과 어떤 관련이 있습니까? 보간은 표의 선 사이를 읽는 기술이며, 기초 수학에서이 용어는 일반적으로 해당 함수의 주어진 값 또는 테이블 값 세트에서 함수의 중간 값을 계산하는 프로세스를 나타냅니다. 나는 두 번째 질문에 대한 답을 줄 수 없습니다. 도와주세요

3
표준 오류는 어떻게 작동합니까?
나는 최근에 표준 오류의 내부 작동을 조사해 왔으며 그것이 어떻게 작동하는지 이해할 수 없다는 것을 알게되었습니다. 표준 오차에 대한 나의 이해는 그것이 표본 평균 분포의 표준 편차라는 것입니다. 내 질문은 : • 일반적으로 단일 표본 만 채취 할 때 표준 오차가 표본 평균의 표준 편차임을 어떻게 알 수 있습니까? • …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.