통계 및 빅 데이터

통계, 기계 학습, 데이터 분석, 데이터 마이닝 및 데이터 시각화에 관심있는 사람들을위한 Q & A

6
탐색 적 데이터 분석에서 텍사스의 명사수
나는 데이터 분석의 맥락에서 일부 오류가 설명되는 Nature 에서이 기사를 읽었습니다 . 텍사스 샤프 슈터 오류는 피하는 것이 특히 어렵다는 것을 알았습니다. 데이터 분석 중에 기다리는인지 적 함정은 텍사스 샤프 슈터의 우화에 의해 설명됩니다 : 헛간 측면에서 임의의 총알 패턴을 발사하고 가장 큰 총알 구멍 덩어리 주위에 표적을 그리고 그의 …
23 eda  fallacy 

3
이 배포판에 이름이 있습니까?
오늘 나에게 분포 를 위해, 가우시안 및 라플라스 분포 간의 타협으로 간주 될 수있는X∈R,P∈[1,2]와β>0이름은 않는 그런 분포 했는가? 정규화 상수에 대한 표현식이 있습니까? 적분1=C⋅∫ ∞ − ∞ exp(−|x−μ | p에서C에 대한 해를 구하는 방법조차 모르기 때문에 미적분학이 저를쿵쾅거립니다.f(x)∝exp(−|x−μ|pβ)f(x)∝exp⁡(−|x−μ|pβ) f(x)\propto\exp\left(-\frac{|x-\mu|^p}{\beta}\right) x ∈ R , p ∈ [ 1 , 2 ]엑스∈아르 …

3
스택 형 컨볼 루션 오토 인코더의 아키텍처는 무엇입니까?
그래서 나는 convolutional net을 사용하여 인간의 이미지에 대해 사전 훈련을하려고합니다. 나는 논문 ( Paper1 및 Paper2 ) 과이 stackoverflow link를 읽었 지만 그물의 구조를 이해하고 있는지 잘 모르겠습니다 (논문에 잘 정의되어 있지 않습니다). 질문 : 입력과 노이즈 레이어, 컨볼 루션 레이어, 풀링 레이어를 차례로 가질 수 있는데, 출력을하기 전에 풀링을 …

2
MLE을 사용하여 신경망 가중치를 추정 할 수 있습니까?
방금 통계와 모델에 대해 공부하기 시작했습니다. 현재 MLE을 사용하여 모델에 가장 적합한 모수를 추정한다는 것을 알고 있습니다. 그러나 신경망의 작동 방식을 이해하려고하면 매개 변수를 추정하기 위해 다른 접근법을 일반적으로 사용하는 것처럼 보입니다. 왜 MLE를 사용하지 않습니까? 아니면 MLE을 전혀 사용할 수 없습니까?

4
수학자를위한 머신 러닝 소개
어떤 의미에서 이것은 math.stackexchange 에서 얻은 크로스 포스트이며이 사이트가 광범위한 대상을 제공 할 수 있다고 생각합니다. 기계 학습에 대한 수학적 소개를 찾고 있습니다. 특히, 찾을 수있는 많은 문헌은 비교적 부정확하며 많은 페이지가 내용없이 사용됩니다. 그러나 문학에서 시작, 내가 발견 한 코 세라의 앤드류 응, 패턴 인식에 주교의 책과 Smola의 마지막 …

1
비선형 대 일반 선형 모형 : 로지스틱, 포아송 등 회귀를 어떻게 참조합니까?
동료 통계학 자의 의견을 듣고 싶은 의미론에 대한 질문이 있습니다. 우리는 로지스틱, 포아송 등과 같은 모델이 일반화 된 선형 모델의 우산에 속한다는 것을 알고 있습니다. 모델에는 매개 변수의 비선형 함수가 포함되어 있으며, 적절한 링크 함수를 사용하여 선형 모델 프레임 워크를 사용하여 모델링 할 수 있습니다. 로지스틱 회귀와 같은 상황을 다음과 …

3
분산 및 바이어스 제곱으로의 MSE 분해
MSE가 분산과 바이어스의 제곱으로 분해 될 수 있음을 보여주기 위해 Wikipedia의 증거는 그림에서 강조된 단계가 있습니다. 어떻게 작동합니까? 3 단계에서 4 단계로 제품에 대한 기대 수준은 어떻습니까? 두 용어가 서로 독립적 인 경우 두 용어 모두에 기대치를 적용해서는 안됩니까? 그렇지 않은 경우이 단계가 유효합니까?

1
공분산 행렬을 사용하여 다중 회귀에 대한 계수를 찾는 방법이 있습니까?
간단한 선형 회귀 분석의 경우 회귀 계수는 분산 공분산 행렬 에서 의해 직접 계산할 수 있습니다. 여기서 는 종속 변수의 인덱스이고 는 설명 변수의 인덱스입니다.CCCCd,eCe,eCd,eCe,e C_{d, e}\over C_{e,e} dddeee 공분산 행렬 만있는 경우 여러 설명 변수가있는 모형의 계수를 계산할 수 있습니까? ETA : 두 개의 설명 변수의 경우 및 와 …



6
모델을 피팅 할 때 일반적으로 SSE (Sum of Square Error)를 최소화하도록 선택하는 이유는 무엇입니까?
문제는 매우 간단합니다. 왜 선형 또는 비선형 데이터에 모델을 맞추려고 할 때 일반적으로 모델 매개 변수에 대한 추정값을 얻기 위해 오차 제곱의 합을 최소화하려고합니까? 최소화하기 위해 다른 목적 함수를 선택하지 않겠습니까? 기술적 인 이유로 2 차 함수는 다른 함수 (예 : 절대 편차의 합)보다 우수하다는 것을 이해합니다. 그러나 이것은 여전히 …

4
R에서 정확한 두 표본 비율 이항 테스트 (및 일부 이상한 p- 값)
다음 질문을 해결하려고합니다. A 선수는 25 경기 중 17 승, B 선수는 20 명 중 8 승을 기록했습니다. 두 비율 사이에 큰 차이가 있습니까? R에서해야 할 일은 다음과 같습니다. > prop.test(c(17,8),c(25,20),correct=FALSE) 2-sample test for equality of proportions without continuity correction data: c(17, 8) out of c(25, 20) X-squared = 3.528, …


1
Fisher 분포에 대한 푸리에 변환 반전
Fisher 분포 의 특성 함수 는 다음과 같습니다. C ( t ) = Γ ( α + 1F(1,α)F(1,α)\mathcal{F}(1,\alpha) 여기서,U는은 IS합류 초기 하 함수. I는 푸리에 역변환 (가) 변환을 해결하기 위해 노력하고F-1t,X의n 개의-convolution변수의 밀도 회복X가: 인 F-1t,X(C(t)N) 얻는 목적을 합계의 분포N랜덤 변수 피셔 분포. 누군가 해결하기가 매우 어려워 보이는 아이디어가 있는지 …

1
선험적 전력 분석은 본질적으로 쓸모 없는가?
저는 지난주 에 성격 및 사회 심리학 협회 회의에 참석하여 Uri Simonsohn이 선험적 힘 분석을 사용하여 표본 크기를 결정하는 것은 그 결과가 가정에 너무 민감하기 때문에 본질적으로 쓸모가 없다는 전제와의 대화를 보았습니다. 물론,이 주장은 내가 방법론 수업에서 배운 것과 많은 저명한 방법 론자들 (대부분 Cohen, 1992 ) 의 권고에 위배 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.