통계 및 빅 데이터

통계, 기계 학습, 데이터 분석, 데이터 마이닝 및 데이터 시각화에 관심있는 사람들을위한 Q & A

10
잦은 사람들은 누구입니까?
우리는 이미 베이지안을 요구하는 스레드 와 잦은 주의자들이 베이지안을 요구하는 스레드를 가지고 있었지만, 빈번히 누구를 직접 묻는 스레드는 없었 습니까? 이것은 이 스레드에 대한 의견 으로 @whuber 가 물은 질문이며 답을 구걸합니다. 그것들이 존재합니까 (자체 식별되는 잦은 사람들이 있습니까)? 아마 그들은 주류 통계를 비판 할 때 비난을 받아야 할 희생양이 …


3
lmer에서 랜덤 효과가 어떻게 지정되는지에 대한 질문
최근에 단어를 다른 상황에서 볼 때 ERP (EEG)를 측정하여 반복 노출 (연습 : 1 일에서 10 일까지)에 대해 새로운 단어의 의미를 얻는 방법을 측정했습니다. 또한 문맥의 속성, 예를 들어 새로운 단어의 의미 (높음 대 낮음)의 발견에 대한 유용성을 제어했습니다. 특히 연습의 효과에 관심이 있습니다 (일). 개별 ERP 기록은 시끄럽기 때문에 …

9
고급 통계 책 추천
이 사이트에는 입문 통계 및 기계 학습 에 대한 책 권장 사항에 대한 몇 가지 스레드가 있지만 최대 가능성, 일반 선형 모델, 주요 구성 요소 분석, 비선형 모델을 포함하여 고급 통계에 대한 텍스트를 찾고 있습니다. 나는 AC Davison의 통계 모델 을 시도 했지만 솔직히 2 장 후에 내려 놓아야했습니다. 이 …


7
로지스틱 회귀 분석 (Cox & Snell 또는 Nagelkerke)에 대해 어떤 의사
나는이 SPSS로지스틱 회귀 모델의 출력을. 출력은 모델에 맞게 두 가지 대책을보고 Cox & Snell하고 Nagelkerke. 그래서 이들의 엄지 손가락의 규칙, 같은 당신이 모델에 맞는으로보고 할 조치?아르 자형2R²R^² 또는 일반적으로 저널에보고되는 지수 중 어느 것이 적합한 지수입니까? 일부 배경 : 회귀는 일부 환경 변수 (예 : 가파름, 초목 덮개 등)에서 조류 …

6
R에서 로지스틱 회귀에 대한 대안
로지스틱 회귀와 동일한 작업을 수행하는 많은 알고리즘을 원합니다. 그것은 설명 변수 (X)가있는 이진 반응 (Y)에 대한 예측을 제공 할 수있는 알고리즘 / 모델입니다. 알고리즘 이름을 지정한 후에 R에서 알고리즘을 구현하는 방법을 보여 주면 기쁠 것입니다. 다른 모델로 업데이트 할 수있는 코드는 다음과 같습니다. set.seed(55) n <- 100 x <- c(rnorm(n), …

5
시계열 예측에 딥 러닝 사용
나는 딥 러닝 분야에서 새로운 것이었고 첫 번째 단계는 deeplearning.net 사이트에서 흥미로운 기사를 읽는 것이 었습니다. 딥 러닝에 관한 논문에서 Hinton과 다른 사람들은 대부분 이미지 문제에 적용하는 것에 대해 이야기합니다. 누군가 내게 대답하려고 할 때 시계열 값 (재무, 인터넷 트래픽 등)을 예측하는 문제에 적용 할 수 있습니까? 가능한 경우 집중해야 …

9
데이터 과학에서 R과 Python은 어떻게 서로를 보완합니까?
많은 튜토리얼이나 매뉴얼에서 서술은 R과 파이썬이 분석 프로세스의 보완 구성 요소로 공존한다는 것을 암시하는 것으로 보입니다. 그러나 훈련받지 않은 눈에는 두 언어가 똑같은 일을하는 것처럼 보입니다. 내 질문은 두 언어에 대한 전문화 된 틈새가 있는지 아니면 하나를 사용할 것인지 개인적으로 선호하는 것입니까?
54 r  python  software 

2
Fisher 정보 매트릭스 및 Hessian 및 표준 오류와의 관계에 대한 기본 질문
좋아, 이것은 매우 기본적인 질문이지만 조금 혼란 스럽습니다. 내 논문에서 나는 다음과 같이 쓴다. 표준 오차는 (관측 된) 피셔 정보 매트릭스의 대각선 요소의 제곱근의 역수를 계산하여 찾을 수 있습니다. sμ^,σ^2=1I(μ^,σ^2)−−−−−−√sμ^,σ^2=1I(μ^,σ^2)\begin{align*} s_{\hat{\mu},\hat{\sigma}^2}=\frac{1}{\sqrt{\mathbf{I}(\hat{\mu},\hat{\sigma}^2)}} \end{align*} R의 최적화 명령이 최소화하기 때문에 Hessian의 역수를 계산하여 (관측 된) Fisher 정보 매트릭스를 찾을 수 있습니다. −logL−log⁡L-\log\mathcal{L}I(μ^,σ^2)=H−1I(μ^,σ^2)=H−1\begin{align*} \mathbf{I}(\hat{\mu},\hat{\sigma}^2)=\mathbf{H}^{-1} …

9
평신도가 종종 분석을 수행하는 시대에 모델 가정과 평가의 중요성을 과장하고 있습니까?
결론적으로 , 통계에 대해 더 많이 배울수록 내 분야의 논문을 신뢰하는 것이 줄어 듭니다. 나는 연구원들이 통계를 충분히 잘하지 못한다고 생각합니다. 저는 평신도입니다. 저는 생물학 교육을 받았지만 통계 나 수학에 대한 공식 교육은 없습니다. 나는 R을 즐기고 종종 연구를 할 때 적용하는 방법의 이론적 기초를 읽고 이해하려고 노력합니다. 오늘날 분석을 …


3
피처 선택에 PCA (Principal Component Analysis) 사용
저는 기능 선택을 처음 사용했으며 PCA를 사용하여 기능 선택을 수행하는 방법이 궁금합니다. PCA는 정보가없는 입력 변수를 필터링하는 데 사용할 수있는 각 입력 변수에 대한 상대 점수를 계산합니까? 기본적으로 포함 된 정보의 양 또는 차이에 따라 데이터의 원래 기능을 주문할 수 있기를 원합니다.

5
다른 답변을 제공하는 베이지안 및 잦은 접근의 예
참고 : 나는 나는 알고 철학적 베이지안 및 빈도주의 통계의 차이. 예를 들어 "테이블의 동전이 머리 일 확률은 얼마입니까?"라는 말은 이미 머리 나 꼬리가 착륙 했으므로 잦은 통계에서는 의미가 없습니다. 따라서이 질문은 빈번한 용어로는 답이 없습니다. 그러나 그러한 차이는 특히 내가 요구 하는 차이가 아닙니다 . 오히려, 나는 그들의 예측 …

8
'빅 데이터'시점에서 샘플링이 관련이 있습니까?
아니면 더 "그렇게 될까"? 빅 데이터 는 통계와 관련 지식을 더욱 중요하게하지만 샘플링 이론을 수행하는 것으로 보입니다. 나는 '빅 데이터'에 대한이 과대 광고를 보았고 "왜"가 모든 것을 분석하고 싶은지 궁금해 할 수 없습니다 . "샘플링 이론"을 설계 / 구현 / 발명 / 발견 할 이유가 없었습니까? 데이터 세트의 전체 '인구'를 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.