통계 및 빅 데이터

4

로지스틱 분류기에서 기능 선택 (Softmax vs Sigmoid)을 결정하는 것은 무엇입니까? 4 개의 출력 클래스가 있다고 가정하십시오. 위의 각 함수는 각 클래스의 확률이 올바른 출력이되도록합니다. 그렇다면 분류자를 위해 어느 것을 사용해야합니까?

62 machine-learning logistic classification softmax

4

작은

몇몇 테스트에서 R, 온 하한치가 P 값 의 계산 2.22 ⋅ 10− 162.22⋅10−162.22 \cdot 10^{-16} . 그 이유가 무엇인지, 또는 임의의 이유인지 확실하지 않습니다. 다른 많은 통계 패키지는로 이동 0.0001하므로 훨씬 높은 수준의 정밀도입니다. 그러나 p < 2.22 ⋅ 10− 16피<2.22⋅10−16p < 2.22\cdot 10^{-16} 또는 보고하는 논문이 너무 많지 않았습니다 …

62 r p-value reporting precision

4

합의 분산이 분산의 합과 같습니까?

이 (항상) 사실입니까? Var(∑i=1mXi)=∑i=1mVar(Xi)?Var(∑i=1mXi)=∑i=1mVar(Xi)?\mathrm{Var}\left(\sum\limits_{i=1}^m{X_i}\right) = \sum\limits_{i=1}^m{\mathrm{Var}(X_i)} \>?

62 variance

3

최초의 표준 정규표는 누가 만들었습니까?

입문 통계 수업에서 표준 정규표를 소개하려고하는데 누가 처음 표준 정규표를 작성 했습니까? 컴퓨터가 나오기 전에 어떻게 했습니까? 나는 수천 명의 리만 총계를 손으로 계산하는 무차별 대인을 생각하고 떨었습니다.

61 normal-distribution algorithms history tables

5

Jeffreys가 이전에 유용한 이유는 무엇입니까?

Jeffreys 이전의 매개 변수를 다시 변경하면 변하지 않는다는 것을 알고 있습니다. 그러나 내가 이해하지 못하는 것은이 속성이 바람직한 이유입니다. 변수를 변경하여 이전을 변경하고 싶지 않은 이유는 무엇입니까?

61 bayesian prior

2

가능성 비율 대 Bayes Factor

주어진 현상에 대한 객관적인 증거를 표현하기위한 가능성 비율의 사용에 관해서는 오히려 복음 주의적입니다. 그러나 최근 베이 즈 요인이 베이지안 방법의 맥락에서 유사한 기능을 수행한다는 사실을 알게되었습니다 (즉, 주관적인 사전은 주관적인 베이 즈 요인과 결합되어 객관적으로 업데이트 된 주관적 신념 상태를 산출 함). 저는 우도 비율과 베이 즈 요인의 계산적 및 …

61 likelihood-ratio bayes-factors

10

"과학자들이 통계적 유의성에 반하여 올라간다"는 것은 무엇을 의미합니까? (자연 속의 주석)

자연 과학자 의 논평 제목은 다음 과 같이 통계적 중요성에 반 합니다. Valentin Amrhein, Sander Greenland, Blake McShane 및 800여 명의 서명자들은 과장된 주장의 종식과 중요한 영향의 해소를 요구합니다. 나중에 다음과 같은 문장이 포함됩니다. 다시, 우리는 P 값, 신뢰 구간 또는 기타 통계적 측정에 대한 금지를 옹호하지 않고 단지 범주 …

61 statistical-significance p-value bias

2

왜 세 개의 파티션입니까? (훈련, 검증, 테스트)

모델을 대규모 데이터 세트에 맞추려고 할 때 일반적인 조언은 데이터를 교육, 검증 및 테스트 데이터 세트의 세 부분으로 분할하는 것입니다. 이는 일반적으로 모델에 세 가지 "수준"매개 변수가 있기 때문입니다. 첫 번째 "매개 변수"는 모델 클래스 (예 : SVM, 신경망, 임의 포리스트)이고 두 번째 매개 변수 세트는 "규정 화"매개 변수 또는 …

61 machine-learning model-selection data-mining

5

수축 방법은 어떤 문제를 해결합니까?

연말 연시에는 통계 학습의 요소 (Elements of Statistical Learning)로 불 옆에서 몸을 구부릴 수있는 기회가 주어졌습니다 . (자주 주의적) 계량 경제학 관점에서 볼 때, 능선 회귀, 올가미 및 최소 각도 회귀 (LAR)와 같은 수축 방법의 사용을 파악하는 데 어려움을 겪고 있습니다. 일반적으로 매개 변수 추정 자체에 편견이 있거나 최소한 일관성을 …

61 lasso ridge-regression shrinkage lars

6

"중첩 된"모델과 "중첩되지 않은"모델의 차이점은 무엇입니까?

계층 적 / 다중 레벨 모델에 관한 문헌에서 나는 종종 "중첩 모델"과 "중첩 모델"에 대해 읽었지만 이것이 무엇을 의미합니까? 누구든지 나에게 몇 가지 예를 들거나이 문구의 수학적 의미에 대해 말해 줄 수 있습니까?

61 hypothesis-testing terminology nested-models nested-data

9

정규화 및 기능 확장은 어떻게, 왜 작동합니까?

많은 기계 학습 알고리즘이 평균 취소 및 공분산 이퀄라이제이션으로 더 잘 작동한다는 것을 알았습니다. 예를 들어 신경망은 더 빨리 수렴하는 경향이 있으며 K-Means는 일반적으로 사전 처리 된 기능으로 더 나은 클러스터링을 제공합니다. 이러한 사전 처리 단계의 직관이 성능 향상으로 이어지지는 않습니다. 누군가 나에게 이것을 설명 할 수 있습니까?

61 machine-learning neural-networks covariance normalization

7

여러 종속 변수를 사용한 회귀?

둘 이상의 종속 변수가있는 (복수) 회귀 방정식을 가질 수 있습니까? 물론, 각 DV마다 하나씩 두 개의 개별 회귀 방정식을 실행할 수 있지만 두 DV 사이의 관계를 포착하지 못하는 것 같습니까?

61 regression

6

덴드로 그램은 어디에서자를까요?

계층 적 군집화는 덴드로 그램으로 나타낼 수 있습니다. 덴드로 그램을 특정 수준으로 자르면 일련의 클러스터가 생깁니다. 다른 레벨에서 절단하면 다른 클러스터 세트가 제공됩니다. 덴드로 그램을자를 곳을 어떻게 선택 하시겠습니까? 최적의 포인트로 생각할 수있는 것이 있습니까? 덴드로 그램이 시간이 지남에 따라 변할 때 같은 지점에서 잘라야합니까?

61 clustering dendrogram

6

R을 사용한 올가미 예측의 표준 오차

예측을 위해 LASSO 모델을 사용하려고하는데 표준 오류를 추정해야합니다. 분명히 누군가가 이미 이것을하기 위해 패키지를 작성했습니다. 그러나 내가 알 수있는 한, LASSO를 사용하여 예측을 수행하는 CRAN의 패키지는 해당 예측에 대한 표준 오류를 반환하지 않습니다. 그래서 내 질문은 : 패키지 또는 일부 R 코드가 LASSO 예측에 대한 표준 오류를 계산할 수 있습니까?

60 r standard-error prediction lasso

4

GAM에 위도와 경도를 포함시키는 것이 공간 자기 상관을 설명하는 이유는 무엇입니까?

삼림 벌채를위한 일반화 된 첨가제 모델을 제작했습니다. 공간적 자기 상관을 설명하기 위해 위도와 경도를 부드러운 상호 작용 항 (예 : s (x, y))으로 포함 시켰습니다. 나는 저자들이 '공간 자기 상관을 설명하기 위해 점들의 좌표가 평활 한 용어로 포함되었다'고 말하는 많은 논문을 읽은 것에 근거하고 있지만, 이것이 왜 이것이 실제로 그것을 …

60 r modeling spatial autocorrelation gam