통계 및 빅 데이터

통계, 기계 학습, 데이터 분석, 데이터 마이닝 및 데이터 시각화에 관심있는 사람들을위한 Q & A


2
랜덤 포레스트 튜닝에 대한 실질적인 질문
내 질문은 랜덤 포레스트에 관한 것입니다. 이 아름다운 분류기의 개념은 나에게 분명하지만 여전히 실제적인 사용법 질문이 많이 있습니다. 불행히도, 나는 RF에 대한 실용적인 가이드를 찾지 못했습니다 (Geoffrey Hinton의 "제한된 Boltzman 기계 훈련을위한 실용 가이드"와 같은 것을 찾고 있었지만 임의의 숲)! 실제로 RF를 어떻게 튜닝 할 수 있습니까? 더 많은 수의 …

4
GLM의 "링크 기능"과 "정식 링크 기능"의 차이점은 무엇입니까?
'링크 기능'과 '정식 링크 기능'이라는 용어의 차이점은 무엇입니까? 또한, 하나를 다른 것보다 사용하는 (이론적) 장점이 있습니까? 예를 들어, 이진 응답 변수는 logit , probit 등과 같은 많은 링크 함수를 사용하여 모델링 할 수 있습니다 . 그러나 여기서 logit 은 "정식"링크 함수로 간주됩니다.

4
확률 분포의 '순간'에 대한 '순간'은 무엇입니까?
나는 순간이 무엇인지, 어떻게 계산하는지, 고순도 순간을 얻기 위해 순간 생성 기능을 사용하는 방법을 알고 있습니다. 예, 나는 수학을 알고 있습니다. 이제 통계 지식을 업무에 활용해야하므로이 질문을해도 좋을 것이라고 생각했습니다. 몇 년 동안 저를 잔소리하고 다시 대학에서 교수가 답을 알지 못했거나 질문을 기각하지 않았습니다. . 이 경우 "모멘트"라는 단어는 무엇을 …

18
통계 인터뷰 질문
가장 기본적인 것부터 더 진보 된 것까지 몇 가지 통계 (그리고 가능성이있는 것) 인터뷰 질문을 찾고 있습니다. 답변은 필요하지 않습니다 (이 사이트의 특정 질문에 대한 링크는 잘 작동하지만).


5
신경망에서 다중 등급, 다중 라벨 분류 작업에 어떤 손실 기능이 있습니까?
객체 집합을 n 클래스로 분류하기 위해 신경망을 훈련하고 있습니다. 각 객체는 동시에 여러 클래스에 속할 수 있습니다 (멀티 클래스, 멀티 레이블). 다중 클래스 문제의 경우 일반적으로 mse 대신 손실 함수로 softmax 및 categorical cross entropy를 사용하는 것이 좋습니다. 나는 그 이유를 다소 이해합니다. 다중 레이블에 대한 문제의 경우 각 클래스 …

12
신경망이 왜 그렇게 많은 훈련 예제를 필요로합니까?
2 세의 어린이는 색상, 제작 등에 관계없이 합리적인 정확도로 차량을 식별 할 수 있도록 약 5 대의 자동차가 필요합니다. 아들이 2 살이었을 때, 그는 보았지만 전차와 기차를 식별 할 수있었습니다 단지 몇 개. 그는 보통 서로를 혼동하고 있었기 때문에 그의 신경망은 충분히 훈련되지 않았지만 여전히 그렇습니다. 인공 신경망이 빠져서 더 …

5
수축에 대한 통일 된 견해 : Stein의 역설, 능선 회귀 및 혼합 모형의 임의 효과 간의 관계 (있는 경우)는 무엇입니까?
다음 세 가지 현상을 고려하십시오. Stein의 역설 : 다변량 정규 분포에서 얻은 일부 데이터를 감안할 때 표본 평균은 실제 평균을 잘 추정하지 못합니다. 표본 평균의 모든 좌표를 0 (또는 평균을 향하여 또는 내가 올바르게 이해하면 실제로는 임의의 값)으로 축소하면 평균 제곱 오차가 낮은 추정값을 얻을 수 있습니다.Rn,n≥3Rn,n≥3\mathbb R^n, \: n\ge …

8
R 언어는 경제 분야에서 신뢰할 수 있습니까?
저는 다른 유명한 통계 패키지 (주로 SPSS를 주로 사용)에서 R로 변환 한 경제학 대학원생입니다. 현재 내 작은 문제는 내가 수업 시간에 유일한 R 사용자라는 것입니다. 우리 반 친구들은 Stata와 Gauss를 사용하고 있으며 교수 중 한 명은 R이 공학에는 완벽하지만 경제에는 적합하지 않다고 말했습니다. 그는 많은 패키지는 프로그래밍에 대해 많이 알고 …

8
p- 값이 유용한 좋은 설득력있는 예는 무엇입니까?
제목에 대한 나의 질문은 자명하지만, 나는 약간의 맥락을 제시하고 싶습니다. ASA는 이번 주 초“ p- 값 : 맥락, 프로세스 및 목적 ” 에 관한 성명을 발표했으며 , p- 값에 대한 여러 가지 일반적인 오해를 설명하고, 문맥과 생각없이 사용하지 않도록주의 할 것을 요구했다. 모든 통계적 방법). Matloff 교수는 ASA에 대한 응답으로 …

4
2 차 IV를 추가하면 1 차 IV를 어떻게 중요하게 할 수 있습니까?
아마도 간단한 질문이 있지만 지금 당황하고 있습니다. 그래서 당신이 나를 도울 수 있기를 바랍니다. 하나의 독립 변수와 하나의 종속 변수가있는 최소 제곱 회귀 모델이 있습니다. 관계는 중요하지 않습니다. 이제 두 번째 독립 변수를 추가합니다. 이제 첫 번째 독립 변수와 종속 변수의 관계가 중요해집니다. 어떻게 작동합니까? 이것은 아마도 내 이해에 문제가 …

1
푸 아송 회귀 분석에서 계수를 해석하는 방법은 무엇입니까?
푸 아송 회귀 분석에서 주 효과 (더미 코딩 된 요인의 계수)를 해석하려면 어떻게해야합니까? 다음 예제를 가정하십시오. treatment <- factor(rep(c(1, 2), c(43, 41)), levels = c(1, 2), labels = c("placebo", "treated")) improved <- factor(rep(c(1, 2, 3, 1, 2, 3), c(29, 7, 7, 13, 7, 21)), levels = c(1, 2, 3), labels …

5
역 공분산 또는 정밀 행렬을 해석하는 방법은 무엇입니까?
농도 매트릭스 또는 정밀 매트릭스라고도하는 역 공분산 행렬의 요소 해석을 논의하는 참조를 누군가가 지적 할 수 있는지 궁금합니다. Cox와 Wermuth의 Multivariate Dependencies에 액세스 할 수 있지만 찾고있는 것은 역행렬의 각 요소에 대한 해석입니다. Wikipedia 상태 : "정밀 행렬의 요소는 부분 상관 관계 및 부분 분산 측면에서 해석됩니다." 이 페이지로 연결됩니다. …

1
첨자 표기법
측정 이론의 틀에서 조건부 기대치에서 아래 첨자 표기 의 정확한 의미는 무엇입니까 ? 이 첨자는 조건부 기대의 정의에는 나타나지 않지만 예를 들어 wikipedia의이 페이지 에서 볼 수 있습니다 . ( 몇 달 전 같은 페이지가 항상 그런 것은 아닙니다 .)EX[f(X)]EX[f(X)]\mathbb{E}_X[f(X)] 예를 들어 와 및 무엇입니까?EX[X+Y]EX[X+Y]\mathbb{E}_X[X+Y]X∼N(0,1)X∼N(0,1)X\sim\mathcal{N}(0,1)Y=X+1Y=X+1Y=X+1

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.