통계 및 빅 데이터

통계, 기계 학습, 데이터 분석, 데이터 마이닝 및 데이터 시각화에 관심있는 사람들을위한 Q & A


5
개별 연구원은 허위 발견 률에 대해 어떻게 생각해야합니까?
나는 FDR (False Discovery Rate)이 어떻게 개별 연구원의 결론을 알려야하는지에 대해 고심했습니다. 예를 들어 연구에 힘이 부족한 경우 에서 유의미한 결과라도 할인해야 합니까? 참고 : 여러 테스트 수정 방법이 아니라 여러 연구 결과를 종합적으로 검사하는 맥락에서 FDR에 대해 이야기하고 있습니다.α=.05α=.05\alpha = .05 검정 된 가설의 가 실제로 참 이라고 관대하게 …

6
로지스틱 회귀와 퍼셉트론의 차이점은 무엇입니까?
앤드류 응의 머신 러닝 강의 노트 를 보겠습니다 . 메모는 우리에게 로지스틱 회귀와 퍼셉트론을 소개합니다. Perceptron을 설명하는 동안 메모는 로지스틱 회귀에 사용되는 임계 값 함수의 정의 만 변경한다고 말합니다. 그런 다음 Perceptron 모델을 사용하여 분류 할 수 있습니다. 내 질문은-이것이 지정되어야하고 Perceptron을 분류 기술로 고려한다면 로지스틱 회귀는 정확히 무엇입니까? 클래스 …

3
같은 모집단에서 두 개의 표본을 추출했는지 여부를 확인하기위한 통계 테스트?
두 개의 샘플이 있다고 가정 해 봅시다. 다른 집단에서 뽑아 낸 것인지를 알고 싶다면 t- 검정을 실행할 수 있습니다. 그러나 표본이 동일한 모집단에서 추출되었는지 테스트하고 싶다고 가정 해 봅시다. 어떻게합니까? 즉,이 두 표본이 동일한 모집단에서 추출 된 통계적 확률을 어떻게 계산합니까?

3
LASSO에 대한 인디케이터 / 바이너리 / 더미 예측 변수의 재조정 여부
LASSO (및 다른 모델 선택 절차)의 경우 예측 변수를 재조정하는 것이 중요합니다. 일반 추천 I 추적은 연속 변수의 0 평균, 1 개 표준 편차의 정상화를 사용하는 것입니다. 그러나 인형과 어떤 관련이 있습니까? 예를 들어 , 동일한 (우수한) 여름 학교의 일부 적용 예 는 연속 변수를 0과 1 사이로 조정하지만 (이상치에는 …

3
어떤 분산 인플레이션 계수를 사용해야합니까 : 또는 ?
vifR 패키지 의 함수를 사용하여 분산 인플레이션 요인을 해석하려고 합니다 car. 이 함수는 일반화 된 및 합니다. 도움말 파일 에 따르면 이 후자의 값은GVIF 1 / ( 2 ⋅ df )VIFVIF\text{VIF}GVIF1 / ( 2 ⋅ df )GVIF1/(2⋅df)\text{GVIF}^{1/(2\cdot\text{df})} 신뢰 타원체의 치수를 조정하기 위해이 함수는 GVIF ^ [1 / (2 * df)]도 …

3
표본 크기가 변수 수보다 작을 때 표본 공분산 행렬이 왜 특이합니까?
차원 다변량 가우스 분포 가 있다고 가정 해 봅시다 . 그리고이 분포에서 관측치 (각각 벡터)를 취하고 표본 공분산 행렬 계산합니다 . 이 논문 에서 저자는 계산 된 표본 공분산 행렬 이 단수 라고 말합니다 .pppnnnpppSSSp>np>np > n 그것이 사실이거나 파생 된 방법은 무엇입니까? 어떤 설명이 있습니까?

5
다중 선형 회귀 분석을 위해 최소 제곱 추정기를 도출하는 방법은 무엇입니까?
간단한 선형 회귀 분석법 에서 최소 제곱 추정량 같은 당신이 알 필요가 없다는 추정하는β 1 = Σ ( X I - ˉ X ) ( Y I - ˉ Y )y=β0+β1xy=β0+β1xy=\beta_0+\beta_1xβ 0 β 1β^1=∑(xi−x¯)(yi−y¯)∑(xi−x¯)2β^1=∑(xi−x¯)(yi−y¯)∑(xi−x¯)2\hat\beta_1=\frac{\sum(x_i-\bar x)(y_i-\bar y)}{\sum(x_i-\bar x)^2}β^0β^0\hat\beta_0β^1β^1\hat\beta_1 내가 가진 가정 내가 파생 어떻게, 추정하지 않고 ? 아니면 불가능합니까?β 1 β …

5
GBM에서 상호 작용 깊이는 무엇을 의미합니까?
R에서 gbm의 상호 작용 깊이 매개 변수에 대한 질문이 있습니다. 이것은 멍청한 질문 일 수 있지만 사과 할 수는 있지만 트리의 터미널 노드 수를 나타내는 매개 변수는 기본적으로 X-way를 나타냅니다. 예측 자들 사이의 상호 작용? 그것이 어떻게 작동하는지 이해하려고 노력합니다. 또한 두 요인 변수가 단일 요인으로 결합 된 경우를 제외하고 …



4
McNemar의 검정과 카이 제곱 검정의 차이점은 무엇이며 각각의 사용시기를 어떻게 알 수 있습니까?
다른 출처를 읽으려고 시도했지만 여전히 어떤 경우에 어떤 테스트가 적합한 지 명확하지 않습니다. 내 데이터 세트에 대해 묻는 세 가지 다른 질문이 있습니다. 피험자들은 다른 시간에 X의 감염 여부를 검사합니다. X에 대한 양의 비율이 X에 대한 양의 비율과 관련이 있는지 알고 싶습니다. After |no |yes| Before|No |1157|35 | |Yes |220 …

5
공동 필터링에서 SVD를 어떻게 사용합니까?
SVD가 공동 필터링에 사용되는 방식과 약간 혼동됩니다. 소셜 그래프가 있고 가장자리에서 인접 행렬을 만든 다음 SVD (정규화, 학습 속도, 희소성 최적화 등을 잊어 버리십시오)를 사용한다고 가정하면이 SVD를 사용하여 권장 사항을 개선하는 방법은 무엇입니까? 소셜 그래프가 인스 타 그램에 해당하고 소셜 그래프만을 기반으로 서비스에서 사용자를 추천해야 할 책임이 있다고 가정 해 …

2
포화 비선형 성이라는 용어는 무엇을 의미합니까?
나는 Deep Convolutional Neural Networks를 사용한 ImageNet 분류를 읽고 있었고 3 장에서는 Convolutional Neural Network의 아키텍처를 설명하고 그들이 어떻게 사용하는 것이 바람직한 지 설명했습니다. 비 포화 비선형 성 에프( x ) = m a x ( 0 , x ) 입니다.f(x)=max(0,x).f(x) = max(0, x). 훈련하는 것이 더 빠르기 때문입니다. 이 …


당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.