통계 및 빅 데이터

통계, 기계 학습, 데이터 분석, 데이터 마이닝 및 데이터 시각화에 관심있는 사람들을위한 Q & A

6
신뢰할 수있는 구간의 간격이 평평한 경우 95 % 신뢰 구간이 95 %의 신뢰할 수있는 구간과 같습니까?
나는 베이지안 통계를 처음 접했고 이것은 어리석은 질문 일 수 있습니다. 그렇지만: 균일 분포를 지정하는 사전에 신뢰할 수있는 구간을 고려하십시오. 예를 들어 0에서 1까지입니다. 여기서 0에서 1은 효과의 가능한 모든 값을 나타냅니다. 이 경우 95 % 신뢰할 수있는 구간이 95 % 신뢰 구간과 같습니까?

2
선형 회귀 모델의 계수를 찾으려면 경사 하강이 필요합니까?
Coursera 자료를 사용하여 기계 학습을 배우려고했습니다 . 이 강의에서 Andrew Ng는 기울기 하강 알고리즘을 사용하여 오차 함수 (비용 함수)를 최소화 할 선형 회귀 모델의 계수를 찾습니다. 선형 회귀의 경우 그라디언트 디센트가 필요합니까? 오차 함수를 분석적으로 차별화하고 계수를 풀기 위해 0으로 설정할 수 있습니다. 맞습니까?

3
Naive Bayes는 어떻게 선형 분류기입니까?
나는 다른 스레드 를 보았지만 대답이 실제 질문을 만족시키지 않았다고 생각합니다. 내가 계속 읽은 것은 Naive Bayes가 로그 확률 데모를 사용하여 선형 분류 자 ​​(예 : here ) (선형 결정 경계를 그립니다)라는 것입니다. 그러나 두 개의 가우시안 구름을 시뮬레이션하고 결정 경계를 설정하고 결과를 얻었습니다 (naiveBayes ()를 사용하여 r의 라이브러리 e1071) …


4
백분위 수 부트 스트랩을 사용해서는 안된다는 것이 사실입니까?
2014 년 봄 (현재 여기 에서 사용 가능 ) 18.05 확률 및 통계 소개에 대한 MIT OpenCourseWare 노트에 다음과 같이 표시되어 있습니다. 부트 스트랩 백분위 수 방법은 단순성으로 인해 매력적입니다. 그러나이 부트 스트랩의 분포에 따라 x¯∗x¯∗\bar{x}^{*} (A)에 기초하여 특정 의 실제 분포에 좋은 근사치 인 샘플 x¯x¯\bar{x} . 라이스 장관은 …

2
R의 랜덤 포레스트 분류에서 예측 변수 세트의 상대적 중요성
randomForestR의 분류 모델에 대한 변수 집합의 상대적인 중요성을 결정하고 싶습니다 .이 importance함수는 MeanDecreaseGini각 개별 예측 변수에 대한 메트릭을 제공합니다 . 집합의 각 예측 변수를 합산하는 것만 큼 간단합니까? 예를 들면 다음과 같습니다. # Assumes df has variables a1, a2, b1, b2, and outcome rf <- randomForest(outcome ~ ., data=df) importance(rf) …

3
평균 제곱 오차 및 잔차 제곱합
Wikipedia 정의를 살펴보면 : 평균 제곱 오차 (MSE) 잔차 제곱합 (RSS) 그것은 나에게 보인다 MSE = 1엔RSS = 1엔∑ ( f나는− y나는)2MSE=1NRSS=1N∑(fi−yi)2\text{MSE} = \frac{1}{N} \text{RSS} = \frac{1}{N} \sum (f_i -y_i)^2 여기서 은 샘플 수이고 는 의 추정치입니다 .엔NN에프나는fif_i와이나는yiy_i 그러나 위키피디아 기사 중 어느 것도이 관계를 언급하지 않습니다. 왜? 뭔가 빠졌습니까?
31 residuals  mse 

4
바이어스의 부트 스트랩 추정치는 언제 유효합니까?
부트 스트래핑이 추정기의 편향 추정치를 제공 할 수 있다고 종종 주장된다. 경우 t는 어떤 통계에 대한 추정이며, ~ 을 t 나 (와 부트 스트랩 복제본 I ∈ { 1 , ⋯ , N은 } 다음 바이어스 부트 스트랩 추정치 임) B I S t ≈ 1t^t^\hat tt~it~i\tilde t_ii∈{1,⋯,N}i∈{1,⋯,N}i\in\{1,\cdots,N\}biast≈1N∑it~i−t^biast≈1N∑it~i−t^\begin{equation} \mathrm{bias}_t \approx …
31 bootstrap  bias 

2
libsvm 데이터 형식 [닫힘]
지원 벡터 분류를 위해 libsvm ( http://www.csie.ntu.edu.tw/~cjlin/libsvm/ ) 도구를 사용하고 있습니다. 그러나 입력 데이터의 형식이 혼란 스럽습니다. 읽어보기에서 : 교육 및 테스트 데이터 파일의 형식은 다음과 같습니다. <label> <index1>:<value1> <index2>:<value2> ... . . . 각 줄은 인스턴스를 포함하며 '\ n'문자로 끝납니다. 분류의 <label>경우 클래스 레이블을 나타내는 정수입니다 (다중 클래스 지원). …

3
내 데이터는 어떤 분포를 따르나요?
1000 개의 구성 요소가 있고 이러한 로그에 몇 번의 로그 기록이 실패했는지 기록하고 실패를 기록 할 때마다 팀에서 문제를 해결하는 데 걸린 시간도 추적합니다. 요컨대,이 1000 개의 구성 요소 각각에 대한 복구 시간 (초)을 기록했습니다. 이 질문의 끝에 데이터가 제공됩니다. 나는이 모든 값을 가져다가 사용 R에 컬린과 프레이 그래프를 그린 …

3
올가미 회귀 모델에 대한 AIC 및 BIC를 계산할 수 있습니까?
올가미 회귀 모형 및 매개 변수가 방정식에 부분적으로 만 입력되는 다른 정규화 된 모형에 대한 AIC 또는 BIC 값을 계산할 수 있습니까? 자유도를 어떻게 결정합니까? 패키지 의 glmnet()함수 에 올가미 회귀 모델을 맞추기 위해 R을 사용 glmnet하고 있으며 모델의 AIC 및 BIC 값을 계산하는 방법을 알고 싶습니다. 이런 식으로 정규화하지 …
31 r  model-selection  lasso  aic  bic 

2
원시 잔차 대 표준화 잔차 대 학생 잔차-언제 무엇을 사용해야합니까?
이것은 비슷한 질문처럼 보이며 많은 응답을 얻지 못했습니다. Cook의 D와 같은 테스트를 생략하고 그룹으로 잔차를 살펴보면 다른 사람들이 적합도를 평가할 때 잔차를 사용하는 방법에 관심이 있습니다. 나는 원시 잔차를 사용합니다. 정규성을 평가하기 위해 QQ 플롯에서 (a) 이분산성 및 (b) 연속 자기 상관의 안구 검사를 위해 대 잔차 의 산점도에서 .와이yy …

4
신경망에서 ReLU를 사용하는 이유는 무엇이며 어떻게 사용합니까?
신경망에 왜 정류 선형 장치 (ReLU)를 사용합니까? 이것이 어떻게 신경망을 개선합니까? 왜 ReLU가 활성화 기능이라고 말합니까? 신경망에 대해 softmax 활성화 기능이 아닙니까? 우리는 다음과 같이 ReLU와 softmax를 모두 사용한다고 추측합니다. 소프트 맥스 출력을 갖는 뉴런 1 ----> 뉴런 1의 출력에 대한 ReLU, 뉴런 2의 입력 ---> 소프트 맥스 출력을 갖는 …


1
출력 레이어의 교차 엔트로피 또는 로그 가능성
이 페이지를 읽었습니다 : http://neuralnetworksanddeeplearning.com/chap3.html 교차 엔트로피를 갖는 시그 모이 드 출력층은 로그 우도를 갖는 소프트 맥스 출력층과 상당히 유사하다고 말했다. 출력 레이어에서 로그 가능성이있는 시그 모이 드 또는 교차 엔트로피가있는 소프트 맥스를 사용하면 어떻게됩니까? 괜찮아? becuase 나는 교차 엔트로피 (eq.57) 사이에 방정식의 차이가 거의 없다는 것을 알았습니다. 기음= − …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.