통계 및 빅 데이터

4

바이 모달 분포를 식별하는 방법은 무엇입니까?

일단 값을 차트로 플로팅하면 트윈 피크를 관찰하여 바이 모달 분포를 식별 할 수 있지만 프로그래밍 방식으로 찾는 방법은 무엇입니까? (알고리즘을 찾고 있습니다.)

48 distributions

5

NaN과 NA의 차이점은 무엇입니까?

R과 같은 일부 언어에 NA와 NaN이 모두있는 이유를 알고 싶습니다. 차이점은 무엇입니까, 아니면 동일합니까? NA가 정말로 필요합니까?

48 r

17

가장 좋아하는 데이터 시각화 블로그는 무엇입니까?

데이터 시각화에 대한 최고의 블로그는 무엇입니까? 이 질문은 주관적이기 때문에 커뮤니티 위키로 만들고 있습니다. 각 답변을 하나의 링크로 제한하십시오. 제안 된 답변에 대한 다음 기준에 유의하십시오. [A] 이와 같은 질문에 대한 적절한 답변은 적절한 설명과 합리적인 근거를 제공해야합니다. 단순한 하이퍼 링크는 그렇게하지 않습니다. ... [A] 미래의 모든 회신은 ... [이들] …

48 data-visualization references

7

간단한 선형 회귀 분석에서 스위칭 응답 및 설명 변수의 효과

와 사이 에 과 같은 "true"관계가 존재한다고 가정 해 봅시다 . 여기서 와 는 상수이고 은 iid 일반 노이즈입니다. 그 R 코드에서 무작위로 데이터를 생성 한 다음과 같은 모델을 적합 하게 만들면 분명히 와 대한 합리적인 추정치를 얻습니다 .yyyxxxy=ax+b+ϵy=ax+b+ϵy = ax + b + \epsilonaaabbbϵϵ\epsilonx <- 1:100; y <- ax …

48 regression

4

운동량 기반 경사 하강과 Nesterov의 가속 경사 하강의 차이점은 무엇입니까?

운동량 기반 경사 하강은 다음과 같이 작동합니다. v=self.momentum∗m−lr∗gv=self.momentum∗m−lr∗gv=self.momentum*m-lr*g 여기서 은 이전 가중치 업데이트이고 는 매개 변수 대한 현재 경사 , 은 학습 속도, 은 상수입니다.g p l r s e l f . m o m e n t u mmmmgggppplrlrlrself.momentumself.momentumself.momentum 피n 개의 전자 w= p + v = p …

48 optimization gradient-descent

2

그라디언트 부스팅 트리 (GBM)와 Adaboost의 차이점에 대한 직관적 인 설명

GBM과 Adaboost의 차이점을 이해하려고합니다. 이것들은 내가 지금까지 이해 한 것입니다 : 부스팅 알고리즘은 모두 이전 모델의 오류를 파악하고 모델의 가중치 합계를 만듭니다. GBM과 Adaboost는 손실 기능을 제외하고는 매우 유사합니다. 그러나 여전히 그들 사이의 차이점에 대한 아이디어를 얻는 것이 어렵습니다. 누군가 나에게 직관적 인 설명을 해줄 수 있습니까?

48 boosting gbm adaboost

2

모든 공분산 행렬이 양의 명확한가?

나는 대답이 '그렇다'고 생각하지만 여전히 무언가가 옳지 않다고 느낀다. 문헌에 일반적인 결과가 있어야합니까, 누군가 나를 도울 수 있습니까?

48 covariance matrix covariance-matrix linear-algebra

4

R의 임의 포리스트 계산 시간

10,000 개의 행과 34 개의 기능이있는 R 의 파티 패키지를 사용하고 있으며 일부 요인 기능에는 300 개 이상의 레벨이 있습니다. 컴퓨팅 시간이 너무 깁니다. (지금까지 3 시간이 걸렸으며 아직 끝나지 않았습니다.) 임의 포리스트의 컴퓨팅 시간에 어떤 요소가 큰 영향을 미치는지 알고 싶습니다. 레벨이 너무 많은 요인이 있습니까? RF 컴퓨팅 시간을 …

48 r random-forest

1

비지도 학습을 평가하기위한 성능 지표

감독되지 않은 학습 (클러스터링과 같은)과 관련하여 성능을 평가할 메트릭이 있습니까?

48 machine-learning clustering data-mining unsupervised-learning

6

iid 랜덤 변수 란 무엇입니까?

기술이 아닌 사람들에게 iid (독립적이고 동일하게 배포 된)를 어떻게 설명 하시겠습니까?

48 random-variable intuition

5

KL (Kullback-Leibler) 분기에 대한 직관

모델 분포 함수가 데이터의 이론적 / 실제 분포와 얼마나 다른지에 따라 KL Divergence의 직관에 대해 배웠습니다. 내가 읽고있는 출처는이 두 분포 사이의 '거리'에 대한 직관적 인 이해가 도움이되지만 두 분포 PPP 와 QQQ 대해 문자 그대로 취해서는 안된다고 말하면서 KL 분기는 PPP 와 QQQ 에서 대칭이 아닙니다 . 마지막 진술을 …

47 distributions distance intuition kullback-leibler

1

예측이 목표 인 경우 교육 및 테스트 세트에 표준화 / 정규화를 적용하는 방법은 무엇입니까?

모든 데이터 또는 접기 (CV가 적용된 경우)를 동시에 변환합니까? 예 : (allData - mean(allData)) / sd(allData) trainset과 testset을 개별적으로 변환합니까? 예 : (trainData - mean(trainData)) / sd(trainData) (testData - mean(testData)) / sd(testData) 아니면 trainset을 변환하고 testset에서 계산을 사용합니까? 예 : (trainData - mean(trainData)) / sd(trainData) (testData - mean(trainData)) / sd(trainData) …

47 r cross-validation data-transformation normalization standardization

11

플롯과 선형 대수를 사용하지 않고 간단한 선형 회귀를 수행 할 수 있습니까?

나는 완전히 장님이고 프로그래밍 배경에서 왔습니다. 내가하려는 것은 기계 학습을 배우는 것입니다.이를 위해서는 먼저 선형 회귀에 대해 알아야합니다. 이 주제에 대해 내가 찾은 인터넷의 모든 설명은 먼저 데이터를 표시합니다. 그래프와 플롯에 의존하지 않는 선형 회귀에 대한 실용적인 설명을 찾고 있습니다. 간단한 선형 회귀의 목표에 대한 나의 이해는 다음과 같습니다. 간단한 …

47 regression intuition

7

숙련 된 개발자를위한 통계로 시작하는 곳

2015 년 상반기 동안 저는 기계 학습 과정 (GREAT 과정 Andrew Andrew)을 수행했습니다. 기계 학습의 기본 사항 (선형 회귀, 로지스틱 회귀, SVM, 신경망 ...)을 배웠습니다. 또한 나는 10 년 동안 개발자 였으므로 새로운 프로그래밍 언어를 배우는 것은 문제가되지 않습니다. 최근에 기계 학습 알고리즘을 구현하기 위해 R 학습을 시작했습니다. 그러나 나는 …

47 r regression machine-learning references

4

지도 머신 러닝의 수업 불균형

이것은 일반적으로 질문이나 방법이나 데이터 세트에만 국한되지 않습니다. 데이터 세트에서 0의 수가 90 %이고 1의 수가 10 % 인 Supervised Machine 학습에서 클래스 불균형 문제를 처리하는 방법 분류기를 최적으로 훈련시키는 방법 내가 따르는 방법 중 하나는 데이터 세트의 균형을 잡고 분류기를 훈련시키고 여러 샘플에 대해 이것을 반복하기 위해 샘플링하는 것입니다. …

47 machine-learning unbalanced-classes supervised-learning