통계 및 빅 데이터

통계, 기계 학습, 데이터 분석, 데이터 마이닝 및 데이터 시각화에 관심있는 사람들을위한 Q & A


4
히스토그램을 기반으로 데이터의 근사 분포 평가
히스토그램 (즉, 오른쪽으로 기울어 짐)을 기반으로 내 데이터가 지수인지 여부를보고 싶다고 가정합니다. 데이터를 그룹화하거나 비우는 방법에 따라 크게 다른 히스토그램을 얻을 수 있습니다. 히스토그램의 한 세트는 데이터가 지수적인 것처럼 보입니다. 다른 세트는 데이터가 지수 적이 지 않은 것처럼 보일 것입니다. 히스토그램에서 분포를 잘 정의하려면 어떻게해야합니까?

2
그라디언트 부스팅 트리 및 임의의 포리스트
Friedman이 제안한 그라디언트 트리 부스팅은 의사 결정 트리를 기본 학습자로 사용합니다. 기본 의사 결정 트리를 가능한 한 복잡하게 (완전히 성장) 또는 단순하게 만들어야하는지 궁금합니다. 선택에 대한 설명이 있습니까? 랜덤 포레스트는 의사 결정 트리를 기본 학습자로 사용하는 또 다른 앙상블 방법입니다. 내 이해를 바탕으로, 우리는 일반적으로 각 반복마다 거의 완전히 자란 …

8
얼굴 이미지 데이터베이스에서 주어진 얼굴 감지
프로필 사진을 통해 트위터 사용자의 얼굴을 포함하는 작은 프로젝트를 진행하고 있습니다. 내가 직면 한 문제는 명확한 인물 사진 인 이미지를 제외한 모든 이미지를 필터링 한 후에 트위터 사용자의 작지만 상당 비율이 Justin Bieber의 사진을 프로필 사진으로 사용한다는 것입니다. 그것들을 걸러 내기 위해 그림이 저스틴 비버 (Justin Bieber)의 그림인지 프로그래밍 방식으로 …

3
잔차가 정규 분포로 분포되어 있지만 y가 분포되어 있지 않으면 어떻게됩니까?
이상한 질문이 있습니다. 간단한 선형 모형으로 분석 할 종속 변수가 매우 왜곡 된 작은 표본이 있다고 가정합니다. 따라서 유유u 가 정규 분포되어 있지 않다고 가정하면 정규 분포 가 발생하기 때문 와이와이y입니다. 그러나 QQ-Normal plot을 계산할 때 잔차가 정규 분포되어 있다는 증거가 있습니다. 따라서 와이와이y 는 아니지만 오류 항이 정상적으로 분포되어 …

6
상관과 공분산의 차이점을 어떻게 설명 하시겠습니까?
이 질문에 이어 평균 만 이해하는 사람에게 공분산을 어떻게 설명 하시겠습니까? 평신도에 대한 공분산을 설명하는 문제를 다루는 비슷한 생각을하게되었습니다. 공분산 과 상관 관계 의 차이를 통계적으로 네오 피트로 설명 할 수 있을까요? 둘 다 다른 변수에 다시 연결된 하나의 변수의 변경을 나타냅니다. 언급 된 질문과 마찬가지로 수식이 부족한 것이 좋습니다.


15
미국 선거 결과 2016 : 예측 모델에 어떤 문제가 있었습니까?
먼저 그것은 미국 선거인 Brexit 이었다 . 많은 모델 예측이 크게 한계에 이르렀으며 여기서 배울 교훈이 있습니까? 어제 오후 4시 (PST)까지 베팅 시장은 여전히 ​​힐러리 4 대 1을 선호했습니다. 나는 실제 돈을 가지고 베팅 시장이 모든 가능한 예측 모델의 앙상블 역할을해야한다고 생각합니다. 따라서 이러한 모델이 잘 작동하지 않았다고 말할 수는 …




6
데이터 행렬 대한 대한 직관적 인 해석이 있습니까?
주어진 데이터 행렬 (열의 변수와 행의 데이터 요소가있는)의 경우 가 통계에서 중요한 역할을하는 것처럼 보입니다 . 예를 들어, 보통 최소 제곱의 분석 솔루션에서 중요한 부분입니다. 또는 PCA의 고유 벡터는 데이터의 주요 구성 요소입니다.A T AAAAATAATAA^TA 를 계산 방법을 이해 하지만이 행렬이 무엇을 나타내는 지 직관적으로 해석 할 수 있는지 궁금합니다.이 …


7
분류 모델을 평가할 때 정확도가 가장 좋은 측정 방법이 아닌 이유는 무엇입니까?
이것은 여기서 여러 번 간접적으로 묻는 일반적인 질문이지만 단일 정식 답변이 없습니다. 참조를 위해 이에 대한 자세한 답변을 얻는 것이 좋습니다. 모든 분류 중에서 올바른 분류의 비율 인 정확도 는 매우 간단하고 매우 "직관적 인"측정이지만 불균형 데이터에 대한 측정 은 좋지 않을 수 있습니다 . 왜 직관이 우리를 잘못 인도하고이 …

6
신경망에서 1x1 컨볼 루션이란 무엇입니까?
현재 Udacity Deep Learning Tutorial을하고 있습니다. 레슨 3에서는 1x1 컨벌루션에 대해 이야기합니다. 이 1x1 컨볼 루션은 Google Inception Module에서 사용됩니다. 1x1 컨볼 루션이 무엇인지 이해하는 데 문제가 있습니다. 나는 또한 Yann Lecun 의이 게시물 을 보았습니다. 누군가 나에게 친절하게 설명해 주시겠습니까?

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.