통계 및 빅 데이터

2

scikit을 사용하여 기존 문서에 주제를 할당하기 위해 다중 레이블 분류기를 작성하려고합니다. 나는 통해 전달 내 문서를 처리하고 TfidfVectorizer하여 통해 라벨 MultiLabelBinarizer과를 만들어 OneVsRestClassifier와 SGDClassifier추있다. 그러나 내 분류기를 테스트 할 때 나는 .29 까지의 점수 만 얻습니다.이 점수 는 비슷한 문제에 대해 꽤 낮습니다. 나는 스톱 워드, 유니 그램, 형태소 분석과 …

19 scikit-learn multi-class multilabel

3

의사 결정이 선형 모델입니까?

의사 결정 그루터기는 분할이 하나 뿐인 의사 결정 트리입니다. 조각 별 함수로 작성할 수도 있습니다. 예를 들어, 가정 벡터이며, 첫 번째 요소 인 회귀 환경에서, 일부 결정이 될 수 루터x 1 xxxxx1x1x_1xxx f(x)={35x1≤2x1>2f(x)={3x1≤25x1>2f(x)= \begin{cases} 3& x_1\leq 2 \\ 5 & x_1 > 2 \\ \end{cases} 그러나 선형 모델입니까? 로 쓸 …

19 machine-learning cart linear boosting

3

극좌표 는 및 언제 ?

임의의 점 의 직교 좌표를 st 합니다.x,yx,yx,y(x,y)∼U(−10,10)×U(−10,10)(x,y)∼U(−10,10)×U(−10,10)(x,y) \sim U(-10,10) \times U(-10,10) 따라서, 반경 에 의해 묵시적으로 균일하게 분산되지 의 PDF .ρ=x2+y2−−−−−−√ρ=x2+y2\rho = \sqrt{x^2 + y^2}ρρ\rho 그럼에도 불구하고 은 가장자리에 남은 4 개의 남은 가공물을 제외하고 거의 균일 할 것으로 예상 합니다.θ=arctanyxθ=arctan⁡yx\theta = \arctan{\frac{y}{x}} 다음은 및 의 그래프로 계산 된 확률 …

19 normal-distribution matlab pdf uniform

5

이름에있는 것 : 하이퍼 파라미터

정규 분포에는 mean 와 variance 두 매개 변수가 있습니다 . Pattern Recognition and Machine Learning 서적에서 갑자기 오류 함수의 정규화 용어에 하이퍼 파라미터 가 나타납니다 .μμ\muσ2σ2\sigma^2λλ\lambda 하이퍼 파라미터 란 무엇입니까? 왜 그렇게 지명 되었습니까? 그리고 그것들은 일반적으로 매개 변수와 직관적으로 어떻게 다른가요?

19 terminology definition parameterization hyperparameter

1

분산의 반의어

'분산의 역수'를 의미하는 단어가 있습니까? 경우 즉, 다음, 높은 분산을 가지고 X 낮은있다 ... ? 반의어에 관심이 없지만 ( '계약'또는 '유사성'과 같은) 구체적으로 1 / σ 2 ?엑스엑스X엑스엑스X……\dots1 / σ21/σ21/\sigma^2

19 bayesian variance terminology precision

3

먼저 배워야 할 것 : 확률 또는 통계?

저는 수학 부서의 교수진으로 새로 합류했습니다. 유명한 기관의. 학부 수준에서 확률 및 통계 과정을 가르치겠습니다. 기관은 이미이 과정에 대한 강의 계획서를 가지고 있습니다. 이 강의 계획서에서 통계를 먼저 다루고 추정 부분도 빠졌습니다. 통계를 가르치기 전에 항상 확률의 기초를 가르쳐야한다고 생각했습니다. 누군가 이것에 대해 의견을 줄 수 있습니까? 또한 그러한 과정에서 …

19 teaching

5

중앙 한계 정리와 다수의 법칙에 동의하지 않는 경우

이것은 본질적으로 math.se에서 찾은 질문 의 복제이며 , 원하는 답변 을 얻지 못했습니다. 보자 {Xi}i∈N{Xi}i∈N\{ X_i \}_{i \in \mathbb{N}} 함께 독립적으로 동일하게 분산 된 랜덤 변수들의 시퀀스 일 E[Xi]=1E[Xi]=1\mathbb{E}[X_i] = 1 및 V[Xi]=1V[Xi]=1\mathbb{V}[X_i] = 1 . 의 평가를 고려 limn→∞P(1n−−√∑i=1nXi≤n−−√)limn→∞P(1n∑i=1nXi≤n) \lim_{n \to \infty} \mathbb{P}\left(\frac{1}{\sqrt{n}} \sum_{i=1}^n X_i \leq \sqrt{n}\right) 불평등 사건의 …

19 probability mathematical-statistics asymptotics

2

예측이 아닌 모델링에만 관심이있는 경우 정규화가 도움이 될 수 있습니까?

예측이나 예측이 아닌 모형 매개 변수 추정 (및 해석)에만 관심이있는 경우 정규화가 도움이 될 수 있습니까? 새 데이터에 대한 좋은 예측을 내리는 것이 목표 인 경우 정규화 / 교차 유효성 검사가 얼마나 유용한 지 잘 알고 있습니다. 그러나 만약 당신이 전통적인 경제학을하고 있고 당신이 관심있는 모든 것을 추정하는 것이라면 ββ\beta? …

19 cross-validation econometrics model-selection interpretation regularization

3

CBOW보다 자주 사용하지 않는 단어에 대해 건너 뛰기 그램이 더 좋은 이유는 무엇입니까?

왜 단어 2vec에서 건너 뛰기 그램이 CBOW보다 드문 단어에 더 좋은지 궁금합니다. https://code.google.com/p/word2vec/ 에서 소유권 주장을 읽었습니다 .

19 natural-language word2vec word-embeddings

2

최대 우도 추정이 빈번한 기술로 간주되는 이유

저에게 빈번한 통계는 가능한 모든 샘플에 적합한 결정을 내리는 데 동의합니다. 즉, 잦은 의사 결정 규칙 는 항상 잦은 위험을 최소화하려고 노력해야한다. 이는 손실 함수 과 진정한 자연 상태 .δδ\delta엘엘Lθ0θ0\theta_0 아르 자형에프r e q= Eθ0( L ( θ0, δ( Y) )아르 자형에프아르 자형이자형큐=이자형θ0(엘(θ0,δ(와이))R_\mathrm{freq}=\mathbb{E}_{\theta_0}(L(\theta_0,\delta(Y)) 최대 우도 추정은 잦은 위험과 어떤 관련이 …

19 maximum-likelihood frequentist

5

기본적인 머신 러닝 알고리즘을 배우기위한 좋은 데이터 세트는 무엇이며 그 이유는 무엇입니까?

나는 기계 학습에 익숙하지 않고 다른 기계 학습 알고리즘 (결정 트리, 부스팅, SVM 및 신경망) 간의 차이점을 비교하고 대조 할 수있는 일부 데이터 세트를 찾고 있습니다. 이러한 데이터 세트는 어디에서 찾을 수 있습니까? 데이터 세트를 고려하면서 무엇을 찾아야합니까? 좋은 데이터 세트를 가리키고 데이터 세트를 만드는 데 도움이된다면 좋을까요?

19 machine-learning dataset

1

분류 기술인 LDA가 PCA와 같은 차원 축소 기술로도 사용되는 방법

이 기사 에서 저자는 선형 판별 분석 (LDA)을 주성분 분석 (PCA)에 연결합니다. 제한된 지식으로 LDA가 PCA와 어떻게 유사한 지 따를 수 없습니다. 나는 항상 LDA가 로지스틱 회귀와 유사한 분류 알고리즘의 한 형태라고 생각했습니다. LDA가 PCA와 어떻게 비슷한 지 이해하는 데 도움이 될 것입니다.

19 classification pca dimensionality-reduction discriminant-analysis canonical-correlation

8

분산이 서로 뒤 따르는 모든 값의 차이로 정의되지 않는 이유는 무엇입니까?

이것은 많은 사람들에게 간단한 질문 일지 모르지만 여기에 있습니다. 분산이 평균값의 차이 대신에 뒤 따르는 모든 값의 차이로 정의되지 않는 이유는 무엇입니까? 이것은 나에게 더 논리적 인 선택 일 것입니다. 나는 분명히 몇 가지 단점을 감독하고 있다고 생각합니다. 감사 편집하다: 가능한 한 명확하게 문구를 바꾸겠습니다. 이것이 내가 의미하는 바입니다. 1,2,3,4,5의 …

19 variance

2

강화 : 왜 학습률이 정규화 매개 변수라고 불리는가?

그라디언트 부스팅 의 학습 속도 매개 변수 ( )는 시리즈에 추가 된 각각의 새 기본 모델 (일반적으로 얕은 나무)의 기여도를 줄입니다. 테스트 세트 정확도를 크게 향상시키는 것으로 나타 났으며, 이는 작은 단계에서와 같이 이해할 수있는 최소 손실 기능을보다 정확하게 얻을 수 있습니다. ν∈ [ 0 , 1 ]ν∈[0,1]\nu \in [0,1] …

19 machine-learning data-mining predictive-models boosting overfitting

1

선형 회귀 분석에서 순환 예측 변수 사용

바람 데이터 (0, 359)와 시간 (0, 23)을 사용하여 모델을 적합하려고하지만 선형 매개 변수가 아니기 때문에 선형 회귀에 적합하지 않을까 걱정됩니다. 파이썬을 사용하여 변환하고 싶습니다. 적어도 바람의 경우에는 그 정도의 죄와 코사인을 취함으로써 벡터 평균을 계산하는 것에 대한 언급이 있지만 전부는 아닙니다. 도움이 될만한 파이썬 라이브러리 또는 관련 방법이 있습니까?

19 regression python circular-statistics