«machine-learning» 태그된 질문

기계 학습 알고리즘은 훈련 데이터의 모델을 구축합니다. "기계 학습"이라는 용어는 모호하게 정의됩니다. 여기에는 통계 학습, 강화 학습, 비지도 학습 등이 포함됩니다. 항상 더 구체적인 태그를 추가하십시오.

1
원격 감독 : 감독, 반 감독 또는 둘 다?
"원격 감독"은 약하게 분류 된 훈련 세트가 주어지면 분류자가 학습되는 학습 체계입니다 (훈련 데이터는 휴리스틱 / 규칙에 따라 자동으로 표시됩니다). 레이블이있는 데이터에 경험적 / 자동으로 레이블이 지정된 경우 감독 학습과 준 감독 학습 모두 그러한 "원격 감독"을 포함 할 수 있다고 생각합니다. 그러나이 페이지 에서 "원격 감독"은 "반 감독 학습"(즉, …

1
xgboost의 초과 적합에 대한 토론
내 설정은 다음과 같습니다. "Applied Predictive Modelling"의 지침을 따르고 있습니다. 따라서 상관 된 기능을 필터링하고 다음과 같이 끝납니다. 훈련 세트의 4900 데이터 포인트와 테스트 세트의 1600 데이터 포인트 26 개의 기능이 있으며 대상은 연속 변수입니다. caret패키지를 사용하여 모델을 훈련시키기 위해 5 배 교차 검증을 적용 합니다. MARS 모델을 적용하면 훈련 …

1
중첩 교차 검증 후 최종 모델을 작성하고 확률 임계 값을 조정하는 방법은 무엇입니까?
먼저, 여기 , 여기 , 여기 , 여기 , 여기 에서 이미 오랫동안 논의 된 질문을 게시 한 것에 대해 사과드립니다이전 주제를 재가열합니다. 나는 @DikranMarsupial 이이 주제에 대해 게시물과 저널 논문에 길게 쓴 것을 알고 있지만 여전히 혼란스럽고 비슷한 게시물 수를 판단하면 다른 사람들이 이해하기 어려워합니다. 또한 혼란에 추가 한이 …

1
word2vec에서 음성 샘플링은 어떻게 작동합니까?
나는 word2vec의 맥락에서 부정적인 샘플링의 개념을 이해하려고 노력했습니다. [음수] 샘플링에 대한 아이디어를 소화 할 수 없습니다. 예를 들어 Mikolov의 논문 에서 음수 샘플링 기대치는 다음과 같이 공식화됩니다. logσ(⟨w,c⟩)+k⋅EcN∼PD[logσ(−⟨w,cN⟩)].log⁡σ(⟨w,c⟩)+k⋅EcN∼PD[log⁡σ(−⟨w,cN⟩)].\log \sigma(\langle w,c\rangle ) + k \cdot \mathbb E_{c_N\sim PD}[\log\sigma(−\langle w,c_N\rangle)]. 나는 왼쪽 용어 이해 ,하지만 난 부정적인 단어 컨텍스트 쌍을 샘플링의 개념을 …

3
의사 결정이 선형 모델입니까?
의사 결정 그루터기는 분할이 하나 뿐인 의사 결정 트리입니다. 조각 별 함수로 작성할 수도 있습니다. 예를 들어, 가정 벡터이며, 첫 번째 요소 인 회귀 환경에서, 일부 결정이 될 수 루터x 1 xxxxx1x1x_1xxx f(x)={35x1≤2x1>2f(x)={3x1≤25x1>2f(x)= \begin{cases} 3& x_1\leq 2 \\ 5 & x_1 > 2 \\ \end{cases} 그러나 선형 모델입니까? 로 쓸 …

5
기본적인 머신 러닝 알고리즘을 배우기위한 좋은 데이터 세트는 무엇이며 그 이유는 무엇입니까?
나는 기계 학습에 익숙하지 않고 다른 기계 학습 알고리즘 (결정 트리, 부스팅, SVM 및 신경망) 간의 차이점을 비교하고 대조 할 수있는 일부 데이터 세트를 찾고 있습니다. 이러한 데이터 세트는 어디에서 찾을 수 있습니까? 데이터 세트를 고려하면서 무엇을 찾아야합니까? 좋은 데이터 세트를 가리키고 데이터 세트를 만드는 데 도움이된다면 좋을까요?

2
강화 : 왜 학습률이 정규화 매개 변수라고 불리는가?
그라디언트 부스팅 의 학습 속도 매개 변수 ( )는 시리즈에 추가 된 각각의 새 기본 모델 (일반적으로 얕은 나무)의 기여도를 줄입니다. 테스트 세트 정확도를 크게 향상시키는 것으로 나타 났으며, 이는 작은 단계에서와 같이 이해할 수있는 최소 손실 기능을보다 정확하게 얻을 수 있습니다. ν∈ [ 0 , 1 ]ν∈[0,1]\nu \in [0,1] …


2
“물류 회귀”라는 이름은 무엇을 의미합니까?
여기서 Logistic Regression의 구현을 확인하고 있습니다 . 그 기사를 읽은 후 중요한 부분은 S 자형 함수를 결정하는 가장 좋은 계수를 찾는 것 같습니다. 이 방법이 왜 "Logistic Regression"이라고 불리는 지 궁금합니다. 로그 함수와 관련이 있습니까? 어쩌면 그것을 이해하기 위해 역사적인 배경 정보가 필요할 수도 있습니다.

1
예측 모델링-혼합 모델링에 관심을 가져야합니까?
예측 모델링의 경우 무작위 효과 및 비 독립적 관측치 (반복 측정)와 같은 통계 개념에 관심을 가져야합니까? 예를 들어 ... 다양한 속성과 구매 플래그가있는 5 개의 DM 캠페인 (1 년 동안 발생) 데이터가 있습니다. 이상적으로는이 모든 데이터를 결합하여 캠페인 당시 고객 속성이 지정된 구매 모델을 구축하는 것이 이상적입니다. 구매 이벤트가 드물기 …


2
"가장 가까운 이웃"은 오늘 언제 의미가 있습니까?
1999 년 Beyer et al. 물었다 가 "가장 가까운 이웃"의미가? 1999 년 이후 NN 검색에서 거리 편평의 영향을 분석하고 시각화하는 더 좋은 방법이 있습니까? [주어진] 데이터 세트가 1-NN 문제에 대한 의미있는 답변을 제공합니까? 10-NN 문제? 100-NN 문제? 오늘날 전문가들이이 질문에 어떻게 접근 하시겠습니까? 월요일 1 월 24 일 수정 : …


6
매개 변수 추정을위한 머신 러닝의 '기본'아이디어는 무엇입니까?
모수 추정에 대한 통계의 '기본'아이디어는 최대 가능성 입니다. 기계 학습에서 해당 아이디어가 무엇인지 궁금합니다. Qn 1. 매개 변수 추정을위한 머신 러닝의 '기본'아이디어는 '손실 함수'라고 말할 수 있습니다. [참고 : 머신 러닝 알고리즘은 종종 손실 함수를 최적화하여 위의 질문에 대한 것입니다.] Qn 2 : 통계와 머신 러닝 사이의 격차를 해소하려는 문헌이 …

6
데이터 세트 샘플의 하이퍼 파라미터 튜닝이 나쁜 생각입니까?
이진 분류 (SVM, 로지스틱 회귀, 랜덤 포레스트 등)를위한 여러 분류기를 훈련하는 140000 개의 예와 30 개의 기능에 대한 데이터 세트가 있습니다. 많은 경우에 그리드 또는 랜덤 검색을 사용하는 전체 데이터 세트에 대한 하이퍼 파라미터 튜닝은 시간이 너무 많이 걸립니다. 나는 다음 기술을 사용하기 시작했다 하위 샘플 내 데이터 세트 획득 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.