«machine-learning» 태그된 질문

기계 학습 알고리즘은 훈련 데이터의 모델을 구축합니다. "기계 학습"이라는 용어는 모호하게 정의됩니다. 여기에는 통계 학습, 강화 학습, 비지도 학습 등이 포함됩니다. 항상 더 구체적인 태그를 추가하십시오.

4
컨볼 루션 신경망에 얼마나 많은 데이터가 필요합니까?
약 1,000,000 개의 매개 변수가있는 CNN (Convolutional Neural Network)을 사용하는 경우 얼마나 많은 훈련 데이터가 필요한지 (확률 적 경사 하강을 가정하고 있음)? 경험 법칙이 있습니까? 추가 사항 : 확률 적 그라디언트 디센트 (예 : 1 회 반복 64 패치)를 수행 할 때 ~ 10000 회 반복 후 분류기의 정확도는 대략 …

4
잠재 기능의 의미?
추천 시스템의 매트릭스 인수 분해 모델을 이해하려고 노력하고 있으며 항상 '잠재적 기능'을 읽습니다. 그러나 그 의미는 무엇입니까? 기능이 교육 데이터 세트에 어떤 의미가 있는지 알고 있지만 잠재 기능에 대한 아이디어를 이해할 수 없습니다. 내가 찾을 수있는 주제에 대한 모든 문서는 너무 얕습니다. 편집하다: 적어도 아이디어를 설명하는 논문을 알려 주시면됩니다.

3
온라인 학습의 정규화 및 기능 확장?
로지스틱 회귀 분류 기가 있다고 가정 해 봅시다. 일반적인 배치 학습에서는 과적 합을 방지하고 체중을 작게 유지하는 정규화 용어가 있습니다. 또한 기능을 정규화하고 확장합니다. 온라인 학습 환경에서 지속적인 데이터 스트림을 받고 있습니다. 각 예제에서 그라디언트 하강 업데이트를 수행 한 다음 버립니다. 온라인 학습에서 기능 스케일링 및 정규화 용어를 사용해야합니까? 그렇다면 …


4
ROC 곡선의 장점
ROC 곡선의 장점은 무엇입니까? 예를 들어 바이너리 분류 문제 인 일부 이미지를 분류하고 있습니다. 약 500 개의 기능을 추출하고 기능 선택 알고리즘을 적용하여 기능 세트를 선택한 다음 분류를 위해 SVM을 적용했습니다. 이 경우 어떻게 ROC 곡선을 얻을 수 있습니까? 기능 선택 알고리즘의 임계 값을 변경하고 ROC 곡선을 그리려면 출력의 감도와 …

7
주식 시장을 예측하기 위해 어떤 기계 학습 알고리즘을 사용할 수 있습니까?
또는 외환 시장을 예측합니다. 나는 이것이 꽤 복잡해질 수 있다는 것을 알고 있으므로 소개로서 정확성이있는 간단한 예측 알고리즘을 찾고 있습니다. (4 개월간 지속되는 M.Sc. 대학교 프로젝트) 다층 신경망이 유용 할 수 있다는 것을 읽었습니다. 그것에 대한 생각? 또한 소셜 미디어의 의미 론적 분석은 주식 시장에 영향을 미치는 시장 행동에 대한 …

5
일련의 입력에 대해 어떤 통계적 분류 알고리즘이 참 / 거짓을 예측할 수 있습니까?
일련의 입력이 주어지면이 시퀀스에 원하는 특정 속성이 있는지 확인해야합니다. 이 속성은 true 또는 false 만 가능합니다. 즉 시퀀스에 속할 수있는 클래스는 두 개뿐입니다. 시퀀스와 속성 간의 정확한 관계는 불분명하지만, 이것이 매우 일관되고 통계적 분류에 적합하다고 생각합니다. 분류기를 훈련시키는 사례가 많이 있지만,이 훈련 세트에서 시퀀스에 잘못된 클래스가 할당 될 가능성이 약간 …

1
단일 ReLU가 ReLU를 배울 수없는 이유는 무엇입니까?
내 신경망에 대한 후속 조치로 유클리드 거리를 알 수조차 없으므로 나는 더 단순화하고 단일 ReLU (임의의 무게로)를 단일 ReLU로 훈련하려고했습니다. 이것은 가장 간단한 네트워크이지만 수렴하지 못하는 시간의 절반입니다. 초기 추측이 목표와 같은 방향에 있다면, 빠르게 학습하고 올바른 가중치 1로 수렴합니다. 초기 추측이 "뒤로"이면, 가중치 0에 갇히고 더 낮은 손실 영역으로 …

3
KL (Kullback-Leibler) 발산의 최대 값은 얼마입니까?
파이썬 코드에서 KL 분기를 사용 하고이 자습서를 얻었습니다 . 이 튜토리얼에서 KL 분기를 구현하는 것은 매우 간단합니다. kl = (model * np.log(model/actual)).sum() 이해 된 바와 같이, 확률 분포 model및 actual<= 1이어야한다. 내 질문은 k의 최대 한계 / 최대 가능한 값은 무엇입니까?입니다. 내 코드의 최대 경계와 관련하여 kl 거리의 최대 값을 …

2
머신 러닝에서 Bayes Error는 무엇입니까?
http://www.deeplearningbook.org/contents/ml.html 페이지 116에 베이 오류가 설명되어 있습니다. 이상적인 모델은 데이터를 생성하는 실제 확률 분포를 단순히 알고있는 오라클입니다. 이러한 모델조차도 많은 문제에서 여전히 약간의 오류가 발생합니다. 왜냐하면 분포에 약간의 노이즈가있을 수 있기 때문입니다. 지도 학습의 경우, x에서 y 로의 매핑은 본질적으로 확률 론적이거나 y는 x에 포함 된 것 이외의 다른 변수를 …

3
머신 러닝에서 데이터 누락 문제를 해결하는 방법
기계 학습 알고리즘을 사용하여 예측하려는 거의 모든 데이터베이스는 일부 특성에 대해 누락 된 값을 찾습니다. 결 측값이있는 선을 제외하여 특성의 평균값으로 채워질 때 까지이 문제를 해결하는 몇 가지 방법이 있습니다. 기본적으로 종속 변수 (Y)가 누락 된 값을 가진 각 열이 될 수있는 회귀 (또는 다른 방법)를 실행하는 다소 강력한 접근 …

2
정밀 리콜 곡선에서 "기준선"이란 무엇입니까
정밀 리콜 곡선을 이해하려고하지만 정밀도와 리콜이 무엇인지 이해하지만 이해하지 못하는 것은 "기준"값입니다. 나는이 링크를 읽고 있었다 https://classeval.wordpress.com/introduction/introduction-to-the-precision-recall-plot/ "완벽한 분류기의 정밀 리콜 곡선"에 표시된대로 기준 부분을 이해하지 못합니까? 어떻게 계산합니까? 우리가 선택한 임의의 기준입니까? 예를 들어 retweet,status_countetc와 같은 속성을 가진 트위터 데이터가 있고 내 클래스 레이블은 FavoritedFavorited 이면 1이고 Favorited가 아닌 …

2
신경망의 배치 학습 방법에서 가중치는 어떻게 업데이트됩니까?
일괄 처리 방법을 사용하여 신경망을 구축하는 방법을 알려주시겠습니까? 배치 모드에서 훈련 세트의 모든 샘플에 대해 네트워크의 각 뉴런에 대한 오류, 델타 및 델타 가중치를 계산 한 다음 즉시 가중치를 업데이트하는 대신 가중치를 누적 한 다음 시작하기 전에 다음 시대, 우리는 가중치를 업데이트합니다. 또한 배치 방법은 온라인 방법과 비슷하지만 차이점은 훈련 …

1
임의 포리스트에 상호 작용 용어 포함
반응 Y와 예측 변수 X1, ...., Xn이 있다고 가정합니다. X1, ...., Xn의 선형 모델을 통해 Y를 맞추려고했는데 Y와 X1, ..., Xn 사이의 진정한 관계가 선형이 아니었을 때 어떻게 든 X를 변환 한 다음 모델을 피팅하여 모델을 수정하십시오. 또한 X1, ..., XN이 다른 기능과 독립적으로 y에 영향을 미치지 않는 경우에도 상호 …

2
Top-n precision 정의
이미지 분류에 관한 과학 논문을 읽고 있습니다. 실험 결과에서 그들은 1 위와 5 위의 정확도에 대해 이야기하지만 용어를 들어 본 적이 없으며 Google을 사용하여 찾을 수 없습니다. 누군가 나에게 정의를 주거나 어딘가에 나를 가리킬 수 있습니까? :)

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.