«machine-learning» 태그된 질문

기계 학습 알고리즘은 훈련 데이터의 모델을 구축합니다. "기계 학습"이라는 용어는 모호하게 정의됩니다. 여기에는 통계 학습, 강화 학습, 비지도 학습 등이 포함됩니다. 항상 더 구체적인 태그를 추가하십시오.

2
R의 랜덤 포레스트 분류에서 예측 변수 세트의 상대적 중요성
randomForestR의 분류 모델에 대한 변수 집합의 상대적인 중요성을 결정하고 싶습니다 .이 importance함수는 MeanDecreaseGini각 개별 예측 변수에 대한 메트릭을 제공합니다 . 집합의 각 예측 변수를 합산하는 것만 큼 간단합니까? 예를 들면 다음과 같습니다. # Assumes df has variables a1, a2, b1, b2, and outcome rf <- randomForest(outcome ~ ., data=df) importance(rf) …

2
libsvm 데이터 형식 [닫힘]
지원 벡터 분류를 위해 libsvm ( http://www.csie.ntu.edu.tw/~cjlin/libsvm/ ) 도구를 사용하고 있습니다. 그러나 입력 데이터의 형식이 혼란 스럽습니다. 읽어보기에서 : 교육 및 테스트 데이터 파일의 형식은 다음과 같습니다. <label> <index1>:<value1> <index2>:<value2> ... . . . 각 줄은 인스턴스를 포함하며 '\ n'문자로 끝납니다. 분류의 <label>경우 클래스 레이블을 나타내는 정수입니다 (다중 클래스 지원). …

3
기능 엔지니어링 유틸리티 : 기존 기능을 기반으로 새 기능을 작성하는 이유는 무엇입니까?
사람들이 기계 학습 문제의 기존 기능을 기반으로 새로운 기능을 만드는 경우가 종종 있습니다. 예를 들어, 여기 : https://triangleinequality.wordpress.com/2013/09/08/basic-feature-engineering-with-the-titanic-data/ 사람들은 가족의 크기를 새로운 기능으로 간주했습니다. 기존 기능이었던 형제 자매 및 부모의 수 그러나 이것의 요점은 무엇입니까? 상관 관계가있는 새로운 기능을 만드는 것이 왜 유용한 지 모르겠습니다. 자체적으로 알고리즘을 수행하는 것이 아닌가요?

7
검증 정확도가 왜 변동합니까?
MRI 데이터를 사용하여 암에 대한 반응을 예측하는 4 계층 CNN이 있습니다. ReLU 활성화를 사용하여 비선형 성을 도입합니다. 열차 정확도와 손실은 각각 단조 증가하고 감소합니다. 그러나 테스트 정확도가 크게 변동하기 시작합니다. 학습 속도를 변경하려고 시도하고 레이어 수를 줄였습니다. 그러나 변동을 멈추지 않습니다. 나는이 답변을 읽고 그 답변의 지시를 따르려고했지만 다시 운이 …

2
지도 학습, 비지도 학습 및 강화 학습 : 워크 플로 기본 사항
지도 학습 1) 인간은 입력 및 출력 데이터를 기반으로 분류기를 작성합니다. 2) 해당 분류기는 훈련 데이터 세트로 훈련됩니다. 3) 해당 분류기는 테스트 데이터 세트로 테스트됩니다. 4) 출력 이 만족스러운 경우 배포 "이 데이터를 분류하는 방법을 알고 있습니다. 분류 도구를 사용하려면 정렬해야합니다." 방법의 포인트 : 레이블을 분류하거나 실수를 생성하는 방법 비지도 …

7
추론 대 추정?
기계 학습 의 맥락에서 "추론"과 "추정"의 차이점은 무엇입니까 ? 초보자로서 우리는 임의 변수를 추론 하고 모델 매개 변수를 추정 한다고 생각합니다 . 내 이해가 맞습니까? 그렇지 않다면 차이점은 무엇이며 언제 사용해야합니까? 또한 "학습"의 동의어는 무엇입니까?

2
컨볼 루션 신경망 : 중앙 뉴런이 출력에서 ​​과도하게 표현되지 않습니까?
[이 질문은 또한 스택 오버플로 에서 제기되었습니다 ] 짧은 질문 나는 회선 신경 네트워크를 연구하고 있는데,이 네트워크가 모든 입력 뉴런 (픽셀 / 파라미터)을 동등하게 취급하지는 않는다고 생각합니다. 일부 입력 이미지에 컨볼 루션을 적용하는 딥 네트워크 (다중 레이어)가 있다고 가정합니다. 이미지의 "중간"에있는 뉴런은 더 깊은 층 뉴런에 대한 많은 고유 한 …

8
데이터 마이닝 및 머신 러닝을 준비하기 위해 어떤 수학 과목을 제안 하시겠습니까?
데이터 마이닝 및 기계 학습을 준비하기 위해 자체 지시 수학 커리큘럼을 구성하려고합니다. 이것은 코스타에서 Andrew Ng의 머신 러닝 수업 을 시작 하고 진행하기 전에 수학 능력을 향상시켜야한다고 느꼈습니다. 얼마 전 대학을 졸업 했으므로 대수와 통계 (특히 정치 과학 / 심리학 수업)는 녹슬 었습니다. 스레드의 답 수학의 강력한 배경이 ML의 전제 …

3
멀티 클래스 분류기의 품질을 결정하는 방법
주어진 모든 인스턴스 정확히 하나의 클래스 속하는 클래스 와 함께 인스턴스 를 가진 데이터 세트xixix_iNNNxixix_iyiyiy_i 멀티 클래스 분류기 훈련 및 테스트 후 기본적으로 테스트 세트의 모든 인스턴스 에 대해 실제 클래스 및 예상 클래스 가있는 테이블이 있습니다. 따라서 모든 인스턴스에 대해 일치하는 ( ) 또는 누락 된 ( ) 있습니다.yiyiy_iaiaia_ixixix_iyi=aiyi=aiy_i= …

4
문자열 파싱을위한 머신 러닝 기술?
많은 주소 문자열이 있습니다. 1600 Pennsylvania Ave, Washington, DC 20500 USA 구성 요소로 구문 분석하고 싶습니다. street: 1600 Pennsylvania Ave city: Washington province: DC postcode: 20500 country: USA 그러나 물론 데이터는 더러워집니다. 여러 언어로 작성된 많은 국가에서 다른 방식으로 작성되었으며 철자가 틀리거나 조각이 없거나 여분의 정크가 있습니다. 현재 우리의 접근 …

4
클래스 불균형 하에서 정밀 리콜 곡선 최적화
나는 많은 예측 변수가있는 분류 작업을 가지고 있는데 (그중 하나가 가장 유익합니다) MARS 모델을 사용하여 분류기를 구성하고 있습니다 (나는 간단한 모델에 관심이 있으며 설명을 위해 glms를 사용하는 것은 다음과 같습니다) 미세 너무). 이제 훈련 데이터 (각 양성 샘플에 대해 약 2700 개의 음성 샘플)에 큰 클래스 불균형이 있습니다. Information Retrieval …

3
R은 텍스트 분류 작업으로 얼마나 잘 확장됩니까? [닫은]
R로 속도를 높이려고합니다. 결국 텍스트 분류를 위해 R 라이브러리를 사용하고 싶습니다. 텍스트 분류를 할 때 R의 확장 성과 관련하여 사람들의 경험이 무엇인지 궁금합니다. 고차원 데이터 (~ 300k 크기)에 빠질 수 있습니다. 특히 분류 알고리즘으로 SVM과 Random Forest를 사용하고 있습니다. R 라이브러리가 문제 크기에 맞게 확장됩니까? 감사. 편집 1 : 명확히하기 …


6
로지스틱 회귀와 퍼셉트론의 차이점은 무엇입니까?
앤드류 응의 머신 러닝 강의 노트 를 보겠습니다 . 메모는 우리에게 로지스틱 회귀와 퍼셉트론을 소개합니다. Perceptron을 설명하는 동안 메모는 로지스틱 회귀에 사용되는 임계 값 함수의 정의 만 변경한다고 말합니다. 그런 다음 Perceptron 모델을 사용하여 분류 할 수 있습니다. 내 질문은-이것이 지정되어야하고 Perceptron을 분류 기술로 고려한다면 로지스틱 회귀는 정확히 무엇입니까? 클래스 …

5
GBM에서 상호 작용 깊이는 무엇을 의미합니까?
R에서 gbm의 상호 작용 깊이 매개 변수에 대한 질문이 있습니다. 이것은 멍청한 질문 일 수 있지만 사과 할 수는 있지만 트리의 터미널 노드 수를 나타내는 매개 변수는 기본적으로 X-way를 나타냅니다. 예측 자들 사이의 상호 작용? 그것이 어떻게 작동하는지 이해하려고 노력합니다. 또한 두 요인 변수가 단일 요인으로 결합 된 경우를 제외하고 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.