«machine-learning» 태그된 질문

기계 학습 알고리즘은 훈련 데이터의 모델을 구축합니다. "기계 학습"이라는 용어는 모호하게 정의됩니다. 여기에는 통계 학습, 강화 학습, 비지도 학습 등이 포함됩니다. 항상 더 구체적인 태그를 추가하십시오.

11
테스트 세트와 유효성 검사 세트의 차이점은 무엇입니까?
Matlab에서 신경망 도구 상자를 사용할 때 혼란 스럽습니다. 원시 데이터 세트를 세 부분으로 나누었습니다. 훈련 세트 검증 세트 테스트 세트 많은 훈련 또는 학습 알고리즘에서 데이터는 종종 훈련 세트와 테스트 세트의 두 부분으로 나뉩니다. 내 질문은 : 검증 세트와 테스트 세트의 차이점은 무엇입니까? 유효성 검사가 실제로 신경망에만 적용됩니까? 또는 선택 …

20
두 문화 : 통계 대 기계 학습?
작년에 저는 Brendan O'Connor 의 "통계 vs. 기계 학습, 싸움!" 라는 블로그 게시물을 읽었습니다 . 두 필드의 차이점에 대해 논의했습니다. Andrew Gelman은 다음과 같이 호의적으로 반응했습니다 . 사이먼 블룸버그 : R의 운세 패키지에서 : 도발적으로 말하면, '기계 학습은 통계에서 모델과 가정의 확인을 뺀 통계입니다'. -Brian D. Ripley (머신 러닝과 통계의 …

5
K- 평균의 단점을 이해하는 방법
K- 평균은 군집 분석에서 널리 사용되는 방법입니다. 내 이해에 따르면,이 방법은 모든 가정을 필요로하지 않습니다. 즉, 데이터 세트와 미리 지정된 수의 클러스터 k를 주면됩니다. 클러스터 제곱 내에서 제곱 오차 (SSE)의 합계를 최소화하는이 알고리즘을 적용하면됩니다. 오류. k- 평균은 본질적으로 최적화 문제입니다. k- 평균의 단점에 대한 자료를 읽었습니다. 그들 대부분은 다음과 같이 …


8
유클리드 거리가 높은 차원에서 좋은 지표가 아닌 이유는 무엇입니까?
나는 '유클리드 거리는 높은 차원에서 좋은 거리가 아닙니다'라고 읽었습니다. 이 진술은 차원의 저주와 관련이 있다고 생각하지만 정확히 무엇입니까? 게다가 '높은 차원'이란 무엇입니까? 100 가지 기능을 갖춘 유클리드 거리를 사용하여 계층 적 클러스터링을 적용했습니다. 이 측정 항목을 사용하는 것이 '안전'한 기능은 몇 개입니까?

12
데이터 마이닝, 통계, 기계 학습 및 AI의 차이점은 무엇입니까?
데이터 마이닝, 통계, 기계 학습 및 AI의 차이점은 무엇입니까? 그것들이 매우 비슷한 문제를 해결하려고 시도하지만 다른 접근법을 가진 4 개의 분야라고 말하는 것이 정확합니까? 그들은 정확히 무엇을 공통점이 있으며 어디에서 다른가? 그들 사이에 어떤 종류의 계층이 있다면, 그것은 무엇입니까? 이전에 비슷한 질문이 있었지만 여전히 얻지 못했습니다. 데이터 마이닝 및 통계 …

3
머신 러닝 문제가 희망이 없다는 것을 아는 방법?
표준 기계 학습 시나리오를 상상해보십시오. 큰 다변량 데이터 세트에 직면하고 있으며 데이터에 대해 상당히 모호합니다. 당신이해야 할 일은 가지고있는 것을 기반으로 일부 변수에 대한 예측을하는 것입니다. 평소와 같이 데이터를 정리하고 기술 통계를보고 일부 모델을 실행하고 교차 검증하는 등 여러 번 시도한 후에 여러 모델을 시도하고 시도해도 아무런 효과가 없으며 결과가 …

4
신경망에서 숨겨진 계층은 무엇을 계산합니까?
많은 사람들이 'Google에 알려주세요'라는 링크로 응답 할 것이라고 확신합니다.이 사실을 이해하려고 노력했기 때문에 이해가 부족하다는 점을 용서해주십시오. 신경망의 실제 구현은 실제로 작동합니다. 입력 계층과 데이터를 정규화하는 방법을 이해하고 바이어스 단위도 이해하지만 숨겨진 계층에 대해서는 실제 계산이 해당 계층에 있으며 출력에 매핑되는 방식이 약간 안개 낀 것입니다. 숨겨진 레이어에 물음표가있는 다이어그램, …

9
왜 텐서에 갑자기 매료됩니까?
최근에 많은 사람들이 많은 방법 (텐서 분해, 텐서 커널, 주제 모델링을위한 텐서 등)과 같은 텐서를 개발하고 있음을 알았습니다. 왜 세상이 갑자기 텐서에 매료됩니까? 특히 놀라운 최신 논문 / 표준 결과가 있습니까? 이전에 예상했던 것보다 계산 비용이 훨씬 저렴합니까? 나는 냉담하지 않고, 진심으로 관심이 있으며, 이것에 관한 논문에 대한 조언이 있다면, …

3
ROC vs 정밀 및 회수 곡선
나는 그들 사이의 공식적인 차이점을 알고 있습니다. 내가 알고 싶은 것은 하나를 사용하는 것이 더 관련성이 높은시기입니다. 그들은 주어진 분류 / 탐지 시스템의 성능에 대한 보완적인 통찰력을 항상 제공합니까? 예를 들어 종이로 두 가지를 모두 제공하는 것이 합리적입니까? 하나 대신에? 분류 시스템에 대한 ROC 및 정밀 리콜의 관련 측면을 캡처하는 …

2
생식 대 차별
생성은 " 기반"을 의미하고 차별적 인 의미는 " 기반"을 의미 하지만 몇 가지 점에서 혼란스러워합니다.P ( y | x )피( x , y)P(x,y)P(x,y)피( y| x)P(y|x)P(y|x) Wikipedia (웹에서 발생하는 다른 많은 히트)는 SVM 및 의사 결정 트리와 같은 항목을 차별적 인 것으로 분류합니다. 그러나 이것들은 확률 론적 해석조차하지 않습니다. 여기서 차별적 …

6
심층 신경망에서 시그 모이 드 기능에 비해 ReLU의 장점은 무엇입니까?
비선형 성의 최첨단 기술은 심층 신경망에서 시그 모이 드 기능 대신 정류 선형 단위 (ReLU)를 사용하는 것입니다. 장점은 무엇입니까? ReLU를 사용할 때 네트워크를 훈련하는 것이 더 빠르며 생물학적으로 더 영감을 받는다는 것을 알고 있습니다. 다른 장점은 무엇입니까? (즉, S 자형을 사용하면 어떤 단점이 있습니까?)

5
교차 유효성 검사 후 전체 데이터 세트를 사용한 교육?
교차 유효성 검사 후 전체 데이터 세트 를 학습 하는 것이 항상 좋은 생각 입니까? 또 다른 방법으로 넣어, 그것은과 훈련 괜찮 모든 내 데이터 세트의 샘플 및 하지 이 특정 피팅 여부를 확인 할 수있는 overfits ? 문제에 대한 배경 지식 : 매개 변수화 된 모델 패밀리 가 있다고 …

4
K- 폴드 교차 검증에서 K의 선택
일부 학습 알고리즘의 성능을 평가하기 위해 폴드 교차 검증을 몇 번 사용했지만 항상 값을 선택하는 방법에 대해 의아해했습니다 .KKKKKKK 나는 종종 값을 보았고 사용 했지만 이것은 완전히 임의적 인 것처럼 보이며 이제는 생각하지 않고 습관으로 을 사용 합니다. 나에게 의 가치를 높이면 더 세분화 된 것처럼 보이므로 이상적으로는 크게 해야 …

7
선형 커널을 사용하는 SVM에서 C의 영향은 무엇입니까?
현재 데이터를 분류하기 위해 선형 커널과 함께 SVM을 사용하고 있습니다. 훈련 세트에 오류가 없습니다. 매개 변수 ( )에 여러 값을 시도했습니다 . 테스트 세트의 오류는 변경되지 않았습니다.CCC10−5,…,10210−5,…,10210^{-5}, \dots, 10^2 지금은 궁금해 :이 오류가 루비 바인딩으로 인한 위해 libsvm내가 (사용하고 RB-libsvm을 ) 또는 이것이 이론적으로 설명 할 ? 매개 변수 항상 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.