«machine-learning» 태그된 질문

기계 학습 알고리즘은 훈련 데이터의 모델을 구축합니다. "기계 학습"이라는 용어는 모호하게 정의됩니다. 여기에는 통계 학습, 강화 학습, 비지도 학습 등이 포함됩니다. 항상 더 구체적인 태그를 추가하십시오.

2
k- 폴드 교차 검증의 분산 추정치
K- 폴드 교차 검증은 주어진 분류기의 일반화 능력을 추정하는 데 사용될 수 있습니다. 분산의 더 나은 추정치를 얻기 위해 모든 검증 실행에서 풀링 된 분산을 계산할 수 있습니까? 그렇지 않다면 왜? 교차 검증 실행에서 풀링 된 표준 편차를 사용하는 논문을 발견했습니다 . 나는 또한 검증 분산에 대한 보편적 추정기 가 …

3
감독 된 머신 러닝 모델이 과적 합인지 판단하는 방법?
감독 된 머신 러닝 모델이 과적 합인지 판단하는 방법을 아는 사람이 있습니까? 외부 검증 데이터 세트가없는 경우 10 배 교차 검증의 ROC를 사용하여 과적 합을 설명 할 수 있는지 알고 싶습니다. 외부 유효성 검사 데이터 집합이있는 경우 다음에 어떻게해야합니까?

5
심층 신경망은 정규화없이 곱셈 함수에 근접 할 수 있습니까?
f = x * y표준 심층 신경망을 사용하여 단순하게 회귀를 원한다고 가정 해 봅시다 . 하나의 숨겨진 레이어를 가진 NN이 어떤 기능을 수행 할 수 있음을 알려주는 reserache가 있다는 것을 기억합니다. 그러나 정규화없이 NN 은이 단순한 곱셈조차도 근사 할 수 없었습니다. 데이터의 로그 정규화 만 도움 m = x*y => …


1
절제 연구 란 무엇입니까? 그리고 그것을 수행하는 체계적인 방법이 있습니까?
절제 연구 란 무엇입니까? 그리고 그것을 수행하는 체계적인 방법이 있습니까? 예를 들어 선형 회귀 분석에 예측 변수가 있으며이를 모형이라고합니다.엔엔n 절제 연구는 어떻게 수행합니까? 어떤 측정 항목을 사용해야합니까? 포괄적 인 출처 또는 교과서가 좋습니다.


1
통계, 선형 대수 및 기계 학습에서 고전적인 표기법은 무엇입니까? 그리고이 표기법들 사이의 관계는 무엇입니까?
우리가 책을 읽을 때, 표기법을 이해하는 것은 내용을 이해하는 데 매우 중요한 역할을합니다. 불행히도, 다른 커뮤니티는 모델의 공식화와 최적화 문제에 대해 다른 표기법을 가지고 있습니다. 여기에 몇 가지 공식 표기법을 요약하고 가능한 이유를 제시 할 수 있습니까? 선형 대수 문학에서 고전 서적은 Strang의 선형 대수학 소개 입니다. 이 책에서 가장 …

6
ROC AUC와 F1 점수 중에서 선택하는 방법은 무엇입니까?
나는 최근 경쟁 요구 사항에 따라 roc auc 점수가 사용되는 Kaggle 경쟁을 완료했습니다. 이 프로젝트 이전에는 일반적으로 f1 점수를 메트릭으로 사용하여 모델 성능을 측정했습니다. 앞으로이 두 지표 중에서 어떻게 선택해야하는지 궁금합니다. 언제 어떤 것을 사용해야하며 각각의 장단점이 무엇입니까? Btw, 나는 기사를 읽었습니다. AUC와 F1 점수의 차이점은 무엇입니까? 그러나 언제 어느 …

1
svm에서 일대일 및 일대일?
일대일 및 일대일 SVM 분류기의 차이점은 무엇입니까? one-vs-all은 새로운 이미지의 모든 유형 / 범주를 분류하는 하나의 분류자를 의미하고 one-vs-one은 다른 분류 자로 분류되는 새로운 이미지의 각 유형 / 범주를 의미합니까 (각 범주는 특수 분류 자에 의해 처리됨)? 예를 들어, 새 이미지가 원, 사각형, 삼각형 등으로 분류되는 경우

4
SVM에서 커널의 차이점은 무엇입니까?
누군가 SVM에서 커널의 차이점을 말해 줄 수 있습니까? 선의 다항식 가우시안 (RBF) 시그 모이 드 우리가 알고 있듯이 커널은 입력 공간을 높은 차원의 기능 공간으로 매핑하는 데 사용됩니다. 그리고 그 특징 공간에서 우리는 선형으로 분리 가능한 경계를 찾습니다. 그것들은 언제 (어떤 조건 하에서) 사용되며 왜 그런가?

3
주제 모델 및 단어 동시 발생 방법
LDA와 같은 인기있는 주제 모델은 일반적으로 같은 주제 (클러스터)로 함께 발생하는 단어를 묶습니다. 이러한 주제 모델과 PMI와 같은 다른 간단한 동시 발생 기반 클러스터링 방식의 주요 차이점은 무엇입니까? (PMI는 Pointwise Mutual Information의 약자이며 주어진 단어와 함께 발생하는 단어를 식별하는 데 사용됩니다.)

2
신경망 : 이진 분류의 경우 1 개 또는 2 개의 출력 뉴런을 사용합니까?
이진 분류를 수행하고 싶다고 가정합니다 (뭔가 클래스 A 또는 클래스 B에 속함). 신경망의 출력 레이어에서이를 수행 할 수있는 몇 가지 가능성이 있습니다. 1 개의 출력 노드를 사용하십시오. 출력 0 (<0.5)은 클래스 A로 간주되고 1 (> = 0.5)은 클래스 B로 간주됩니다 (시그 모이 드의 경우). 2 개의 출력 노드를 사용하십시오. 입력은 …

1
훈련 손실이 점점 줄어 듭니다. 무슨 일이야?
훈련 손실이 줄어들었다가 다시 증가합니다. 매우 이상합니다. 교차 검증 손실은 훈련 손실을 추적합니다. 무슨 일이야? Keras에서 다음과 같이 두 개의 스택 LSTMS가 있습니다. model = Sequential() model.add(LSTM(512, return_sequences=True, input_shape=(len(X[0]), len(nd.char_indices)))) model.add(Dropout(0.2)) model.add(LSTM(512, return_sequences=False)) model.add(Dropout(0.2)) model.add(Dense(len(nd.categories))) model.add(Activation('sigmoid')) model.compile(loss='binary_crossentropy', optimizer='adadelta') 나는 100 Epochs를 위해 그것을 훈련시킵니다. model.fit(X_train, np.array(y_train), batch_size=1024, nb_epoch=100, validation_split=0.2) 127803 …

4
왜 누군가 회귀에 KNN을 사용합니까?
내가 이해 한 바에 따르면 훈련 데이터 간격 내에있는 회귀 함수 만 작성할 수 있습니다. 예를 들어 (패널 중 하나만 필요합니다) : KNN 회귀자를 사용하여 미래를 어떻게 예측할 수 있습니까? 다시 말하지만, 훈련 데이터의 간격 내에있는 함수에 근사한 것으로 보입니다. 내 질문 : KNN 회귀자를 사용하면 어떤 이점이 있습니까? 분류를위한 …

2
캐럿에서 cv와 repeatcv의 실제 차이점은 무엇입니까?
이것은 질문 캐럿 리샘플링 방법 과 유사 하지만, 실제로이 부분에 대해서는 합의 된 방식으로 답변 한 적이 없습니다. 캐럿의 열차 기능 제공 cv및 repeatedcv. 말하는 것과의 차이점은 무엇입니까? MyTrainControl=trainControl( method = "cv", number=5, repeats=5 ) vs MyTrainControl=trainControl( method = "repeatedcv", number=5, repeats=5 ) cv세트를 k- 폴드 (parameter number) 로 나누고 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.