«machine-learning» 태그된 질문

머신 러닝 알고리즘에 대한 구현 질문. 기계 학습에 대한 일반적인 질문은 해당 커뮤니티에 게시해야합니다.

21
데이터 마이닝에서 분류와 클러스터링의 차이점은 무엇입니까? [닫은]
폐쇄되었습니다 . 이 질문은 더 집중되어야 합니다. 현재 답변을받지 않습니다. 이 질문을 개선하고 싶습니까? 이 게시물 을 편집 하여 한 가지 문제에만 집중할 수 있도록 질문을 업데이트하십시오 . 작년에 문을 닫았 습니다 . 이 질문을 개선하십시오 데이터 마이닝에서 분류와 클러스터링의 차이점이 무엇인지 설명 할 수 있습니까? 가능하다면 주요 아이디어를 이해하기 …

7
데이터 집합을 교육 및 유효성 검사 집합으로 나누는 방법에 대한 규칙이 있습니까?
데이터를 교육 및 유효성 검사 세트로 가장 잘 나누는 방법에 대한 규칙이 있습니까? 50/50 분할도 권장됩니까? 또는 검증 데이터와 비교하여 더 많은 학습 데이터를 갖는 명백한 이점이 있습니까 (또는 그 반대)? 아니면이 선택이 응용 프로그램에 따라 크게 달라 집니까? 나는 주로 교육 및 검증 데이터의 80 % / 20 %를 …

6
scikit-learn에서 분류자를 디스크에 저장
훈련 된 Naive Bayes 분류기 를 디스크에 저장하고 이를 사용하여 데이터 를 예측하는 방법은 무엇입니까? scikit-learn 웹 사이트의 다음 샘플 프로그램이 있습니다. from sklearn import datasets iris = datasets.load_iris() from sklearn.naive_bayes import GaussianNB gnb = GaussianNB() y_pred = gnb.fit(iris.data, iris.target).predict(iris.data) print "Number of mislabeled points : %d" % (iris.target != …


14
고차원 데이터에서 가장 가까운 이웃?
내가 질문 한 질문 몇 일이 주어진 벡터의 가장 가까운 이웃을 찾는 방법에 백업합니다. 머신 러닝이나 수학 분야가 아니기 때문에 내 벡터는 이제 21 차원이며 계속 진행하기 전에 몇 가지 근본적인 질문을하기 시작했습니다. 유클리드 거리는 가장 가까운 이웃을 찾기에 좋은 지표입니까? 그렇지 않은 경우 내 옵션은 무엇입니까? 또한 k- 이웃을 …

11
binary_crossentropy와 categorical_crossentropy가 동일한 문제에 대해 다른 성능을 제공하는 이유는 무엇입니까?
주제별로 텍스트를 분류하도록 CNN을 훈련하려고합니다. 이진 교차 엔트로피를 사용하면 ~ 80 % 정확도를 얻을 수 있으며 범주 형 교차 엔트로피를 사용하면 ~ 50 % 정확도를 얻을 수 있습니다. 왜 그런지 이해할 수 없습니다. 그것은 다중 클래스 문제입니다. 즉, 범주 교차 엔트로피를 사용해야하며 이진 교차 엔트로피 결과가 의미가 없다는 것을 의미하지 …



9
인공 신경망에 대한 입력을 정규화해야하는 이유는 무엇입니까?
신경망 이론에 관한 주요 질문입니다. 신경망의 입력을 정규화해야하는 이유는 무엇입니까? 때로는 입력 값이 숫자가 아닌 경우 특정 변환을 수행해야하지만 숫자 입력이있는 경우가 있음을 이해합니다. 숫자가 일정한 간격을 유지해야하는 이유는 무엇입니까? 데이터가 정규화되지 않으면 어떻게됩니까?

5
데이터를 3 세트 (트레인, 검증 및 테스트)로 나누는 방법은 무엇입니까?
팬더 데이터 프레임이 있으며 3 개의 별도 세트로 나누고 싶습니다. train_test_split from 을 사용 sklearn.cross_validation하면 데이터를 두 세트 (트레인 및 테스트)로 나눌 수 있습니다. 그러나 데이터를 세 세트로 나누는 방법에 대한 해결책을 찾지 못했습니다. 바람직하게는 원본 데이터의 색인을 갖고 싶습니다. 해결 방법은 train_test_split두 번 사용 하고 어떻게 든 색인을 조정하는 …

4
TensorFlow, 왜 파이썬이 선택한 언어입니까?
나는 최근에 딥 러닝 및 기타 ML 기술을 연구하기 시작했으며, 네트 구축 및 교육 과정을 단순화하는 프레임 워크를 검색하기 시작했으며 현장에서 경험이 거의없는 TensorFlow를 찾았습니다. 딥 러닝으로 작업하는 경우 더 큰 ML 시스템을 만드는 데 큰 요인이됩니다. 왜 Google이 TensorFlow를 만들기 위해 파이썬을 선택 했습니까? 컴파일하고 해석 할 수없는 언어로 …

8
신경망이 아닌 유전자 알고리즘을 언제 사용해야합니까? [닫은]
현재로서는이 질문이 Q & A 형식에 적합하지 않습니다. 답변, 사실, 참고 자료 또는 전문 지식을 통해 답변이 뒷받침 될 것으로 예상되지만이 질문은 토론, 논쟁, 여론 조사 또는 광범위한 토론을 요구할 것입니다. 이 질문을 개선하고 다시 열 수 있다고 생각 되면 도움말 센터 를 방문하여 안내를 받으십시오 . 휴일 칠년 전에 …

7
시각적 입력을 사용하여 디아블로 2를 재생하도록 인공 신경망을 훈련시키는 방법은 무엇입니까?
현재 ANN에서 비디오 게임을하려고하는데 멋진 커뮤니티의 도움을 받기를 원했습니다. 나는 디아블로 2에 정착했다. 게임 플레이는 실시간으로 그리고 아이소 메트릭 관점에서 볼 때, 플레이어는 카메라가 중앙에있는 단일 아바타를 제어한다. 일을 구체적으로 만들기 위해, 임무는 몬스터를 죽이면 체력이 0으로 떨어지지 않고 캐릭터 x 경험치를 얻는 것입니다. 게임 플레이의 예는 다음과 같습니다. 이제는 …

12
역 전파 신경망에서 비선형 활성화 함수를 사용해야하는 이유는 무엇입니까?
신경망에서 몇 가지 내용을 읽었으며 단일 계층 신경망의 일반적인 원리를 이해합니다. 추가 레이어의 필요성을 이해하지만 왜 비선형 활성화 함수가 사용됩니까? 이 질문은 다음과 같습니다 : 역 전파에 사용되는 활성화 함수의 파생물은 무엇입니까?

20
Python에서 핫 인코딩을 어떻게 할 수 있습니까?
80 % 범주 형 변수가있는 기계 학습 분류 문제가 있습니다. 분류에 일부 분류자를 사용하려면 핫 인코딩을 하나 사용해야합니까? 인코딩없이 분류기에 데이터를 전달할 수 있습니까? 기능 선택을 위해 다음을 수행하려고합니다. 기차 파일을 읽었습니다. num_rows_to_read = 10000 train_small = pd.read_csv("../../dataset/train.csv", nrows=num_rows_to_read) 카테고리 기능의 유형을 '카테고리'로 변경합니다. non_categorial_features = ['orig_destination_distance', 'srch_adults_cnt', 'srch_children_cnt', 'srch_rm_cnt', …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.