«machine-learning» 태그된 질문

"경험에 따라 자동으로 개선되는 컴퓨터 시스템"을 구축하는 방법과 원리.

2
scikit 분류 기준을 분류하는 데 시간이 얼마나 걸립니까?
1 백만 개의 레이블이 지정된 문서로 구성된 모음에서 텍스트 분류를 위해 scikit 선형 지원 벡터 머신 (SVM) 분류기를 사용할 계획입니다. 내가 할 계획은 사용자가 키워드를 입력하면 분류자가 먼저 범주별로 분류 한 다음 해당 범주 범주의 문서 내에서 후속 정보 검색 쿼리가 발생한다는 것입니다. 몇 가지 질문이 있습니다. 분류에 많은 시간이 …

2
신경망 디버깅
scipy.optimize.minimize (Conjugate gradient) 최적화 기능을 사용하여 파이썬에서 인공 신경망을 만들었습니다. 그라디언트 확인을 구현하고 모든 것을 다시 확인했으며 올바르게 작동하는지 확신합니다. 나는 그것을 몇 번 실행했고 '최적화가 성공적으로 종료되었습니다'에 도달했지만 숨겨진 레이어 수를 늘리면 성공적으로 종료 된 후 가설 비용이 증가합니다 (다른 모든 항목은 동일하게 유지됨). 직관적으로 데이터를 더 잘 맞출 …

2
주어진 단어를 이름, 휴대폰 번호, 주소, 이메일, 주, 카운티, 도시 등으로 분류하는 데 사용되는 기계 / 딥 러닝 / nlp 기술
단어 또는 문자열 집합을 스캔하고 기계 학습 또는 딥 러닝을 사용하여 이름, 휴대폰 번호, 주소, 도시, 주, 국가 및 기타 엔티티로 분류 할 수있는 지능형 모델을 생성하려고합니다. 나는 접근법을 찾았지만 불행히도 취할 접근법을 찾지 못했습니다. 나는 끈이 이름인지 도시인지를 예측하기 위해 bag of words 모델과 gloved word embedding을 사용해 보았습니다. …

1
멀티 클래스 데이터 세트에서 분류가 잘못되는 불균형 데이터
39 개의 카테고리 / 클래스와 850 만 개의 레코드가있는 텍스트 분류 작업을하고 있습니다. (향후 데이터 및 카테고리가 증가 할 것입니다). 내 데이터의 구조 또는 형식은 다음과 같습니다. ---------------------------------------------------------------------------------------- | product_title | Key_value_pairs | taxonomy_id | ---------------------------------------------------------------------------------------- Samsung S7 Edge | Color:black,Display Size:5.5 inch,Internal | 211 Storage:128 GB, RAM:4 GB,Primary Camera:12 …

2
올바른 지점을 선택하기 위해 적용 할 알고리즘
아래 그림은 원점 주위의 7 점을 보여줍니다. 그 중 하나는 규칙과 경험에 따라 인간에 의해 선택되었으며 빨간색 (왼쪽 아래 사분면에있는 것)으로 표시됩니다. 이제 우리는이 포인트 세트 중 1000 개가 넘고 각 세트마다 인간이 단일 포인트를 선택했습니다. 이 조건은 모든 세트에 적용됩니다. 각 세트는 약 3-10 포인트 특이 치가 없습니다 점은 …

1
클래스 중 하나가 다른 클래스 중 하나에 의해 정의되지 않은 분류 문제에 어떻게 접근합니까?
세 가지 수업에 관심이 있다고 가정 해 봅시다. 씨1c1c_1, 씨2c2c_2, 씨삼c3c_3. 그러나 내 데이터 세트에는 실제로 몇 가지 실제 클래스가 더 있습니다.(씨제이)엔j = 4(cj)j=4n(c_j)_{j=4}^n. 확실한 대답은 새로운 클래스를 정의하는 것입니다 씨^4c^4\hat c_4 그것은 모든 클래스를 참조 cjcjc_j, j>3j>3j>3 그러나 나는 샘플이 있기 때문에 이것이 좋은 생각이 아니라고 생각합니다. c^4c^4\hat c_4 …

2
“깊은 노드의 정리”: 대칭 제약 조건 구축
고유 한 대칭을 가져야하는 학습 문제가있는 경우 학습 문제를 대칭 제약 조건에 적용하여 학습을 향상시키는 방법이 있습니까? 예를 들어 이미지 인식을하는 경우 2D 회전 대칭을 원할 수 있습니다. 이미지의 회전 된 버전이 원본과 동일한 결과를 가져야 함을 의미합니다. 또는 틱택 토 게임을 배우는 경우 90도 회전하면 동일한 게임 플레이가 가능합니다. …

3
하이퍼 파라미터 튜닝 기준 테스트 데이터 및 모델 선택 기반 검증 데이터를 수행 한 후 전체 데이터에 대해 최종 모델을 학습하지 않는 이유는 무엇입니까?
전체 데이터에서 나는 훈련 + 테스트 + 검증을 의미합니다. 유효성 검사 데이터를 사용하여 하이퍼 파라미터를 수정하고 테스트 데이터를 사용하여 모델을 선택하면 전체 데이터에 대해 모델을 학습하여 모델을 학습하는 것보다 매개 변수를 더 잘 학습하는 것이 좋습니다. 열차 데이터

1
컨벌루션 레이어의 매개 변수 수
에서 이 많이 인용 논문 , 저자는 체중 매개 변수의 수에 대한 다음의 설명을 제공합니다. 왜 그런지 잘 모르겠습니다49씨249C249C^2매개 변수. 나는 그것이 있어야한다고 생각49 C49C49C 각각의 이후 씨CC 입력 채널은 동일한 필터를 공유합니다. 494949 매개 변수.

3
클래식 CV 템플릿 일치에 대한 육안 검사 작업에 컨볼 루션 NN을 사용하는 이유는 무엇입니까?
우리가 작업하고있는 프로젝트를 바탕으로 흥미로운 토론을했습니다. 왜 템플릿 매칭 알고리즘보다 CNN 육안 검사 시스템을 사용합니까? 배경 : 특정 유형의 물체가 "깨지거나"결함이 있는지 여부를 감지하는 간단한 CNN 비전 시스템 (웹캠 + 랩톱)의 데모를 보여주었습니다.이 경우에는 PCB 회로 보드입니다. 내 CNN 모델에는 정적 배경에서 적절하고 파손 된 회로 기판 (각각 약 100 …

4
기능 중요도의 맥락에서 의사 결정 트리 해석
sklearn으로 작성된 의사 결정 트리 분류 모델의 의사 결정 프로세스를 완전히 이해하는 방법을 이해하려고합니다. 내가보고있는 두 가지 주요 측면은 트리의 그래프 표시와 기능의 중요성 목록입니다. 내가 이해하지 못하는 것은 기능 컨텍스트가 트리의 맥락에서 어떻게 결정되는지입니다. 예를 들어, 다음은 중요한 기능 목록입니다. 기능 순위 : 1. FeatureA (0.300237) FeatureB (0.166800) FeatureC …

2
학습률이 신경 네트워크의 가중치를 급등시키는 이유는 무엇입니까?
나는 약간의 연구를 위해 간단한 신경망을 작성하기 위해 tensorflow를 사용하고 있으며 훈련하는 동안 'nan'무게에 많은 문제가있었습니다. 최적화 프로그램 변경, 손실 변경, 데이터 크기 등과 같은 다양한 솔루션을 시도했지만 아무 소용이 없습니다. 마지막으로, 학습률의 변화가 나의 체중에 믿을 수없는 차이를 가져 왔다는 것을 알았습니다. 학습 속도 .001 (정말 보수적이라고 생각)을 사용하면 …

2
word2vec의 단어 벡터의 특징
감정 분석을 시도하고 있습니다. 단어를 단어 벡터로 변환하기 위해 word2vec 모델을 사용하고 있습니다. '문장'이라는 목록에 모든 문장이 있고이 문장을 다음과 같이 word2vec로 전달한다고 가정합니다. model = word2vec.Word2Vec(sentences, workers=4 , min_count=40, size=300, window=5, sample=1e-3) 나는 단어 벡터에 멍청하기 때문에 두 가지 의심이 있습니다. 1- 피처 수를 300으로 설정하면 단어 벡터의 피처가 …

1
익명의 수치 예측 자와 함께 numer.ai 경쟁에 접근하는 방법?
Numer.ai 는 얼마 동안 사용되어 왔으며 웹에는 게시물이나 다른 토론이 거의없는 것 같습니다. 시스템이 수시로 변경되었으며 오늘 설정은 다음과 같습니다. [0,1]의 연속 값과 이진 목표를 가진 21 개의 피처로 트레인 (N = 96K) 및 테스트 (N = 33K) 데이터. 데이터가 깨끗하고 (결 측값 없음) 2 주마다 업데이트됩니다. 테스트 세트에 예측을 …

3
기계 학습 알고리즘이 설명 가능성과 예측의 좋은 균형으로 인정되는 것은 무엇입니까?
그래디언트 부스팅 머신 또는 신경망과 같은 알고리즘을 설명하는 머신 러닝 텍스트는 종종 이러한 모델이 예측에 우수하다고 말하지만 설명 가능성 또는 해석 가능성이 떨어집니다. 반대로 단일 의사 결정 트리와 클래식 회귀 모델은 설명이 잘되어 있지만 임의 포리스트 또는 SVM과 같은보다 정교한 모델과 비교할 때 (상대적으로) 열악한 예측 정확도를 제공합니다. 기계 학습 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.