«machine-learning» 태그된 질문

"경험에 따라 자동으로 개선되는 컴퓨터 시스템"을 구축하는 방법과 원리.

3
다양한 유형의 속성으로 데이터 세트를 분류하는 가장 좋은 방법
텍스트 및 숫자와 같은 혼합 유형의 속성으로 구성된 데이터 세트를 분류하는 가장 좋은 방법이 무엇인지 알고 싶습니다. 텍스트를 부울로 변환 할 수 있지만 어휘가 다양하고 데이터가 너무 희박 해집니다. 또한 속성 유형을 개별적으로 분류하고 메타 학습 기술을 통해 결과를 결합하려고 시도했지만 제대로 작동하지 않았습니다.

2
종이 초록을 크롤링하는 API가 있습니까?
매우 긴 종이 이름 목록을 가지고 있다면 인터넷이나 데이터베이스에서이 종이의 초록을 어떻게 얻을 수 있습니까? 논문 이름은 "공공 건강 영역을위한 웹 마이닝 유틸리티 평가"와 같습니다. 아무도 나에게 해결책을 줄 수있는 API를 알고 있습니까? Google 학자를 크롤링하려고했지만 Google이 내 크롤러를 차단했습니다.

3
하이퍼 큐브의 대부분의 포인트가 경계에 있다고 말할 때 무엇을 의미합니까?
50 차원 하이퍼 큐브가 있다면. 그리고 경계를 또는 0.95 < x j < 1로 정의합니다. 여기서 x j 는 하이퍼 큐브의 차원입니다. 그런 다음 하이퍼 큐브의 경계에서 점의 비율을 계산하는 것은 0.995 입니다. 무슨 뜻이에요? 나머지 공간이 비어 있다는 의미입니까? 경우 (99) % 포인트의이 경계에있는 다음 큐브 안에 포인트가 균일하게 …

2
Keras의 Early Stopping 콜백에서 사용하는 메트릭을 변경해야합니까?
Keras 교육에서 Early Stopping 콜백을 사용하는 경우 일부 메트릭 (일반적으로 유효성 검증 손실)이 증가하지 않으면 중지됩니다. 검증 손실 대신 다른 측정법 (정밀도, 리콜, f- 측정)을 사용하는 방법이 있습니까? 지금까지 본 모든 예제는 다음과 비슷합니다. 콜백 .EarlyStopping (monitor = 'val_loss', patience = 5, verbose = 0, mode = 'auto')


3
자연어 대 SQL 쿼리
"자연 언어를 SQL 쿼리로 변환"시스템을 개발하고 있습니다. 비슷한 질문에 대한 답변을 읽었지만 원하는 정보를 얻을 수 없었습니다. 아래는 알고리즘에서 Arun Solanki의 Garima Singh에 의해 자연어를 관계형 데이터베이스에 대한 SQL 쿼리로 변환하기 위해 얻은 시스템의 순서도입니다. 음성 태그 지정 단계의 일부까지 이해했습니다. 그러나 나머지 단계에 어떻게 접근합니까? 가능한 모든 SQL 쿼리를 …

4
큰 범주 값에 대한 하나의 핫 인코딩 대안?
1600 개가 넘는 범주 값이 큰 데이터 프레임이 있습니다 .1600 개가 넘는 열이 없도록 대안을 찾을 수있는 방법이 있습니까? 나는 재미있는 링크 http://amunategui.github.io/feature-hashing/#sourcecode 아래에서 이것을 발견했다. 그러나 그들은 내가 원하지 않는 클래스 / 객체로 변환하고 있습니다. 다른 머신 러닝 모델로 테스트 할 수 있도록 최종 출력을 데이터 프레임으로 원합니까? 또는 …

1
Keras의 멀티 태스킹 학습
Keras에서 공유 레이어를 구현하려고합니다. Keras에는 keras.layers.concatenate있지만, 사용에 대한 설명서는 확실하지 않습니다. 여러 개의 공유 레이어를 만드는 데 사용할 수 있습니까? Keras를 사용하여 아래에 표시된 것처럼 간단한 공유 신경 네트워크를 구현하는 가장 좋은 방법은 무엇입니까? 3 개의 NN에 대한 모든 입력, 출력 및 공유 레이어의 모양은 동일합니다. 세 개의 NN에는 여러 …


1
해싱 트릭-실제로 일어나는 일
Vowpal Wabbit 또는 일부 인수 분해 시스템이 클릭률 경쟁 ( Kaggle ) 을 수상한 ML 알고리즘과 같이 기능이 '해시'되었다고 언급하면 ​​실제로 모델에 어떤 의미가 있습니까? 인터넷 추가의 ID를 나타내는 변수가 있는데 '236BG231'과 같은 값을 사용합니다. 그런 다음이 기능은 임의의 정수로 해시된다는 것을 이해합니다. 그러나 내 질문은 다음과 같습니다. 이제 모델에서 …

3
비정형 텍스트 분류
구조화되지 않은 텍스트 문서, 즉 구조가 알려지지 않은 웹 사이트를 분류하려고합니다. 내가 분류하고있는 수업의 수는 제한되어 있습니다 (이 시점에서는 3 명 이하라고 생각합니다). 누구든지 내가 어떻게 시작할 수 있는지 제안 했습니까? 여기서 "단어"접근이 가능한가? 나중에 문서 구조 (아마도 의사 결정 트리)를 기반으로 다른 분류 단계를 추가 할 수 있습니다. Mahout과 …

2
이모티콘에 대한 감정 데이터
실험을 위해 우리는 사용하고 싶은 이모티콘 많은 지상 사실로 트윗 / 단순 양적 senitment 분석을 위해 데이터를 교육에 포함합니다. 트윗은 일반적으로 NLP가 제대로 작동하기에는 너무 구조화되어 있지 않습니다. 어쨌든 유니 코드 6.0에는 722 개의 이모지가 있으며, 유니 코드 7.0에는 또 다른 250 개가 추가 될 것입니다. 감정 주석이 포함 된 …

3
클레임 데이터의 과거 상태에서 다음 의학적 상태 예측
저는 현재 일부 실험실 및 약국 청구를 포함하는 대규모 건강 보험 청구 데이터를 사용하고 있습니다. 그러나 데이터 세트에서 가장 일관된 정보는 진단 (ICD-9CM)과 절차 코드 (CPT, HCSPCS, ICD-9CM)로 구성됩니다. 나의 목표는 : 만성 신장 질환과 같은 의학적 상태에 대해 가장 영향력있는 전구체 상태 (수용성)를 식별하십시오. 환자가 과거에 있었던 상태에 근거하여 …

9
기계 학습 응용 프로그램을 쉽게 배울 수있는 것은 무엇입니까? [닫은]
폐쇄되었습니다 . 이 질문은 의견 기반 입니다. 현재 답변을받지 않습니다. 이 질문을 개선하고 싶습니까? 이 게시물 을 편집 하여 사실과 인용으로 답변 할 수 있도록 질문을 업데이트하십시오 . 휴일 오년 전에 . 일반적으로 기계 학습에 익숙하지 않기 때문에 나는 주변에서 놀기 시작하고 가능성이 무엇인지보고 싶습니다. 설치에서 의미있는 결과를 생성하는 데 …

2
신경망이
유명한 Tensorflow Fizz Buzz 농담과 XOr 문제의 정신에서 y=x2y=x2y = x^2 기능 을 구현하는 신경망을 설계 할 수 있다면 생각하기 시작했습니다 . 숫자의 일부 표현 (예 : 이진수 형식의 벡터로 숫자 5가로 [1,0,1,0,0,0,0,...]표시됨) 이 주어진 경우 신경망은이 경우 제곱-25를 반환하는 법을 배워야합니다. y=x2y=x2y=x^2 구현할 수 있다면 아마도 y=x3y=x3y=x^3 및 일반적으로 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.