«machine-learning» 태그된 질문

"경험에 따라 자동으로 개선되는 컴퓨터 시스템"을 구축하는 방법과 원리.



3
알 수없는 기능에서 기능 엔지니어링을 수행하는 방법은 무엇입니까?
카글 경쟁에 참여하고 있습니다. 데이터 세트에는 약 100 개의 기능이 있으며 모두 실제로는 무엇을 나타내는 지 알 수 없습니다. 기본적으로 그들은 단지 숫자입니다. 사람들은 이러한 기능에 대해 많은 기능 엔지니어링을 수행하고 있습니다. 정확히 알려지지 않은 기능에 대해 기능 공학을 정확히 수행 할 수있는 방법이 궁금합니다. 알려지지 않은 기능에 대해 기능 …

3
원래 데이터 세트로 학습 한 머신 러닝 모델을 사용하여 합성 데이터 세트를 생성하는 방법은 무엇입니까?
일반적으로 기계 학습 모델은 데이터 세트를 기반으로합니다. 원래의 데이터 셋 특성을 유지하는 훈련 된 머신 러닝 모델을 사용하여 합성 데이터 셋을 생성 할 수있는 방법이 있는지 알고 싶습니다. [원본 데이터-> 기계 학습 모델 구축-> ml 모델을 사용하여 합성 데이터를 생성합니다 .... !!!] 가능합니까? 가능하면 관련 자료를 알려주십시오.

2
텍스트 분류 : 다른 종류의 기능 결합
내가 다루는 문제는 짧은 텍스트를 여러 클래스로 분류하는 것입니다. 내 현재 접근 방식은 tf-idf 가중 항 주파수를 사용하고 간단한 선형 분류기 (로지스틱 회귀)를 배우는 것입니다. 이것은 합리적으로 잘 작동합니다 (테스트 세트에서 약 90 % 매크로 F-1, 훈련 세트에서 거의 100 %). 큰 문제는 보이지 않는 단어 / n- 그램입니다. 분포 …

4
단일 이벤트가 종단 데이터에 영향을 미칠 가능성을 분석하기 위해 어떤 통계 모델을 사용해야합니까
특정 이벤트가 일부 세로 데이터에 영향을 줄 가능성을 분석하는 데 사용할 수식, 방법 또는 모델을 찾으려고합니다. Google에서 무엇을 검색해야하는지 파악하기가 어렵습니다. 시나리오 예는 다음과 같습니다. 매일 평균 100 명의 고객을 보유한 업체를 소유하고 있습니다. 하루는 매일 매장에 도착하는 대형 고객 수를 늘리기로 결정하여 매장 밖에서 미친 스턴트를 끌어 당겨 주목을받습니다. …

2
ReLU가 활성화 기능으로 사용되는 이유는 무엇입니까?
활성화 함수는 w * x + b신경망 에서 유형의 선형 출력에 비선형 성을 도입하는 데 사용됩니다 . 나는 sigmoid와 같은 활성화 기능을 직관적으로 이해할 수 있습니다. 나는 역 전파 동안 죽은 뉴런을 피하는 ReLU의 장점을 이해합니다. 그러나 출력이 선형 인 경우 ReLU가 활성화 기능으로 사용되는 이유를 이해할 수 없습니다. 비선형 …


4
유클리드 거리와 반대로 맨해튼 거리를 언제 사용합니까?
기계 학습에서 유클리드 거리 에서 맨해튼 거리 를 사용하는 이유에 대한 좋은 논쟁을 찾고 있습니다. 내가 지금까지 좋은 논증을 찾은 가장 가까운 것은 이 MIT 강의 입니다. 36시 15 분에 슬라이드에서 다음 내용을 볼 수 있습니다. "일반적으로 유클리드 메트릭을 사용 합니다. 다른 차원을 비교할 수없는 경우 Manhattan이 적합 할 수 …


1
keras로 멀티 클래스 분류에서 문자열 레이블을 처리하는 방법은 무엇입니까?
나는 기계 학습과 keras에 초보자이며 이제 keras를 사용하여 멀티 클래스 이미지 분류 문제를 해결하고 있습니다. 입력은 태그 된 이미지입니다. 사전 처리 후 훈련 데이터는 Python 목록에 다음과 같이 표시됩니다. [["dog", "path/to/dog/imageX.jpg"],["cat", "path/to/cat/imageX.jpg"], ["bird", "path/to/cat/imageX.jpg"]] "dog", "cat"및 "bird"는 클래스 레이블입니다. 이 문제에는 one-hot 인코딩을 사용해야한다고 생각하지만이 문자열 레이블을 처리하는 방법은 명확하지 …

1
경도 / 위도 기능을 처리하는 방법 [닫기]
휴무 . 이 질문에는 세부 사항이나 명확성 이 필요 합니다 . 현재 답변을받지 않습니다. 이 질문을 개선하고 싶습니까? 이 게시물 을 편집 하여 세부 사항을 추가하고 문제점을 명확하게하십시오 . 휴일 삼년 전에 . 25 가지 기능을 갖춘 가상의 데이터 세트를 작업 중입니다. 두 가지 특징은 장소의 위도 및 경도이며, 다른 …

7
이전 시계열 데이터를 기반으로 트래픽을 예측하려면 어떻게해야합니까?
소매점을 가지고 있고 1 분마다 얼마나 많은 사람들이 매장에 들어 왔는지 측정하고 그 데이터를 타임 스탬프하는 경우 미래의 발 트래픽을 어떻게 예측할 수 있습니까? 머신 러닝 알고리즘을 살펴 봤지만 어느 알고리즘을 사용해야할지 잘 모르겠습니다. 내 테스트 데이터에서 KNN과 같이 시도한 다른 것들과 비교할 때 해마다 매년 추세가 더 정확합니다 (현명한 …

2
딥 러닝의 로컬 최소 점 vs 안 장점
Andrew Ng (안타깝게도 더 이상 찾을 수없는 비디오)에서 딥 러닝 문제에서 로컬 최소값에 대한 이해가 이제 고차원 공간에서 문제가 적은 것으로 간주된다는 의미에서 어떻게 변화했는지에 대한 이야기를 들었습니다. 딥 러닝) 임계점은 로컬 최소값보다 안 장점 또는 고원 일 가능성이 높습니다. 나는 "모든 지역 최소값이 세계 최소값"이라는 가정에 대해 논의한 논문 …

4
신경망에서 시그 모이 드 기능의 역할 미분
신경망에서 시그 모이 드 함수의 미분의 역할을 이해하려고합니다. 먼저 시그 모이 드 함수와 파이썬을 사용하여 정의에서 모든 점의 파생을 플로팅합니다. 이 파생 상품의 역할은 정확히 무엇입니까? import numpy as np import matplotlib.pyplot as plt def sigmoid(x): return 1 / (1 + np.exp(-x)) def derivative(x, step): return (sigmoid(x+step) - sigmoid(x)) / …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.