«machine-learning» 태그된 질문

기계 학습 알고리즘은 훈련 데이터의 모델을 구축합니다. "기계 학습"이라는 용어는 모호하게 정의됩니다. 여기에는 통계 학습, 강화 학습, 비지도 학습 등이 포함됩니다. 항상 더 구체적인 태그를 추가하십시오.


1
연결주의 시간 분류 (CTC) 란 무엇입니까?
광학 문자 인식 (OCR) 프로젝트를 수행하려고합니다. 몇 가지 연구를 한 후에 흥미로운 것으로 보이는 아키텍처 인 CNN + RNN + CTC를 발견했습니다. CNN (Convoluted Neural Network) 및 RNN (Recurrent Neural Network)에 익숙하지만 CTC (Connectionistor Temporal Classification) 란 무엇입니까? 평신도의 용어로 설명하고 싶습니다.

1
딥 러닝 용 Adam 최적화 프로그램에 바이어스 보정 용어를 포함시키는 것이 중요한 이유는 무엇입니까?
저는 Deep Learning 의 Adam 최적화 프로그램에 대해 읽었으며 Begnio, Goodfellow 및 Courtville 의 새 책 Deep Learning 에서 다음 문장을 보았습니다. Adam은 원점에서의 초기화를 설명하기 위해 1 차 모멘트 (모멘텀 항) 및 (비 중심) 2 차 모멘트의 추정치에 대한 바이어스 보정을 포함합니다. 이러한 바이어스 보정 항을 포함하는 주된 이유는 …

1
VC 차원은 딥 러닝에 대해 무엇을 알려줍니까?
기본 기계 학습에서는 다음과 같은 "엄지 손가락 규칙"을 배웁니다. a) 데이터의 크기는 가설 세트의 VC 차원 크기의 10 배 이상이어야합니다. b) N 개의 연결을 갖는 신경망은 약 N의 VC 치수를 갖는다. 따라서 딥 러닝 신경망이 수백만 단위라고 말하면 이것이 수십억 개의 데이터 포인트를 가져야한다는 의미입니까? 이것에 대해 좀 밝힐 수 …

1
머신 러닝 모델의 "용량"은 무엇입니까?
Carl Doersch의 Variational Autoencoders에 대한 이 자습서를 공부하고 있습니다. 두 번째 페이지에는 다음과 같이 표시됩니다. 가장 인기있는 프레임 워크 중 하나는이 자습서의 주제 인 Variational Autoencoder [1, 3]입니다. 이 모델의 가정은 약하고 역 전파를 통해 훈련이 빠릅니다. VAE는 근사값을 계산하지만이 근사값으로 인한 오차는 고용량 모델을 감안할 때 매우 작습니다 . …


5
여러 시리즈를 동시에 처리하는 방법?
25 개 기간 동안 여러 제품 (1200 개 제품)의 수요를 포함한 데이터 세트가 있으며 다음 기간 동안 각 제품의 수요를 예측해야합니다. 처음에는 ARIMA를 사용하고 각 제품에 대한 모델을 학습하고 싶었지만 제품 수와 (p, d, q) 매개 변수 조정으로 인해 시간이 많이 걸리고 실용적이지 않습니다. 이전 요구가 독립 변수 인 경우 …

4
예측 모델 : 통계는 머신 러닝을 능가 할 수 있습니까? [닫은]
폐쇄되었습니다 . 이 질문은 더 집중되어야 합니다. 현재 답변을받지 않습니다. 이 질문을 개선하고 싶습니까? 이 게시물 을 편집 하여 한 가지 문제에만 집중할 수 있도록 질문을 업데이트하십시오 . 휴일 2 년 전 . 현재 통계 / 경제학에 중점을 둔 마스터 프로그램을 따르고 있습니다. 제 주인은 모든 학생들이 3 개월 동안 …

1
왜 우리는 신경망 이외의 것들에 알맞은 기울기가 아닌 일정한 학습 속도를 사용하지 않습니까?
딥 러닝 문학은 기울기 강하에서 일정하지 않은 학습 속도를 사용하는 영리한 속임수로 가득합니다. 지수 붕괴, RMSprop, Adagrad 등은 구현하기 쉽고 모든 딥 러닝 패키지에서 사용할 수 있지만 신경망 외부에는 존재하지 않는 것 같습니다. 이것에 대한 이유가 있습니까? 사람들이 단순히 신경 쓰지 않는다면 신경망 외부에서 신경 쓰지 않아도되는 이유가 있습니까?

2
편의를 넘어 신경망에서 컨볼 루션에 대한 수학적 이유가 있습니까?
컨볼 루션 신경망 (CNN) 에서 컨볼 루션을 진행하기 전에 각 단계 의 가중치 매트릭스 가 행과 열을 뒤집어 커널 매트릭스를 얻습니다. 이것은 휴고 라로 셸에 의해 비디오 시리즈에 설명되어 여기 : 숨겨진 맵을 계산하는 것은 커널 행렬 [...]을 사용하여 이전 레이어의 채널과 이산 컨볼 루션을 수행하는 것과 일치하며, 커널은 숨겨진 …

1
두 세계의 충돌 : 복잡한 설문 조사 데이터에 ML 사용
나는 겉으로는 쉬운 문제에 부딪 쳤지 만 지금은 몇 주 동안 적합한 해결책을 찾지 못했습니다. 필자는 가중치, 계층화, 특정 라우팅 등을 사용하여 복잡한 디자인 설문 조사라고 부르는 설문 조사라고 불리는 많은 설문 조사 / 설문 조사 데이터 (데이터 세트 당 50k와 같은 수천 명의 응답자)를 보유하고 있습니다. 각 응답자에 대해 …

2
두 개의 선형 회귀 모델이 주어지면 어떤 모델이 더 잘 수행됩니까?
대학에서 기계 학습 과정을 수강했습니다. 퀴즈 중 하나 에서이 질문을 받았습니다. 모델 1 : y=θx+ϵy=θx+ϵ y = \theta x + \epsilon 모델 2 : y=θx+θ2x+ϵy=θx+θ2x+ϵ y = \theta x + \theta^2 x + \epsilon 위의 모델 중 어느 것이 데이터에 더 적합합니까? (선형 회귀를 사용하여 데이터를 모델링 할 수 있다고 …

3
패턴 인식 작업에서 최첨단 앙상블 학습 알고리즘?
이 질문의 구조는 다음과 같습니다. 처음에는 앙상블 학습 의 개념을 제공하고 , 추가로 패턴 인식 작업 목록을 제공 한 다음 앙상블 학습 알고리즘의 예를 제공하고 마지막으로 내 질문을 소개합니다. 모든 추가 정보가 필요하지 않은 사람들은 헤드 라인을보고 바로 내 질문으로 넘어갈 수 있습니다. 앙상블 학습이란 무엇입니까? Wikipedia 기사 에 따르면 …

2
MCMC의 성능 벤치 마크
일련의 테스트 밀도에서 여러 가지 다른 알고리즘의 성능을 비교하는 MCMC 방법에 대한 대규모 연구가 있었습니까? Rios and Sahinidis의 논문 (2013) 과 비슷한 것을 생각 하고 있는데 , 이는 여러 클래스의 테스트 기능에 대한 많은 파생없는 블랙 박스 최적화 프로그램을 철저히 비교 한 것입니다. MCMC의 경우, 성능은 예를 들어 밀도 평가 …

2
머신 러닝에서 에너지 최소화 란 무엇입니까?
나는 컴퓨터 비전의 잘못된 문제에 대한 최적화에 대해 읽고 있었고 Wikipedia의 최적화에 대한 아래의 설명을 보았습니다. 내가 이해하지 못하는 것은 왜 Computer Vision 에서이 최적화를 " 에너지 최소화 "라고 부르는가? 최적화 문제는 다음과 같이 나타낼 수 있습니다. 을 감안할 때 : 함수 일부 세트에서 실제 숫자f:A→Rf:A→Rf: A \to RAAA 구함 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.