반복 강화 학습이란?


20

나는 최근에 "반복 강화 학습"이라는 단어를 접했습니다. "Recurrent Neural Network"가 무엇인지, "Reinforcement Learning"이 무엇인지 이해하지만 "Recurrent Reinforcement Learning"이 무엇인지에 대한 많은 정보를 찾을 수 없었습니다.

누군가 "반복 강화 학습"이 무엇인지, 그리고 "반복 강화 학습"과 Q-Learning 알고리즘과 같은 일반적인 "강화 학습"의 차이점이 무엇인지 설명해 줄 수 있습니까?

답변:


15

"반복 강화 학습"이란 무엇입니까?

RRL (Recurrent reinforcement learning )은 1996 년에 신경망 거래 시스템을 훈련시키기 위해 처음 도입되었습니다. "Recurrent"는 이전 출력이 입력의 일부로 모델에 공급됨을 의미합니다. 그것은 곧 FX 시장에서 거래로 확장되었습니다.

RRL의 기술은 금융 거래 시스템 구축을위한 성공적인 기계 학습 기법 것으로 밝혀졌다.

"반복 강화 학습"과 일반적인 "강화 학습"(Q-Learning 알고리즘과 같은)의 차이점은 무엇입니까?

RRL의 명확 접근 상이 동적 프로그래밍보강 알고리즘 같은 TD가 학습Q는 학습 추정량하려고 값 기능을 제어 문제에 대한.

RRL의 프레임 워크는 간단하고 우아한 문제의 표현을 만들 수 있습니다, 방지 차원의 벨맨의 저주 와 효율성을 제공하는 강력한 장점 :

RRLQ- 러닝 의 이산화 방법에 의지하지 않고 자연스럽게 가치있는 행동 (포트폴리오 가중치)을 생성합니다 .

RRL 은 잡음이 많은 데이터 세트에 노출 될 때 Q- 러닝 보다 더 안정적인 성능을 제공합니다 . Q- 러닝 알고리즘은 동적 최적화의 재귀 속성으로 인해 값 함수 선택에 더 민감하지만 RRL 알고리즘은 목적 함수를 선택하고 계산 시간을 절약하는 데 더 유연합니다.

()

다음 은 RRL 알고리즘의 Matlab 구현입니다.


참고 문헌

거래를위한 강화 학습

거래 시스템 및 포트폴리오를위한 강화 학습

반복 강화 학습을 통한 FX 거래

RRL (Recurrent Reinforcement Learning)을 통한 주식 거래

Q-Learning 및 반복 강화 학습을 사용한 알고리즘 거래

자동화 된 FX 트레이딩을위한 알고리즘 탐구 – 하이브리드 모델 구성


@AntonDanilov 당신이 이것을 알고 있는지 확실하지 않습니다. 이 아이디어 (당신의 첫 번째 참조, J Moody)를 생각해 낸 사람은이 알고리즘을 사용하여 기금을 운영하고 있으며 그의 성과는 훌륭하지 않았습니다.
horaceT

알아두면 좋지만 어떻게 대답이 바뀌나요
Anton Danilov

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.