2
강화 학습으로 로봇을 따르는 라인 프로그래밍
강화 학습 알고리즘을 사용하여 로봇을 따르는 라인을 프로그래밍하는 것을 고려하고 있습니다. 내가 숙고하고있는 질문은 알고리즘이 임의의 경로를 탐색하는 방법을 배우게하는 방법입니다. 강화 학습을 위해 Sutton & Barto Book 을 따랐을 때 , 나는 자동차 요원이 트랙에서 떨어지지 않고 속도를 조절하지 않는 것을 배우는 경마장과 관련된 운동 문제를 해결했습니다. 그러나이 운동 …