OpenAIGym 의 Lunar Lander와 같은 문제에 대한 솔루션을 설계 할 때 강화 학습은 상담원이 성공적으로 착륙 할 수 있도록 적절한 조치 제어를 제공하는 유혹적인 수단입니다.
그러나 PID 컨트롤러 와 같은 제어 시스템 알고리즘이 강화 학습만큼 좋지는 않지만 적절한 작업을 수행 하는 사례는 무엇 입니까?
같은 질문 이 하나 이 질문의 이론을 해결에서 좋은 일을하지만, 실제 구성 요소를 해결하기 위해 조금 않습니다.
인공 지능 엔지니어로서 문제 도메인의 어떤 요소가 PID 컨트롤러가 문제를 해결하기에 충분하지 않다고 제안해야하며 대신 강화 학습 알고리즘을 사용해야합니까 (또는 그 반대)?