주어진 시스템을 모델링하기 위해 유전자 알고리즘에 대해 적절한 수의 매개 변수를 어떻게 선택할 수 있습니까?
예를 들어, 자동차 생산을 최적화하고 1,000 명의 직원마다 다양한 작업에서 시간당 효율성을 1,000 회 측정한다고 가정합니다. 따라서 1,000,000 개의 데이터 포인트가 있습니다. 이들 대부분은 공장의 전체 효율성과 약한 상관 관계가있을 수 있지만 통계적 신뢰도와 무관하다고 말할 수있을 정도로 약하지는 않습니다 . 1,000,000 이상의 자유도가 없어서 수렴이 매우 느리거나 수렴이 전혀 없도록 GA에 대한 입력 선택 방법은 무엇입니까?
특히, 기능을 사전 선택하거나 선택적으로 제거하기 위해 사용할 수있는 알고리즘은 무엇입니까?
나는이 시나리오에서 자신을 사용한 한 가지 방법은 내가 좋아하는 부모를 가질 수 있도록 파라미터 선택 자체를 진화하는 것입니다 {a,b,c}
, {b,d,e,q,x,y,z}
등을. 그런 다음 어린이를 변경하여 기능을 추가하거나 삭제합니다. 이것은 수십 가지 기능에 적합합니다. 그러나 문제는 자유도가 많은 경우 비효율적이라는 것입니다. 이 경우 10^n
조합 (위의 예에서)을 살펴보면 10^1,000,000
기능의 사전 필터링이 유용한 성능을 얻는 데 중요합니다.