이것이 의견이나 답변으로 자격이되는지 모르겠습니다. 나는 대답처럼 느껴지기 때문에 여기에 넣었습니다.
k- 겹 교차 검증에서는 데이터를 k 그룹으로 분할합니다. "기본 사항"까지도 다루는 경우 k 개의 각 빈에 대해 균일하게 무작위로 멤버를 선택하는 것입니다.
데이터를 말할 때 각 행은 샘플로, 각 열은 차원으로 생각합니다. 변수 중요성, 열 중요도를 결정하기 위해 다양한 방법을 사용하는 데 익숙합니다.
당신이 생각 운동으로서 "교과서"균일 한 무작위로 출발하여 어떤 행이 중요한지를 결정한다면 어떨까요? 한 번에 하나의 변수에 정보를 제공 할 수도 있지만 더 많은 정보를 제공 할 수도 있습니다. 다른 행보다 덜 중요한 행이 있습니까? 아마도 많은 점들이 유익하고 아마도 몇 점일 것입니다.
변수의 중요성을 알면 아마도 중요도에 따라 묶을 수 있습니다. 가장 중요한 샘플로 하나의 빈을 만들 수도 있습니다. "k"의 크기를 정의 할 수 있습니다. 이런 식으로 "가장 유익한"kth 버킷을 결정하고 다른 버킷과 비교하여 가장 유익한 버킷과 비교합니다.
이를 통해 모델 매개 변수의 최대 변동에 대한 아이디어를 얻을 수 있습니다. 하나의 형태 일뿐입니다.
k 번째 버킷을 분할하는 두 번째 방법은 영향의 크기와 방향에 의한 것입니다. 따라서 매개 변수 또는 매개 변수를 한 방향으로 흔드는 샘플을 하나의 버킷에 넣고 같은 매개 변수 또는 매개 변수를 반대 방향으로 흔드는 샘플을 다른 버킷에 넣을 수 있습니다.
이 형식의 매개 변수 변형은 정보 밀도가 아니라 정보 유형에 따라 변수를 더 넓게 쓸 수 있습니다.
행운을 빌어 요.