나는 입 / 출력 데이터 세트가있는 곳을 처음 보았습니다. 처음에는 선형 회귀 선을 만들고 바이어스를 수정 한 다음 해당 데이터를 모델에만 사용합니다. 이 편향 보정이 무엇인지 알지 못했습니까?
나는 입 / 출력 데이터 세트가있는 곳을 처음 보았습니다. 처음에는 선형 회귀 선을 만들고 바이어스를 수정 한 다음 해당 데이터를 모델에만 사용합니다. 이 편향 보정이 무엇인지 알지 못했습니까?
답변:
문제 설명이 정확히 어떤 유형의 바이어스 보정을 참조하는지 알기에 충분하지는 않지만 일반적인 용어로 말할 수 있다고 생각합니다. 때로는 추정기가 편향 될 수 있습니다. 이는 좋은 추정치 일 수 있지만 예상 또는 평균값이 모수와 정확히 같지 않음을 의미합니다. 추정기의 평균과 실제 모수 값의 차이를 바이어스라고합니다. 추정기가 편향된 것으로 알려진 경우, 다른 수단에 의해, 편향을 추정 한 다음, 추정 된 편향을 원래 추정치로부터 차감함으로써 추정기를 수정하는 것이 때때로 가능하다. 이 절차를 바이어스 보정이라고합니다. 추정을 향상시키기 위해 수행됩니다. 바이어스를 줄이지 만 분산도 증가시킵니다.
성공적인 바이어스 보정의 좋은 예는 분류 오류율의 부트 스트랩 바이어스 보정 추정치입니다. 오차율의 재 치환 추정치는 표본 크기가 작을 때 낙관적 편향이 크다. 부트 스트랩은 재 치환 추정치의 바이어스를 추정하는데 사용되며, 재 치환 추정치가 에러율을 과소 평가하기 때문에, 바이어스 추정치가 재 치환 추정치에 추가되어 부트 스트랩 바이어스 정정 된 에러율 추정치를 얻는다. 표본 크기가 두 클래스 문제에서 두 클래스를 결합하는 30 이하인 경우 특정 형태의 부트 스트랩 추정치 (특히 632 추정치)는 일대일 교차 검증보다 더 정확한 오류율 추정치를 제공합니다. 거의 치우 치지 않은 오차율 추정치).