데이터 블렌딩이란 무엇입니까?


15

이 용어는 메소드 관련 스레드 에서 자주 나타납니다 .

되어 혼합 데이터 마이닝 및 통계 학습의 특정 방법을? Google에서 관련 결과를 얻을 수 없습니다.

블렌딩은 많은 모델의 결과를 혼합하여 더 나은 결과를 가져온 것 같습니다. 그것에 대해 더 잘 아는 데 도움이되는 자료가 있습니까?

답변:


10

http://www.cs.cornell.edu/~caruana/ctp/ct.papers/caruana.icml04.icdm06long.pdf 블렌딩이 무엇인지 이해하는 데 도움이되는 몇 가지 논문. 앙상블 선택 / 학습 및 스태킹을 위해 Google을 사용할 수도 있다고 생각합니다.

'많은 모델의 결과를 혼합하여 더 나은 결과를 얻는다'는 일반적인 이해는 맞습니다.


이 링크는 kaggle 포럼 어딘가에서 가져 왔습니다. pdf의 링크 만 저장했지만 토론은하지 않았습니다 ...
King

12

부스팅 (링크 된 토론에서 언급 한 바와 같이)은 단일 알고리즘에서 얻을 수있는 것보다 더 나은 결과를 얻기 위해 일련의 알고리즘을 결합하는 방법입니다. 예를 들어 임의 포리스트는 분류 알고리즘을 위해 다양한 분류 트리를 결합하는 방법입니다. 이 접근법을 공식적으로 앙상블 평균화라고합니다 (알고리즘은 대개 대다수 규칙을 적용하지만). 블렌딩은 일부 사람들이 분류에 대한 부스팅 접근법을 설명하는 데 사용하는 단어 인 것 같습니다.


정규 adaboost 모델의 분류 트리를 다른 알고리즘 세트로 바꾸면 블렌딩이라고 할 수 있습니까?
TomHall

안녕하세요, Michael. 귀하의 답변은 정말 도움이되지만 부끄러운 일입니다. 통계에 익숙하지 않으며 아직 귀하의 답변을 투표 할만큼 평판이 좋지 않습니다.
TomHall

1
그럼 당신은 몇 가지 담당자 포인트를 얻은 후에 그것을 기억하십시오.
Michael R. Chernick

0

업계에서 데이터 블렌딩 은 모델이 아니라 전처리 에 관한 것입니다. 데이터가 병합 된시기는 데이터베이스의 소스와 CSV 파일의 다른 데이터와 같은 다른 소스에서 비롯된 것입니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.