오바마 캠페인의 데이터 마이닝 기술


10

나는 오바마의 재선거 캠페인에서 데이터 마이닝 팀에 대해이 기사 를 보았습니다. 불행히도이 기사는 통계 알고리즘의 실제 메커니즘에 대해 매우 모호합니다. 그러나 일반적인 기술이 사회 및 정치 과학에서 알려진 것처럼 들렸습니다. 이것이 저의 전문 분야가 아니기 때문에, 이런 종류의 기술에 관한 저에게 (개요) 문헌을 알려 주실 수 있습니까?

답변:


16

이 영역을 마이크로 타겟팅이라고합니다 (구글을 원한다면). 캠페인은 나의 지식을 많이 핼 Malchow의 제외 일 간행이없는, 자신의 도구와 절차에 대해 꽤 비밀입니다 정치 타겟팅 (2008) 또는 녹색 및 거버 (2008) 나가 투표 : 유권자 투표율 증가하는 방법 (후자의 거래를 광고 효과와 같은 사회 과학 측면에 더 많은).

더 많은 기술적 문제에 대해서는 문헌이 더 희박하지만, Murray & Scime (2010) , Imai & Strauss (2011) 의 정치 분석 논문 ( postprint ) 또는 최근에 우리가 적용한 Rusna , Lee, Hornik, Jank & Zeileis (2013) ( postprint ). 그들이 공통적으로 가지고있는 것은 주로 트리 기반의 데이터 마이닝 기술을 사용한다는 것입니다.

Murray & Scime은 CART와 같은 표준 분류 트리를 사용합니다.

Rusch et al. 분류 트리, 로지스틱 모델 및 트리와 로지스틱 회귀의 하이브리드를 사용하십시오. 또한 논문의 설명에 설명 된대로 랜덤 포레스트, 신경망, 벡터 머신 지원 및 베이지안 회귀 트리를 사용하여 트리 하이브리드와 비교 합니다 . 그들의 하이브리드 트리는 데이터 세트에서 다른 방법과 동등하게 수행되었으며 해석 능력이 향상되었습니다 (코드와 데이터도 공유 함).

Imai & Strauss는 다른 사람들처럼 마이크로 타겟팅 도구뿐만 아니라 최적의 캠페인 계획을위한 포괄적 인 결정 이론 프레임 워크를 제시하는 한 흥미 롭습니다. 따라서 그들은 캠페인에 투입되는 모든 달러를 최대한 활용하는 방법에 대한 운영 연구 측면에 매우 집중하고 있습니다. 마이크로 타겟팅 및 투표율 추정에 통계 기술을 사용하는 프레임 워크 측면에서 분류 트리에 다시 의존합니다.

따라서 트리 기반 방법의 사용이이 영역에서 잘 작동한다는 합의가있는 것 같습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.