의회 선거 결과를 예측하고 싶습니다. 내 결과는 각 당사자가받는 %입니다. 둘 이상의 당사자가 있으므로 로지스틱 회귀는 실행 가능한 옵션이 아닙니다. 각 당사자에 대해 별도의 회귀를 만들 수 있지만 그 경우 결과는 서로 독립적입니다. 결과의 합이 100 %임을 보장하지는 않습니다.
어떤 회귀 (또는 다른 방법)를 사용해야합니까? 특정 라이브러리를 통해 R 또는 Python에서이 방법을 사용할 수 있습니까?
의회 선거 결과를 예측하고 싶습니다. 내 결과는 각 당사자가받는 %입니다. 둘 이상의 당사자가 있으므로 로지스틱 회귀는 실행 가능한 옵션이 아닙니다. 각 당사자에 대해 별도의 회귀를 만들 수 있지만 그 경우 결과는 서로 독립적입니다. 결과의 합이 100 %임을 보장하지는 않습니다.
어떤 회귀 (또는 다른 방법)를 사용해야합니까? 특정 라이브러리를 통해 R 또는 Python에서이 방법을 사용할 수 있습니까?
답변:
무엇을 예측하고 싶습니까? 나는 지난 몇 년 동안 논문에 대한 다자간 선거 결과를 예측하려고 시도한 후 올해의 일부 투표소 결과를 사용하여 다른 모든 투표소의 결과를 예측했습니다. 이를 위해 내가 비교 한 선형 모델은 이전 해의 투표를 회귀하여 각 당사자가 얻을 수있는 투표 수를 추정했습니다. 모든 당사자에 대해 예상 투표 수가있는 경우 그 비율을 계산할 수 있습니다. 선형 모형을 확장하는 관련 논문은 비 랜덤 표본의 예측을 참조하십시오 .
이것은 회귀가 아니라 다중 클래스 분류 문제입니다. 출력은 일반적으로 주어진 테스트 인스턴스 (테스트 행)에 대한 모든 클래스의 확률입니다. 따라서 귀하의 경우 훈련 된 모델의 주어진 테스트 행의 출력 형식은 다음과 같습니다.
prob_1, prob_2, prob_3,..., prob_k
여기서 prob_i는 반응 변수에 k 개의 클래스가 있다고 가정 할 때 i 번째 클래스 (귀하의 i 번째 당사자)의 확률을 나타냅니다. 이 k 확률의 합은 1이됩니다.이 경우의 클래스 예측은 최대 확률을 갖는 클래스가됩니다.
R에는 다중 클래스 분류를 수행하는 많은 분류 기가 있습니다. R 의 nnet 패키지를 통해 multinom
명령을 호출하여 다중 클래스 지원과 함께 로지스틱 회귀를 사용할 수 있습니다 .
대안으로, R 에서 gbm 패키지를 사용 하고 gbm
명령을 호출 할 수도 있습니다 . 멀티 클래스 분류기를 만들려면 distribution="multinomial" while using the
gbm` 함수를 사용 하십시오.