일부 기능이 제공된 사용자의 가용성을 예측하려면 분류 또는 회귀가 필요합니까?


9

데이터 마이닝 방법을 연구하는 동안 두 가지 주요 범주가 있음을 이해하게되었습니다.

  • 예측 방법 :

    • 분류
    • 회귀
  • 설명 방법 :

    • 클러스터링
    • 협회 규칙

위치, 활동, 배터리 수준 (훈련 모델에 대한 입력)을 기반으로 사용자 가용성 (출력)을 예측하고 싶기 때문에 "예측 방법"을 선택하는 것이 분명하지만 지금은 선택할 수없는 것 같습니다. 분류 및 회귀. 출력을 "사용 가능"또는 "사용할 수 없음"으로 분류했기 때문에 분류를 통해 문제를 해결할 수 있습니다.

분류를 통해 사용자의 사용 가능 여부를 알 수 있습니까?

출력에서와 같이 0 (사용할 수 없음) 또는 1 (사용 가능한 경우)이 아니라 다음과 같습니다.

  • 80% 사용 가능
  • 20% 사용 불가

회귀를 사용하여이 문제를 해결할 수 있습니까?

회귀는 연속 출력 (0 또는 1 출력이 아닌)에 사용되지만 출력은 사용자 가용성의 연속 값이 될 수 없습니다 (출력과 같은) 80 의미하는 사용자는 80% 암시 적으로 사용자는 20% 없는).

답변:


6
  1. 예. 예를 들어, 인기있는 softmax 회귀는 각 클래스에 대한 확률 분포를 제공합니다.
  2. 예. Softmax는 일련의 이산 클래스에 대한 회귀입니다.

우리는 분류를 위해 회귀를 사용할 수 있습니다. 가장 일반적인 전략은 가장 가능성이 높은 예측 클래스를 얻는 것입니다.


1

예, 출력 요구 사항에 따라 분류 또는 회귀를 사용할 수 있습니다.

사용 가능 또는 사용 불가능과 같이 레이블이 지정된 출력을 원하면 분류를 사용해야합니다.

가용성 비율 (%)의 형태로 출력을 원하면 회귀를 사용해야합니다.


어딘가에서 소스로 이것을 백업 할 수 있습니까?
Mithical

-1

사전 신념을 사용하여 순진 베이 분류를 사용하고 사후 확률을 계산하거나 로지스틱 회귀 분석을 시그 모이 드 함수와 함께 사용할 수 있습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.