tl; dr
discrete
이상 감지를 수행 할 때 데이터 를 처리하는 권장 방법은 무엇입니까 ?categorical
이상 감지를 수행 할 때 데이터 를 처리하는 권장 방법은 무엇입니까 ?- 이 답변 은 개별 데이터를 사용하여 결과를 필터링하는 것이 좋습니다.
- 아마도 범주 값을 perctage 관찰 가능성으로 대체 하시겠습니까?
소개
이것은 처음으로 여기에 게시되므로 형식이나 올바른 정의를 사용하여 기술적으로 정확하지 않은 것으로 보이는 경우 대신 사용해야하는 것을 알고 싶습니다.
앞으로.
저는 최근 Andrew Ng 의 기계 학습 수업에 참여했습니다.
이상 탐지를 위해 우리는 보통 / 가우스 분포 매개 변수가 주어진 기능 / 변수에 대해 어떤 결정하기 위해 배운 한 특정 주어진 훈련 예제의 / 관찰 값의 선택 세트의 확률을 데이터 세트 내에서 다음 결정 가우스 분포를 구한 다음 피처의 확률을 곱합니다.
방법
문제의 활동을 설명 할 것으로 생각되는 기능 / 변수를 선택하십시오 : { x 1 , x 2 , … , x i }
각 피처에 대해 가우시안 파라미터를 피팅합니다 : σ2=1
각 학습 예 에 대해 다음을 계산합니다. p ( x ) = n ∏ j = 1 p ( x j ; μ j , σ 2 j )
그런 다음 다음과 같이 예외 ( ) 로 플래그를 지정합니다. y = { 1
이를 통해 예제에 추가 검사가 필요한지 확인할 수있는 방법이 제공됩니다.
내 질문
이는 연속 변수 / 기능에는 문제가 없지만 이산 데이터는 다루지 않습니다.
[IsMale]
값이 일 수있는 성별 변수와 같은 더미 변수는 어떻습니까? 더미 기능을 고려하기 위해 이항 분포를 대신 p ( x ) 를 계산 할까요?
질문 : (업데이트 : 2015-11-24)
여기에서 내가 연구하고 배우는 것에 대해 내가 요구하는 것을 고려하는 또 다른 방법이 있습니까?discrete
이상 감지를 수행 할 때 데이터 를 처리하는 권장 방법은 무엇입니까 ?categorical
이상 감지를 수행 할 때 데이터 를 처리하는 권장 방법은 무엇입니까 ?
편집 : 2017-05-03
- 이 답변 은 개별 데이터를 사용하여 결과를 필터링하는 것이 좋습니다.
- 아마도 범주 값을 perctage 관찰 가능성으로 대체 하시겠습니까?