현재 일련의 데이터에서 'Price Outliers'를 찾으려고합니다. 제품 가격 세트 (예 : 우유와 같은 제품 범주 내)가 의심스러운 가격을 필터링하려고합니다. 예를 들어 우유 가격 세트가 있습니다. 그런 다음 필터링하고 싶습니다 과 . 문제는 다른 제품 범주 내에서 가격 범위가 크게 다를 수 있다는 것입니다. 예를 들어 생선 : 참치 통조림과 캐비어 통조림은 가격을 1kg으로 변환하면 가격에 큰 차이가 있습니다.
따라서 여러분 중 누군가가 '유사한'제품 내에서 가격을 설명하기 위해 (수학적) 모델을 알고 있다면 절대적인 것이 아니라 가격에 대한 상대적인 결론에 더 관심이 있습니다. 리터당 우유 1 유로에 대한 우유이지만 의심스러운 가격을 찾기 위해 '범위 가격이 가질 수있는'에 관심이 있습니다.
지금까지 나는 경험적 기대 값과 표준 편차로 작업하여 가격이 로그 정규 분포를 가정하고 2 시그마 간격을 계산하고 2 시그마 간격이 아닌 모든 가격을 필터링했다고 가정했습니다. 이것은 다소 좋은 결과를 제공하지만 실제로 만족 스럽지는 않습니다.
이 문서 는 설명하고있는 문제에 대한 '수학적'접근 방식을 도입하기에 좋은 진입 점으로 보입니다.
—
sen_saven
"유사한"제품에 대한 추가 정보가 있습니까? 수량화 할 수있는 무언가가 있다면 확률 론적 프론티어를 구축 할 수 있습니다. 예제는 pages.stern.nyu.edu/~wgreene/FrontierModeling/SurveyPapers/…
—
kitsune
@sen_saven 그래서 나는이 논문을 읽었으며 내가 알 수있는 한 소매점에 대한 데이터를 집계하고 눈에 띄는 가격 변화를 테스트합니다. 당신이 말했듯이, 그것은 좋은 진입 점처럼 보이지만 주어진 제품 그룹의 가격 범위에 관심이 있고 집계 된 제품 그룹의 가격 변동이 아니라 내 경우에 이것이 적용 가능한지 확실하지 않습니다. 내가 틀렸다면 정정 해주세요. 어쨌든 고맙게도, 나는 언급 된 논문을 추적하고 내가 찾을 수 있는지 알아 볼 것입니다.
—
Abbraxas
@kitsune 불행히도 아니요, 정량화 가능한 특성이 없습니다. FrontierModeling을 살펴보고 피드백을 제공하겠습니다.
—
Abbraxas
@kitsune 그래서 그것을 들여다 보았고 어디서부터 시작 해야할지 확실하지 않습니까? 확률 론적 프론티어를 제안했는데, 제 경우에 어떻게 적용 할 수 있습니까?
—
Abbraxas