불연속을 허용하는 손실


14
  • 불연속의 타이밍이 선험적으로 알려지지 않은, 0, 1 또는 그 이상의 불연속을 허용하는 LOESS 와 같은 모델링 기술 이 있습니까?
  • 기술이 존재하는 경우 R에 기존 구현이 있습니까?

1
알려진 x 값 또는 불명 한 x 값에서의 불연속성? (알려진 x는 충분히 쉽다)
Glen_b-복지국 Monica

@ glen 나는 질문을 업데이트했다 : 나는 불연속의 타이밍이 선험적으로 알려지지 않은 상황에 관심이있다.
Jeromy Anglim

이것은 멍청한 / 어리석은 질문 일 수도 있지만 "타이밍"이라고 말하면 시계열과 함께 사용됩니까? LOESS는 비 연속적 상황에서 비 연속적 상황에서 적용될 수 있지만 아래의 답변 중 대부분이이 점 ( "변경점 등")을 가정합니다. 내 생각에
Wayne

답변:


15

각 세그먼트 내에서 여러 변경점 감지를 수행 한 후 독립적 인 평활화를 수행하려는 것처럼 들립니다. (탐지가 온라인 일 수도 있고 아닐 수도 있지만 응용 프로그램이 온라인 일 가능성은 없습니다.) 이에 대한 많은 문헌이 있습니다. 인터넷 검색은 유익합니다.

  • DA Stephens는 1994 년 베이지안 변경점 탐지에 대한 유용한 소개를 작성했습니다 (App. Stat. 43 # 1 pp 159-178 : JSTOR ).
  • 더 최근에 Paul Fearnhead는 훌륭한 작업을 수행해 왔습니다 (예 : 여러 변경점 문제에 대한 정확하고 효율적인 베이지안 추론 , Stat Comput (2006) 16 : 203-213 : 무료 PDF ).
  • D Barry & JA Hartigan의 아름다운 분석을 기반으로 재귀 알고리즘이 존재합니다.
    • 변경점 모델의 제품 파티션 모델, Ann. 통계 20 : 260-279 : JSTOR ;
    • 변경점 문제에 대한 베이지안 분석, JASA 88 : 309-319 : JSTOR .
  • Barry & Hartigan 알고리즘의 한 가지 구현은 O. Seidou & TBMJ Ourda, 다변량 선형 회귀 및 수류에 대한 다변량 선형 회귀에서의 재귀 기반 다중 변경점 탐지에 설명되어 있습니다. Res., 2006 : 무료 PDF .

나는 R 구현을 열심히 보지 않았지만 (나는 얼마 전에 Mathematica에서 코드를 작성했다) 당신이 하나를 찾으면 참조에 감사 할 것이다.


3
Barry & Hartigan 알고리즘을 구현 하는 bcp R 패키지 jstatsoft.org/v23/i03/paper 를 발견했습니다
Jeromy Anglim

@Jeromy : R 패키지와 레퍼런스에 대한 링크를 삽입 해 주셔서 감사합니다.
whuber

7

koencker의 파선 회귀를 사용하여 수행하십시오.이 비네팅의 18 페이지를 참조하십시오.

http://cran.r-project.org/web/packages/quantreg/vignettes/rq.pdf

Whuber의 마지막 의견에 대한 답변 :

이 추정기는 다음과 같이 정의됩니다.

, x ( i )x ( i 1 )엑스아르 자형 ,엑스(나는)엑스(나는1)나는

,이자형나는: =와이나는β나는엑스(나는)β0

, (Z) - = 최대 ( - Z , 0 ) ,+=최대(,0)=최대(,0)

, λ 0τ(0,1)λ0

.β아르 자형|τ,λ나는=1τ이자형나는++나는=1(1τ)이자형나는+λ나는=2|β나는β나는1|

ττ=0.9λλ

Quantile Smoothing Splines Roger Koenker, Pin Ng, Stephen Portnoy Biometrika, Vol. 81, No. 4 (1994 년 12 월), pp. 673-680

추신 : 같은 다른 사람들과 같은 이름을 가진 개방형 작업 종이가 있지만 같은 것은 아닙니다.


좋은 아이디어입니다 : 참조 해 주셔서 감사합니다. 그러나 특정 맞춤에 대한 잔차가 매우 나빠 보이기 때문에 잠재적 변경 지점을 얼마나 잘 식별하는지 궁금합니다.
whuber

whuber : 분위수 회귀 이론에 얼마나 익숙한 지 모르겠습니다. 이 선들은 스플라인에 비해 큰 장점을 가지고 있습니다. 오류 분포를 가정하지 않습니다 (즉, 잔차를 가우스로 가정하지 않습니다).
user603

@kwak 이거 흥미로워 요. 정상적인 오류 분포를 가정하지 않으면 내 응용 프로그램 중 하나에 유용합니다.
Jeromy Anglim

실제로, 당신 이이 추정에서 얻는 것은 실제 조건부 양자입니다 : 간단히 말하면, 스플라인 / 잃어버린 회귀에 대한 것입니다. 또한 비 가우시안 컨텍스트 (예 : 아시 메트릭 오류 등)의 유효성을 유지합니다.
user603

@kwak : 잔차는 x 좌표와 크게 상관됩니다. 예를 들어, 음수 또는 작은 양의 잔차가 길다. 가우스 분포가 있는지 여부에 관계없이 중요하지 않습니다 (탐색 분석과 관련이 없음).
whuber

6

이 문제를 해결하기위한 몇 가지 방법과 관련 R 패키지는 다음과 같습니다.

회귀 분석에서의 웨이블릿 임계 값 추정불일치를 허용합니다. R에서 패키지 wavethresh를 사용할 수 있습니다.

불일치가있는 경우 많은 트리 기반 방법 (웨이블릿 개념에서 멀지 않은 방법 )이 유용합니다. 따라서 패키지 트리 트레 쉬, 패키지 트리!

" 로컬 최대 가능성 "방법의 패밀리에서 : Pozhel 및 Spokoiny의 작업 : 적응 형 가중치 스무딩 (패키지 aws) Catherine Loader의 작업 : 패키지 위치

로컬로 변화하는 대역폭 을 가진 커널이 더 매끄럽다 고 생각 하지만 R 패키지를 알지 못합니다.

참고 : 나는 LOESS와 회귀의 차이점을 실제로 얻지 못합니다 ... LOESS 알고리즘에서 "온라인"이어야한다는 생각입니까?


1
Re LoESS : 아마도 내 용어가 옳지 않을 수도 있습니다. LOESS에서는 현지화 된 곡선 피팅의 형태를 사용하여 X에서 Y를 예측하는 모델을 말합니다. 예를 들어, 대부분의 그래프에서 볼 수 있듯이 : google.com/…
Jeromy Anglim

2

비선형 회귀 함수 nls, b 스플라인 (예 : 스플라인 패키지의 bs 함수) 및 ifelse 함수를 사용하여 솔루션을 R로 코딩 할 수 있어야합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.