첨도에 영향을주지 않고 왜곡을 변화시키는 변형?


11

첨도에 영향을 미치지 않고 임의 변수의 왜곡을 변경하는 변환이 있는지 궁금합니다. 이것은 RV의 아핀 변환이 평균과 분산에 어떻게 영향을 미치나, 왜도 및 첨도에는 영향을 미치지 않는 것과 유사합니다 (부분적으로는 삐와 첨도는 규모의 변화에 ​​불변으로 정의되기 때문에). 이것은 알려진 문제입니까?


이 변환에서도 표준 편차가 일정하게 유지되어야합니까?
russellpierce

아니요, 그렇지 않을 것으로 예상되지만 과도한 첨도는 고정되어 있어야합니다. 그러나 변환이 단조롭고 바람직하게 결정적이라고 기대합니다.
shabbychef

1
Yikes-비 결정적 기능을 입증하고자하는 사람에게는 단조롭습니다.
russellpierce

이 글타래는 독자들에게 흥미로울 것입니다 : 정상적인 rv의 첨도 및 왜곡을 증가시키는 변환 .
gung-복직 모니카

답변:


6

내 대답은 완전한 해킹의 시작이지만, 당신이 요구하는 것을 할 수있는 확실한 방법을 알지 못합니다.

첫 번째 단계는 데이터 세트의 순위를 정하는 것입니다. 데이터 세트에서 비례 위치를 찾은 다음 정규 분포로 변환 할 수 있습니다.이 방법은 1996 년 Reynolds & Hewitt에서 사용되었습니다. PROCMiracle에서 아래의 샘플 R 코드를 참조하십시오.

분포가 정상이면 문제가 머리에 씌워졌습니다-첨도 조정 문제이지만 기울이지 않습니다. 구글 검색에 따르면 1980 년 존 & 드레이퍼 (John & Draper)의 절차에 따라 첨도를 조정할 수는 있지만 왜곡을 조정할 수는 없지만 그 결과를 재현 할 수는 없었습니다.

입력 (표준화 된) 값을 가져 와서 정상 스케일에서 변수의 위치에 비례하여 값을 더하거나 빼는 조잡한 확산 / 축소 기능을 개발하려고하면 단조로운 조정이 발생하지만 실제로는 생성 경향이 있습니다 원하는 왜도 및 첨도 값을 갖는 이봉 분포.

나는 이것이 완전한 대답이 아니라는 것을 알고 있지만 그것이 올바른 방향으로 나아가는 단계를 제공 할 것이라고 생각했습니다.

PROCMiracle <- function(datasource,normalrank="BLOM")
  {
     switch(normalrank,
      "BLOM" = {
                  rmod <- -3/8
                  nmod <- 1/4
                },
      "TUKEY" = {
                  rmod <- -1/3
                  nmod <- 1/3
                },
      "VW" ={
                  rmod <- 0
                  nmod <- 1
            },
      "NONE" = {
                  rmod <- 0
                  nmod <- 0
                }
    )
    print("This may be doing something strange with NA values!  Beware!")
    return(scale(qnorm((rank(datasource)+rmod)/(length(datasource)+nmod))))
  }

나는 다음과 같은 일을하고 있었다 : 계급, 그리고 g-h 변환을 사용하여 고정 첨도 및 기울기를 얻는다. 그러나이 기법은 내가 추정 할 수있는 모집단 첨도를 실제로 알고 있다고 가정하지만 철학적으로는 첨도를 보존 할 수있는 변환이있을 경우 철학적으로 관심이 있습니다.
shabbychef

@ shabbychef : 아, 그럼 새로운 것을 추가하지 않아서 죄송합니다. 그러나, 당신은 새로운 것을 추가했는데, 나는 이전에 g와 h 공식에 대해 들어 보지 못했습니다. 자유롭게 이용할 수있는 인용이 있습니까? 나는 철자 ( fic.wharton.upenn.edu/fic/papers/02/0225.pdf ) 와 함께 한 종이를 우연히 만났지만 그 개념은 나에게 조금 이질적입니다 (특히 e ^ Z ^ g 또는 다른 것입니다) )? 나는 이것을 이렇게 시도했지만 결과는 이상해 보였다 ... a + b * (e ^ g ^ z-1) * (exp ((h * z ^ 2) / 2) / g).
russellpierce

1
@ drnexus : 내 기술을 언급하여 결과를 바이어스하고 싶지 않았습니다. 나는 Haynes 등의 g-and-h와 g-and-k 분포에 대해 배웠습니다. al, dx.doi.org/10.1016/S0378-3758(97)00050-5 및 Fisher & Klein, econstor.eu/bitstream/10419/29578/1/614055873.pdf
shabbychef

1

12샘플 주문 통계와 변환 된 버전 사이의 규범은 주어진 제약 조건을 따릅니다. 그러나 이것은 일종의 엉뚱한 접근법입니다. 원래 질문에서 나는 더 기본적이고 근본적인 것을 찾고있었습니다. 나는 또한 전체 표본 집단과 관계없이 개별 관측에 적용될 수있는 기술을 암시 적으로 찾고 있었다.


0

차라리 데이터 변환 대신 leptokurtic 분포를 사용하여이 데이터 세트를 모델링하려고합니다. 나는 Biometrika 인 Jones and Pewsey (2009)의 sinh-arcsinh 배포판을 좋아한다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.