첨도에 영향을 미치지 않고 임의 변수의 왜곡을 변경하는 변환이 있는지 궁금합니다. 이것은 RV의 아핀 변환이 평균과 분산에 어떻게 영향을 미치나, 왜도 및 첨도에는 영향을 미치지 않는 것과 유사합니다 (부분적으로는 삐와 첨도는 규모의 변화에 불변으로 정의되기 때문에). 이것은 알려진 문제입니까?
첨도에 영향을 미치지 않고 임의 변수의 왜곡을 변경하는 변환이 있는지 궁금합니다. 이것은 RV의 아핀 변환이 평균과 분산에 어떻게 영향을 미치나, 왜도 및 첨도에는 영향을 미치지 않는 것과 유사합니다 (부분적으로는 삐와 첨도는 규모의 변화에 불변으로 정의되기 때문에). 이것은 알려진 문제입니까?
답변:
내 대답은 완전한 해킹의 시작이지만, 당신이 요구하는 것을 할 수있는 확실한 방법을 알지 못합니다.
첫 번째 단계는 데이터 세트의 순위를 정하는 것입니다. 데이터 세트에서 비례 위치를 찾은 다음 정규 분포로 변환 할 수 있습니다.이 방법은 1996 년 Reynolds & Hewitt에서 사용되었습니다. PROCMiracle에서 아래의 샘플 R 코드를 참조하십시오.
분포가 정상이면 문제가 머리에 씌워졌습니다-첨도 조정 문제이지만 기울이지 않습니다. 구글 검색에 따르면 1980 년 존 & 드레이퍼 (John & Draper)의 절차에 따라 첨도를 조정할 수는 있지만 왜곡을 조정할 수는 없지만 그 결과를 재현 할 수는 없었습니다.
입력 (표준화 된) 값을 가져 와서 정상 스케일에서 변수의 위치에 비례하여 값을 더하거나 빼는 조잡한 확산 / 축소 기능을 개발하려고하면 단조로운 조정이 발생하지만 실제로는 생성 경향이 있습니다 원하는 왜도 및 첨도 값을 갖는 이봉 분포.
나는 이것이 완전한 대답이 아니라는 것을 알고 있지만 그것이 올바른 방향으로 나아가는 단계를 제공 할 것이라고 생각했습니다.
PROCMiracle <- function(datasource,normalrank="BLOM")
{
switch(normalrank,
"BLOM" = {
rmod <- -3/8
nmod <- 1/4
},
"TUKEY" = {
rmod <- -1/3
nmod <- 1/3
},
"VW" ={
rmod <- 0
nmod <- 1
},
"NONE" = {
rmod <- 0
nmod <- 0
}
)
print("This may be doing something strange with NA values! Beware!")
return(scale(qnorm((rank(datasource)+rmod)/(length(datasource)+nmod))))
}