전력 법칙에 대한 추세선의 적합도를 측정 / 논쟁하는 방법은 무엇입니까?


21

추세선에 맞추려는 데이터가 있습니다. 나는 데이터가 전력 법칙을 따를 것이라고 생각하므로 직선을 찾기 위해 로그 로그 축에 데이터를 플로팅했습니다. 이로 인해 (거의) 직선이 생겨서 Excel에서 전력 법칙에 대한 추세선을 추가했습니다. 통계가 newb이기 때문에, 내 질문은, "선 잘 맞는 것처럼 보입니다 "에서 "숫자 속성 이 그래프가 전력 법에 의해 적절하게 적합 하다는 것을 증명 하는 "으로가는 가장 좋은 방법은 무엇입니까? 엑스

Excel에서는 통계에 대한 제한된 지식이 있지만 내 특정 상황에서 이것이 실제로 적절한 지조차 알지 못하지만 r 제곱 값을 얻을 수 있습니다. Excel에서 작업중 인 데이터의 플롯을 보여주는 이미지가 아래에 포함되어 있습니다. R에 대해 약간의 경험이 있으므로 분석이 도구에 의해 제한되는 경우 R을 사용하여 분석을 개선하는 방법에 대한 제안을 할 수 있습니다.

대체 텍스트


당신은 여기 몇 가지 아이디어를 찾을 수 있습니다 freakonometrics.blog.free.fr/index.php?post/2010/09/29/…

답변:


24

Aaron Clauset의 페이지를 참조하십시오.

여기에는 권력 법 (Matlab, R, Python, C ++)에 적합한 코드와 Clauset 및 Shalizi의 논문에 대한 링크가 있습니다.

논문에있는 Clauset 's와 Shalizi의 블로그 게시물을 먼저 읽으십시오.

마지막 링크의 요약은 다음과 같습니다.

  • 분포가 많으면 로그-로그 플롯에 직선이 생깁니다.

  • 선형 회귀를 남용하면 아기 가우스가 울립니다.
    최소 제곱으로 로그 로그 플롯에 선을 맞추는 것은 나쁜 생각입니다.

  • 스케일링 지수를 추정하려면 최대 가능성을 사용하십시오.
  • 스케일링 영역이 시작되는 위치를 추정하려면 적합도를 사용하십시오.
  • 적합도를 확인하려면 적합도 테스트를 사용하십시오.
  • Vuong의 테스트를 사용하여 대안을 확인하고 실망에 대비하십시오.

1
나는 이것을 두 번째로한다. 권력 법처럼 보이는 것에 대한 많은 예들이 있지만, 조금 더 엄격하게 살펴보면 차트에서 높은 R ​​^ 2는 충분하지 않습니다.
PeterR

"그래서 ..."는 훌륭한 참고 자료입니다. 1-6 점 (7 점 만점)은 여기서 제기 된 문제를 직접 해결합니다.
whuber

그러나 전력 법칙 분포 는 두 개의 개별 변수 사이에 전력 법칙 관계를 맞추는 것과 다릅니다. 확실하지는 않지만 질문이 후자에 관한 것이라고 가정했습니다.
onestop

χ2

2
@ JM : 실제로 카이 제곱은 비닝에 민감하지 않으며 꼬리 변동은 복잡합니다. 나는 KS조차도 극단 점에 대한 통계를 재검토하고 다른 테스트에 대한 논의가 있다고 생각합니다. @ onestop : 다른 방법으로 가정하고 다시 읽으면 옳을 수 있습니다. 잘 모르겠어요 ..
ars

3

이변 량 전력 법칙 함수에 관심이있는 경우 (단 변량 검정 법칙 분포와 반대)

Warton et al. " 할로 메 트리를위한 이변 량 라인 피팅 방법 ." Biol. 개정판 81, 259-201 (2006)

훌륭한 참고 자료입니다. 이 경우 회귀 결과가 의미하는 바에 따라 일부 수정 (OLS vs. RMA 등)이있을 수 있지만 회귀가 올바른 방법입니다.


애런-그 링크는 죽었습니다. 신선한 링크를 게시 할 수 있습니까?
keflavich

고마워 대부분의 정보는 이변 량 관계에 대한 정보를 묻는 경향이있는 일 변량 분포에 대한 것입니다 ... 여기 Riley 목록으로 연결되는 링크가 있습니다. onlinelibrary.wiley.com/doi/abs/10.1017/S1464793106007007
songololo
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.