과학 논문에서 곡선 맞춤 결과보고


11

(이 질문이이 사이트에 적합하기를 바랍니다.

특정 시뮬레이션을 실행하고 시계열 y (t), t = 0, 1, ... 20을 얻었습니다. 일부 함수를 시도한 후 다음을 발견했습니다.

y(t) =~ 1 / (A t + B)

여기서 A와 B는 선형 회귀를 사용하여 계산 한 계수이며 R ^ 2> 0.99입니다.

과학 논문에 그러한 결과를보고하는 표준 방법은 무엇입니까? 구체적으로 특별히:

A. 이론적 설명이 없으며 출력이 다음과 같은 이유가 있습니다 (감소해야한다는 것을 알고 있으며 아래에서 제한되지만 그 이상은 아닙니다). 그것은 단지 성공적인 추측이었다. 내가 시도한 다른 모든 실패한 추측을 설명해야합니까?

B. 시뮬레이션을 실행할 때마다 A와 B의 값이 약간 다릅니다. 무작위 실행을보고해야합니까, 아니면 시뮬레이션을 여러 번 실행하여 결과를 평균화해야합니까? 그렇다면 몇 번이면 충분합니까?


무엇을 전달하고 싶습니까? 각 개별 시뮬레이션은 무엇을 나타 냅니까?
Bill Barth

토지 소유권의 시뮬레이션입니다. N 시민과 N 대지가 있습니다. 처음에는 각 토지 계획이 임의의 시민에게 제공됩니다. 그런 다음 매년 각 토지는 특정 확률 p로 판매되며 실제로 판매되는 경우 구매자가 임의로 선택됩니다. 50 년이 지난 후, 현재 소유자가 토지가없는 경우 일부 토지가 원래 소유자에게 반환되는 "주빌리"절차를 실행합니다. 나는 각 희년 (t) 후에 토지 (y)가없는 시민의 수를 측정합니다. 확실히 y (t)는 증가하지 않습니다. 예측 가능한 속도로 감소하고 있으며 0으로 수렴 함을 보여주고 싶습니다.
Erel Segal-Halevi


2
엑스=0

Bill : A와 B를 여러 번 계산 한 다음 평균과 표준을보고해야합니까? 더 나은 접근법은 모든 시뮬레이션의 모든 샘플로 단일 선형 회귀를 수행하는 것입니다. 그러나 시뮬레이션을 몇 번이나 실행해야합니까?
Erel Segal-Halevi

답변:


5

당신은 당신의 분포에 힘의 법칙 을 맞추려고 노력하고 있습니다. 매우 흥미로운. 이것들은 항상 그래프 이론 , 소셜 네트워크수많은 다른 장소에 나타납니다.

여기여기에 데이터를 맞추는 방법에 대한 자습서가 있습니다 .

또한 질문 A.와 관련하여, 사람이 토지를 구매할 확률은 이미 가지고있는 토지의 양에 어떻게 의존합니까? 전력 법칙이 데이터에 적합한 이유를 설명 하기 위해 Barbasi의 모델 을 사용할 수 있습니다 .

업데이트 : 나는 이것을 사용했고 잘 작동합니다 : https://pypi.python.org/pypi/powerlaw


모든 링크에 +1! 나는 또한 권력 법을 생각했지만, B 상수 (y = (A t + B) ^-1) 때문에 간단한 형태 (y = A t ^ k)는 내가 찾은 형태를 수반하지 않습니다. 더 일반적인 형태가 있습니까?
Erel Segal-Halevi

곡선의 모양을 설명하려면 전력 법칙을 맞추기 전에 인수 분해하고 이동해야합니다. B가 있다는 사실은 곡선의 모양과 관련이 없습니다.
dranxo

죄송합니다. 당신을 이해하지 못했습니다. "그러면 요인과 변화"가 무엇을 의미합니까?
Erel Segal-Halevi

x = t + B / A로 설정하십시오. 그런 다음 링크의 양식 인 (At + B) ^ {-1} = (A * x) ^ {-1}입니다.
dranxo

1
tuvalu.santafe.edu/~aaronc/courses/7000/csci7000-001_2011_L3.pdf
dranxo

7

귀하의 질문에 대한 몇 가지 생각 :

  • 모델 적합을보고 하는 방법 은 대상과 분야에 따라 크게 달라집니다. 예를 들어, 내 분야에서 R ^ 2와 같은 모형 적합 통계는 거의보고되지 않으며 인상적이거나 특히 유용하지 않습니다. 대신에, 당신이 도착한 모델에 어떻게 도착했는지에 대한 몇 가지 기준이 설명되는 경향이 있고, 모델 결과를보고합니다.
  • "나는이 양식을 가로 질러 일어났다"는 나쁜 설명이다. 정말 나쁜 것입니다. 페니실린이나 퀴닌의 발견과 같은 우발적 인 천재 이야기에 대한 애정에도 불구하고 "맹목적인 멍청한 행운"은 믿을만한 과학적 과정이 아닙니다. 예를 들어, 해당 양식이 데이터에 적합하다는 것을 보여 주었지만 아직 데이터에 가장 적합 하다는 것을 보여주지 않았습니다 . R ^ 2만으로는 모형이 데이터를 얼마나 잘 적합시키는 지 평가하기에 충분한 지표가 아닙니다. Anscombe의 사중주를 참조하십시오 .
  • @rcompton이 언급했듯이 전력 법칙을 알지 못하고 전력 법칙 배포에 맞추려고하는 것처럼 보이지만 전력 법칙에 잘 부합하더라도 전력 법칙을 생각하는 이유를 찾은 것이 가장 좋습니다. . 시간이 지남에 따라 Y를 플로팅하고 CrossValidated (또는 통계에 더 편한 대학 / 부서)로 가서 대략적으로 그 모양을 줄 수있는 분포를 체계적으로 살펴 보는 것으로 충분할 수 있습니다 . 권력 법 배포 외에 당신에게 더 잘 맞을 수있는 다른 것들도 있습니다.

통찰력 +1 "체계적으로 배포판을 살펴보면 대략적인 모습을 볼 수 있습니다." -어디서 찾을 수 있습니까?
Erel Segal-Halevi

@ErelSegalHalevi 통계 및 데이터 분석과 관련된 자매 사이트 인 CrossValidated에서 시작할 수 있습니다.
Fomite
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.