데이터에서와 이블 매개 변수를 어떻게 확인할 수 있습니까?


10

나는 종종와 이블 분포를 사용하여 표현되는 풍속 데이터의 히스토그램을 가지고 있습니다. 히스토그램에 가장 적합한와 이블 모양 및 스케일 팩터를 계산하고 싶습니다.

목표는 프로그래밍 방식으로와 이블 형식을 결정하는 것이기 때문에 수치 솔루션 ( 그래픽 솔루션 과 반대)이 필요합니다 .

편집 : 샘플은 10 분마다 수집되며 풍속은 10 분 동안 평균입니다. 샘플에는 현재 무시되는 각 간격 동안 기록 된 최대 및 최소 풍속이 포함되어 있지만 나중에 통합하고 싶습니다. 빈 너비는 0.5m / s입니다.

1 개월의 데이터에 대한 히스토그램


1
히스토그램이 있다고 말할 때-관측치에 대한 정보가 있거나 빈 너비와 높이 만 알고 있습니까?
suncoolsu

@suncoolsu 모든 데이터 포인트가 있습니다. 5,000에서 50,000 개의 레코드에 이르는 데이터 세트.
klonq

임의의 데이터 샘플을 가져 와서 MLE 매개 변수를 수행 할 수 없습니까?
schenectady

2
추정의 목적은 무엇입니까? 과거의 조건을 소급하여 특성화하려면? 한 장소에서 미래 발전을 예측하려면? 터빈 그리드 내에서 발전을 예측하려면? 기상 모델을 교정하려면? 이 질문에 대해 적절한 솔루션을 결정하는 방법은 사용 방법에 결정적으로 달려 있습니다.
whuber

현재 @whuber는 기간별 및 / 또는 사이트 별 비교가 가능한 형태로 바람 데이터 세트를 요약하는 아이디어입니다. 나중에 목표는 추세를 비교하고 미래 생산 등에 대한 판단을 내리는 것입니다. 통계에 대해 초보자는 많지만 공유 할 수없는 데이터가 있고 다음과 같이 추출하고 싶습니다. 가능한 많은 정보가 있습니다. 이 주제에 대한 독서를 알려 주시면 대단히 감사하겠습니다.
klonq

답변:


11

Weibull 모수의 최대 우도 추정 은 귀하의 경우에 좋은 생각 일 수 있습니다. Weibull 배포 형태는 다음과 같습니다.

(γ/θ)(x)γ1exp(xγ/θ)

θ,γ>0X1,,Xn

L(θ,γ)=i=1nlogf(Xi|θ,γ)

하나의 "프로그래밍 기반"솔루션은 제한된 최적화를 사용하여이 기능을 최적화합니다. 최적의 솔루션을위한 해결 :

logLγ=nγ+1nlogxi1θ1nxiγlogxi=0
logLθ=nθ+1θ21nxiγ=0

θ

[1nxiγlogxi1nxiγ1γ]=1n1nlogxi

γ^

θγ^

θ^=1nxiγ^n

내가 조심해야 할 것은 여기에 시계열 데이터가있는 것처럼 들린다는 것입니다. 데이터가 단기간에 걸쳐 샘플링되는 경우 독립성을 가정하면 위험 할 수 있습니다. 그렇습니다 (+1).
추기경

@cardinal 설명 해주십시오. 데이터의 범위는 한 달 또는 최대 1 년입니다. 그러나 정기적으로 샘플링됩니다 (10 분). 이것이 무엇을 의미할까요?
klonq

@cardinal 지적 해 주셔서 감사합니다. 독립 가정이 적절한 지 확실하지 않았습니다.
suncoolsu

1
@ klonq, 샘플은 어떻게 가져 옵니까? 녹화 간 10 분 동안의 평균 속도입니까? 녹음하기 1 분 이상? 녹화 시점의 순간 속도는? 대부분 연속적인 상관 관계를 찾고 있는데, 이는 효과적인 샘플 크기를 상당히 줄일 수 있습니다. 독립 표본의 가정을 기반으로 ML 추정치를 사용하면 해당 상황에서 여전히 올바른 추정치를 제공 할 수도 있고 그렇지 않을 수도 있으며, 추정치에 따른 추론 에 대해 특별한주의를 기울여야합니다 . Suncoolsu의 접근 방식은 확실히 첫 번째 공격 라인을 제공합니다.
추기경

@klonq-가능하면 샘플 수집 방법을 설명해 주시겠습니까? 데이터는 어떤 모습입니까?
suncoolsu

12

fitdistrplus를 사용하십시오 :

히스토그램으로 분포를 식별하는 데 도움이 필요합니다

Weibull 분포가 적합한 방법의 예는 다음과 같습니다.

library(fitdistrplus)

#Generate fake data
shape <- 1.9
x <- rweibull(n=1000, shape=shape, scale=1)

#Fit x data with fitdist
fit.w <- fitdist(x, "weibull")
summary(fit.w)
plot(fit.w)


Fitting of the distribution ' weibull ' by maximum likelihood 
Parameters : 
       estimate Std. Error
shape 1.8720133 0.04596699
scale 0.9976703 0.01776794
Loglikelihood:  -636.1181   AIC:  1276.236   BIC:  1286.052 
Correlation matrix:
          shape     scale
shape 1.0000000 0.3166085
scale 0.3166085 1.0000000

여기에 이미지 설명을 입력하십시오


고맙지 만 Java로 솔루션을 찾으려고합니다.
klonq

모양과 스케일 팩터를 얻기 위해 R 코딩의 포인터가 있습니까? 감사.
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.