중심 검열 된 정상 표본의 분산 추정


11

나는 작은 샘플 (얻을 수있는 프로세스 일반적으로-배포 한 N 내가 분산을 추정하는 데 사용할 것을 일반적으로 10 ~ 30). 그러나 종종 샘플이 너무 가까워서 중심 근처의 개별 지점을 측정 할 수 없습니다.

나는 우리가 순서가있는 샘플을 사용하여 효율적인 추정량을 구성 할 수 있다는이 모호한 이해를 가지고있다. 5 어느 쪽 꼬리에서나, 그러한 샘플을 최적으로 사용하는 공정 분산을 추정하기위한 표준 / 수식 적 접근법이 있습니까?

예를 들어, 7 개의 샘플은 단단히 묶을 수 있지만 다른 3 개의 샘플은 한쪽으로 비대칭으로 치우 치지 만 더 지루한 단일 샘플링 없이는 말할 수 없습니다. .)

대답이 복잡한 경우 연구해야 할 내용에 대한 팁을 주시면 감사하겠습니다. 예를 들어, 이것이 주문 통계 문제입니까? 공식적인 대답이 있을까요? 아니면 계산상의 문제입니까?

업데이트 된 세부 정보 : 응용 프로그램이 촬영 대상 분석입니다. 단일 기본 샘플은 대상에 대한 단일 샷 의 충격 지점 ( x, y )입니다. 기본 프로세스는 대칭 이변 량 정규 분포를 갖지만 축 사이에는 상관 관계가 없으므로 { x } 및 { y } 샘플을 동일한 정규 분포에서 독립적으로 그리는 것으로 처리 할 수 있습니다. (우리는 또한 기본 프로세스가 레일리 분포 말할 수 있지만, 우리는 우리가 작은을위한 프로세스의 "진정한"중심의 좌표를 특정 할 수 없기 때문에 레일리 variates 샘플 측정 할 수 없음 크게 될 수 있습니다 샘플 센터에서 멀리 떨어진 곳 ( , )x¯y¯

우리는 목표가 주어졌고 총에 발사되었습니다. 문제는 n >> 3의 정확한 총이 일반적으로 별개의 샷으로 둘러싸인 "비정형 구멍"을 발사한다는 것입니다. 우리는 구멍 의 xy 너비를 관찰 할 수 있지만 구멍에서 불명확 한 샷 이 어디 에서 영향을 받는지는 알 수 없습니다 .

다음은 더 문제가있는 대상의 예입니다.

[n = 10 인 샘플 타겟]

n = 100 인 샘플 대상

이상적인 세계에서 우리는 각 샷 후에 목표를 변경 / 전환 한 다음 분석을 위해 샘플을 집계 합니다 . 가능할 때 이루어 지지만 종종 비현실적인 여러 가지 이유가 있습니다 .

주석에서 WHuber의 설명에 따른 추가 참고 사항 : 샷은 직경이 균일하고 알려진 대상 구멍을 생성합니다. 샷이 "비정형 그룹"밖에 있으면 발사체 반경을 알 수 있으므로 정확한 중심 측정 할 수 있습니다 . 각각의 "비정형 그룹"에서 우리는 몇 개의 주변 "볼"을 식별하고 알려진 발사체 반경을 기준으로 외부 샷의 정확한 중심을 다시 표시 할 수 있습니다. 우리가 "비정형 그룹"내부의 어딘가에 영향을 미쳤다 는 것은 "중앙 중심 검열" 의 나머지 샷입니다 .엑스나는

솔루션을 용이하게하기 위해 이것을 너비 w > d 의 중앙 간격으로 정규에서 1 차원 샘플 세트로 줄이는 것이 가장 쉽다고 생각합니다 . 여기서 dc < n "검열 된"샘플을 포함하는 발사체 직경 입니다.


(1) 정규 분포가 가정입니까, 아니면이를지지하는 좋은 증거가 있습니까? (2) 센터 근처의 데이터를 정확하게 계산할 수없는 문제가 있습니까? (즉,이다의 일반적인 의미 "검열"다른 것 할 수 있습니다 그 데이터를 계산하지만 그 값은 특정 간격 내에있는 것으로 만 알고있다.)
whuber

@ whuber : 그렇습니다. 우리는 프로세스가 정상적으로 배포되는 기본적이고 경험적인 증거를 가지고 있습니다. 그리고 우리 는 전체 그룹 의 정확한 포인트 를 알고 있으며 개별 값을 결정하기 위해 너무 많은 샘플이있는 간격을 관찰 할 수 있습니다.
feetwet

감사합니다. 불확실성의 본질은 여전히 ​​불분명하지만, 좋은 모델은 좋은 해결책을 제시 할 수있다. 그림이나 예를 제공하거나 측정 프로세스를 좀 더 자세히 설명해 주시겠습니까?
whuber

@ whuber : 업데이트되었습니다. 도움이된다면 실제 샘플에 대한 링크를 게시하는 작업도 할 것입니다.
feetwet

엑스나는,(μ,σ2)σ나는(엑스나는,아르 자형)아르 자형(엑스,아르 자형)아르 자형엑스

답변:


2

흥미로운 문제입니다. 먼저 정규 분포를 가정하지 않습니다. 당신이 실제로 찾고있는 것은 많은 다른 저격수, 총 또는 탄약 또는 기타에 공정하게 적용되는 분산의 추정치입니다.

나는 이것을 바꾸려고 노력했다. 10 개의 분리 된 구멍이 보이지 않으면 총알이 어디로 갔는지 정확히 알 수 없습니다 (10 발의 샷을 가정) 그러나 당신은 그들이 가지 않은 곳을 알고 있습니다. 분포를 시작하려는 경우 베이지안 통계를 가정하여 분포를 제한하는 데 사용할 수 있습니다.

여기서 가장 좋은 아이디어는 수학적으로 시도하는 것을 멈추고 이와 같은 합리적인 일을하는 것입니다. 대상을 촬영하고 이미지 처리 루틴을 실행하여 연결되지 않은 영역을 통해 샷을 표시하십시오. 이것의 평균과 두 번째 모멘트를 측정하고 추정값을 사용하십시오. 조금 더 나아가 가우시안 화하려는 경우 간단한 몬테 카를로 실험을 실행하여 보정 계수를 얻을 수 있습니다.


좀 더 설명하겠습니다. 총성이 10 발이고 총알이 어디로 갔는지 알 수있는 6 개의 구멍이 있다고 가정 해 봅시다. 먼저이 점을 사용하여 가우스 폭을 구속하십시오. 일반적인 루틴에 따라, 이것은 가우시안 시그마의 시그마를 제한합니다 (일부 알려진 분포입니다. cs.ubc.ca/~murphyk/Papers/bayesGauss.pdf
Dave31415

일단 당신이 그렇게 한 후에, 당신은 새로운 구멍을 만들지 않은 4 개의 총알을 고려하고 싶습니다. 글 머리 기호는 독립적이므로이 새로운 가능성 (가우시안 시그마)은 간단히 곱할 수 있습니다. 따라서 기본적으로 4 개의 총알마다 새로운 구멍을 만들지 않을 확률을 곱하고 싶습니다.
Dave31415

몬테 카를로와 함께하는 간단한 방법은 제한된 분포에서 시그마 세트를 그리고이 시그마를 사용하여 새 구멍을 만들지 않을 확률을 계산하는 것입니다. 따라서 이것으로부터 많은 시뮬레이션 샷을 그리고 어떤 구멍이 새로운 구멍을 만들지 않는지 계산하십시오. 그런 다음 가능성을 업데이트하는 데 사용할 수 있습니다. 그런 다음 다음 단계로 이동하여 동일한 작업을 수행하십시오. 이제 최종 가능성이 있습니다.
Dave31415

마지막 코멘트. 실제적인 관점에서 볼 때 시그마의 추정치는 실제로 보이지 않는 총알이 이전 구멍을 통과했다고 가정하는 한 정확하게 보이지 않는 곳에 영향을 미치지 않아야합니다. 가장자리를 정의하는 것을 볼 수있는 것들에 의해 대부분 제약을받습니다. 총알이 중앙에서 먼 구멍을 두 번 통과 할 가능성이 매우 낮기 때문입니다. 따라서 조잡한 몬테 카를로조차도 최적의 견적에 매우 가깝습니다.
Dave31415

만약 우리가 정규 (또는 다른) 분포를 주장하지 않는다면 검열 된 지역에서 일어나고있는 일에 상한 또는 하한을 두는 것 이상을 말할 수 없을 것 같습니다. 우리가 n 샷을 검열 한 1 차원 경우 분산에 대한 하한은 모두 평균에 가장 가까운 동일한 내부 지점에 도달했다고 가정하고 (평균이 내부에 중심을두고 있다고 가정) 상한은 검열 지점이 내부 주변에 균등하게 분포되어 있다고 가정합니다. 그러나 기본 프로세스가 정상이라고 가정하면 더 나은 작업을 수행 할 수 있어야합니다.
feetwet

0

또 다른 관점에서, 공간 통계 분야에 비추어 볼 수 있는데,이 통계는 여러 가지 메트릭을 생성했으며,이 중 다수는 툴박스에 배치되었습니다 (예 : https://www.google.com 참조). /url?sa=t&source=web&rct=j&ei=SG31U5j4BormsASc5IHgCw&url=http://resources.arcgis.com/en/help/main/10.1/005p/005p00000002000000.htm&cd=13&ved=0CE4QFjAM&usg=AFQjCNFw9AkAa-wo1rgNmx53eclQEIT1pA&sig2=PN4D5e6tyN65fLWhwIFOYA ).

Wikipedia (link : http://en.m.wikipedia.org/wiki/Spatial_descriptive_statistics )에는 실제로 공간 중심 경향 및 공간 분산 측정과 같은 개념을 논의하는 좋은 소개 페이지가 있습니다. 후자의 위키 백과를 인용하려면 :

"대부분의 응용에서 회전과 반사에 변하지 않는 방식으로 공간 분산을 정량화해야합니다. 점 집합에 대한 공분산 행렬을 사용하여 점 세트에 대한 몇 가지 간단한 공간 분산 측정 값을 정의 할 수 있습니다. 공분산 행렬의 최대 고유 값을 공간 분산의 측정 값으로 사용할 수 있습니다. 공분산 행렬을 기반으로하지 않는 공간 분산의 측정 값은 가장 가까운 이웃 간의 평균 거리입니다. [1] "

관련 개념에는 공간적 균질성 측정, Ripley의 K 및 L 함수, 총알 군집 분석, 군집 집단 내 하위 집단 군집에 대한 Cuzick-Edwards 테스트와 관련이있을 수 있습니다. 후자의 테스트는 (통계를 도표화하기 위해 "인접 이웃"분석을 사용하여) 비교 집단을 기반으로하며, 현재 상황에서 군집을 표시하지 않는 것으로 분류 된 실제 관찰 된 목표 또는 이론적 시뮬레이션에 근거 할 수있는 대조 집단에 대한 비교를 기반으로합니다. 레일리 배포판을 말합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.