모집단의 정량적 속성이“매개 변수”입니까?


13

통계와 매개 변수라는 용어의 차이점에 대해 비교적 잘 알고 있습니다. 통계를 샘플 데이터에 함수를 적용하여 얻은 값으로 봅니다. 그러나 모수의 대부분의 예는 모수 분포 정의와 관련이 있습니다. 일반적인 예는 정규 분포를 매개 변수화하는 평균 및 표준 편차 또는 선형 회귀를 매개 변수화하기위한 계수 및 오류 분산입니다.

그러나 덜 분포적인 인구 분포의 다른 많은 값이 있습니다 (예 : 최소, 최대, 다중 회귀 분석에서 r 제곱, .25 분위수, 중앙값, 계수가 0이 아닌 예측 변수 수, 왜도, 수 .3보다 큰 상관 행렬에서의 상관 관계 등).

따라서 내 질문 은 다음과 같습니다.

  • 모집단의 정량적 속성에 "매개 변수"라는 레이블이 지정되어야합니까?
  • 그렇다면 왜 그렇습니까?
  • 그렇지 않은 경우 어떤 특성에 매개 변수 레이블을 지정하지 않아야합니까? 그들은 무엇을 표시해야합니까? 그리고 왜?

혼란에 대한 정교함

견적 자에 대한 Wikipedia 기사는 다음과 같이 말합니다.

"추정기"또는 "점 추정치"는 통계 모델에서 알 수없는 매개 변수의 값을 추론하는 데 사용되는 통계 (즉, 데이터의 함수)입니다.

그러나 나는 미지의 값을 .25 Quantile로 정의 할 수 있으며 그 미지의 추정기를 개발할 수 있습니다. 즉, 모집단의 모든 정량적 속성이 평균과 sd가 정규 분포의 매개 변수와 같은 방식으로 매개 변수는 아니지만 정량적 모집단 특성을 추정하는 것은 합법적입니다.

답변:


15

이 질문은 통계가 무엇인지, 그리고 좋은 통계 분석을 수행하는 방법의 핵심입니다. 그것은 많은 문제들, 일부 용어들과 다른 이론들을 제기합니다. 그것들을 명확히하기 위해, 질문의 암묵적 맥락을 주목하면서 시작하여 거기서부터 "매개 변수", "속성"및 "추정자"라는 핵심 용어를 정의 해 봅시다. 질문의 여러 부분은 토론에서 나올 때 답변됩니다. 마지막 결론 섹션에는 주요 아이디어가 요약되어 있습니다.

주 공간

" 비례하는 PDF를 사용한 정규 분포와 같이"분포 "의 일반적인 통계적 사용 은 실제로 (심각한) 영어 남용은 분명히 하나의 분포가 아니기 때문에 및 기호로 매개 변수화 된 전체 분포 계열입니다 . 이에 대한 표준 표기는 "상태 공간"입니다 하는 세트μσΩΩexp(12(xμ)/σ)2)dxμσΩ분포. (나는 박람회를 위해 여기에서 조금 단순화하고 있으며 가능한 한 엄격하게 유지하면서 진행하면서 계속 단순화 할 것입니다.) 그 역할은 통계 절차의 가능한 목표를 묘사하는 것입니다. 의 하나 이상의 요소를 골라냅니다 .Ω

때때로 상태 공간은 과 같이 명시 적으로 매개 변수화됩니다 . 이 설명에는 상단 평면 의 튜플 세트 와 데이터 모델링에 사용할 분포 세트 사이에 일대일 대응 관계 가 있습니다. 이러한 매개 변수화의 한 가지 가치는 이제 우리는 순서화 된 실수 쌍으로 분포를 구체적으로 참조 할 수 있다는 것 입니다.{ ( μ , σ ) } ΩΩ={N(μ,σ2)|μR,σ>0}{(μ,σ)}Ω

다른 경우에는 상태 공간이 명시 적으로 매개 변수화되지 않습니다. 모든 단봉 연속 분포 세트를 예로들 수 있습니다. 아래에서는 그러한 경우에 적절한 매개 변수화가 가능한지 여부에 대한 질문을 다룰 것입니다.

파라미터 화

일반적으로 의 매개 변수화 는 ( 유한) 및 서브 세트와 의 대응 (수학적 함수 )입니다 . 즉, 순서화 된 튜플 세트를 사용 하여 분포에 레이블을 지정합니다. 그러나 그것은 단지 서신 일뿐만 아니라 "잘 행동해야"합니다. 이를 이해하려면 PDF에 대한 기대치가 한정된 모든 연속 배포 세트를 고려하십시오. 이것은이 세트를 매개 변수화하려는 "자연적인"시도가 (모든 직교의 확장을 사용하여) 계산 가능한 실수의 시퀀스를 포함한다는 점에서 "비모수 적"으로 널리 간주 될 것이다. 그럼에도 불구하고이 세트에는 카디널리티가 있으므로R d d Ω d 1 RΩRddΩd1실수의 카디널리티 인 은 이러한 분포와 사이에 일대일로 대응해야합니다 . 역설적 으로 이것은 단일 실제 매개 변수 를 사용하여 매개 변수가있는 상태 공간으로 만드는 것처럼 보입니다 !R

역설은 하나의 실수가 분포와 "좋은"관계를 누릴 수 없다는 점에 의해 해결됩니다. 우리가 그 수의 값을 변경할 때, 어떤 경우에는 급격한 방식으로 변화해야합니다. 우리는 매개 변수의 가까운 값에 해당 하는 분포가 서로 "가까워 야" 하므로 이러한 "병리학 적"매개 변수를 배제 합니다. "close"에 대한 적절한 정의를 논의하는 것은 우리에게 너무 멀어 질 것이지만,이 설명이 단지 특정 분포를 명명하는 것보다 매개 변수가되는 것보다 훨씬 더 많은 것을 보여주기에 충분하기를 바랍니다.

분포의 속성

반복 적용을 통해 우리는 분포의 "속성"을 기대, 분산 등과 같이 우리의 작업에 자주 나타나는 일부 이해하기 쉬운 양으로 생각하는 데 익숙해졌습니다. "속성" 의 가능한 정의 로서 이것에 대한 문제 는 너무 모호하고 충분히 일반적이지 않다는 것입니다. (여기서는 18 세기 중반에 수학이 있었는데, 여기서 "함수"는 객체에 적용되는 유한 과정으로 생각되었다.) 대신, 항상 작동하는 "속성"에 대한 현명한 정의에 대해서는 속성을 다음과 같이 생각하는 것이다. 모든 배포에 고유하게 할당 된 숫자Ω Ω Ω t 1 ΩΩ. 여기에는 계산할 수없는 것들을 포함하여 평균, 분산, 모든 순간, 모든 순간의 대수 조합, 임의의 분위수 등이 포함됩니다. 그러나 의 일부 요소에는 의미 가 없는 것을 포함 하지 않습니다 . 예를 들어, 가 모든 Student t 분포로 구성된 경우 평균은 유효한 속성 이 아닙니다 ( 에는 평균이 없기 때문 ). 이것은 우리의 아이디어가 실제로 무엇을 구성 하는지에 얼마나 의존하는지 다시 한 번 감동 시킵니다.ΩΩΩt1Ω

속성이 항상 매개 변수는 아닙니다

속성은 매개 변수로 사용되지 않는 복잡한 함수일 수 있습니다. "정규 분포"의 경우를 고려하십시오. 가장 가까운 정수로 반올림 할 때 실제 분포의 평균이 짝수인지 알고 싶을 수도 있습니다. 그것은 속성입니다. 그러나 매개 변수로 사용되지는 않습니다.

매개 변수는 반드시 속성 일 필요는 없습니다

모수와 분포가 일대일로 대응하는 경우 분명히 모든 모수와 해당 문제에 대한 모수의 기능은 정의에 따른 특성입니다. 그러나 모수와 분포간에 일대일 대응이 필요하지 않습니다. 때로는 몇 가지 분포가 두 개 이상의 서로 다른 모수의 값으로 설명되어야합니다. 예를 들어, 구의 점에 대한 위치 매개 변수는 자연스럽게 위도와 경도를 사용합니다. 대응 주어진 위도와의 두 기둥,를 제외하고 - 그건 괜찮아요 어떤 유효한 경도. 위치(구상의 점)은 실제로 속성이지만 경도는 속성 일 필요는 없습니다. 예를 들어 극점의 경도를 0으로 선언하는 등 다양한 닷지가 있지만이 문제는 속성 (배포와 고유하게 관련됨)과 매개 변수 (라벨링 방법 ) 사이의 중요한 개념적 차이를 강조합니다. 배포 및 고유하지 않을 수 있음).

통계 절차

추정의 대상은이라고 estimand . 단지 속성입니다. 통계학은 하지 그녀의 클라이언트의 지방입니다 다음 estimand를 자유롭게 선택할. 어떤 사람이 모집단 표본을 가지고 와서 모집단의 99 번째 백분위 수를 추정하도록 요청하면 대신 평균의 추정값을 제공하지 않아도됩니다! 통계 학자로서 귀하의 직무는 귀하가받은 추정치를 추정 하기위한 좋은 절차 를 찾는 것입니다. (때로는 클라이언트가 과학적 목표에 대한 잘못된 판단을 선택했다고 설득하는 것이지만, 다른 문제입니다.)

정의에 따르면 프로시 저는 데이터에서 숫자를 얻는 방법입니다. 절차는 일반적으로 "모두 추가하고 개수로 나누기"와 같이 데이터에 적용 할 공식으로 제공됩니다. 말 그대로 모든 절차는 주어진 견적의 "추정자"로 발음 될 수 있습니다. 예를 들어, 표본 평균 (데이터에 적용되는 공식)이 모집단 분산 ( 고객이 실제로 변동이있는 집단 만 포함하도록 가능한 모집단 집합 를 제한 한다고 가정하면 모집단의 속성)을 추정한다고 선언 할 수 있습니다. .Ω

견적 자

견적자는 추정치와 명백한 관련이 없어도됩니다. 예를 들어 표본 평균과 모집단 분산이 연관되어 있습니까? 그럼에도 불구하고 표본 평균은 실제로 특정Ω (모든 Poisson 분포 세트)에 대한 모집단 분산의 적절한 추정량입니다 . 여기에는 추정자를 이해하는 데 중요한 열쇠가 있습니다. 자질은 가능한 상태 집합 에 따라 다릅니다 . 그러나 그것은 그것의 일부일뿐입니다.Ω

유능한 통계학자는 권장하는 절차가 실제로 얼마나 잘 수행되는지 알고 싶어 할 것입니다. 프로 시저 " "를 호출하고 estimand를 라고합시다 . 실제로 어떤 분포가 실제 분포인지 알지 못하면 가능한 모든 분포 대한 절차의 성능 고려합니다 . 이러한 감안할 때 , 그리고 가능한 결과를 제공 (데이터이며, 집합), 그녀는 비교합니다 (무엇을 그녀의 프로 시저 추정)에 (대한 estimand의 값 ). 이 두 사람이 얼마나 가깝거나 멀리 떨어져 있는지 알려주는 것은 고객의 책임입니다.θ F Ω F s t ( s ) θ ( F ) F t ( s ) θ ( F ) F Ωtθ FΩFst(s)θ(F)F 그녀는 그 관조 수 (이는 종종.는 "손실"기능을 수행한다) 의 기대 사이의 거리 과 . 이것은 그녀의 절차 의 위험 입니다. 의존하기 때문에 위험은 정의 된 함수 입니다.t(s)θ(F)FΩ

(좋은) 통계학자는 위험을 비교하는 절차를 권장합니다. 예를 들어, 모든 에 대해 절차 의 위험이 의 위험보다 작거나 같다고 가정하십시오 . 그러면 를 사용할 이유가 없습니다 . "불가피하다". 그렇지 않으면 "허용"입니다.t 1 t tFΩt1tt

"Bayesian"통계학자는 가능한 상태 (보통 고객이 제공 한)의 "선행"분포를 평균하여 위험을 항상 비교합니다. 다른 방법으로 베이지안을 피하십시오.)

결론

우리는 어떤 것을 말할 권리가 에 대한 인정이다 입니다 추정 의 . θ θ tθθ 우리는 실제적인 목적을 위해 (인정 절차는 찾기 힘들 수 있기 때문에), 굴곡이 말을해야 어떤 (비교되는 경우에 수용 가능한 작은 위험이 ) 실행 가능한 절차 사이의 추정이다 . "허용 가능"및 "실행 가능"은 물론 고객에 의해 결정됩니다. "허용 가능"은 위험을 나타내며 "실행 가능"은 절차를 수행하는 데 드는 비용 (최종 지불)을 반영합니다.t θ θtθθ

이 간결한 정의의 기초는 방금 논의 된 모든 아이디어입니다. 이해하기 위해서는 특정 ( 문제, 프로세스 또는 연구 대상 인구 의 모델 ), 명확한 견적 (고객이 제공 한)을 명심해야합니다. 특정 손실 함수 ( 를 추정자와 연결 하고 고객이 제공함), 위험에 대한 아이디어 (통계 전문가가 계산), 위험 기능을 비교하기위한 절차 (고객과 상담하는 통계학 자의 책임) 정의에 명시 적으로 언급되어 있지 않더라도 실제로 수행 할 수있는 절차 ( "실제 성"문제)에 대한 감각.tΩt


2
@Nick Cox는 그의 대답에서 "내 해석으로는" 모델 과 지정한 손실 함수가 다소 부정확하거나 부적절하다는 것을 알 때 어떻게해야합니까? "라는 훌륭한 요점을 제시합니다. 그것에 대한 대답은 우리를 다른 방향으로 이끌 것입니다. 여기서 내가 말하고 싶은 것은 Tukey가 반응했던 고전적인 프레임 워크 인 내가 설정 한 프레임 워크가 데이터 분석의 광범위한 문제에 대해 생각할 수있는 좋은 근거를 제공한다는 것입니다. 최소한 "추정자"와 같은 표준 용어로 들어가는 암시 적 가정을 명확히합니다. Ω
whuber

11

정의에 대한 많은 질문과 마찬가지로, 답변은 기본 원칙과 용어가 실제로 사용되는 방식에 대해주의를 기울여야합니다. 중요한 것은 공동체마다 다릅니다.

한 가지 일반적인 원칙은 통계량은 표본의 속성이고 알려진 상수이며 매개 변수는 모집단의 해당 속성이므로 알 수없는 상수라는 것입니다. "대응"이라는 단어는 여기서 매우 탄력적 인 것으로 이해해야합니다. 덧붙여서, 정확히이 구별과이 용어는 RA Fisher가 소개 한 1 세기도되지 않았습니다.

그러나

  1. 표본과 모집단 설정이 우리 자신의 모든 문제를 특징 짓는 것은 아닙니다. 시계열은 아이디어가 기본 생성 프로세스가 아닌 주요 클래스 중 하나이며, 그와 비슷한 것은 더 깊고 일반적인 아이디어입니다.

  2. 파라미터가 변경되는 설정이 있습니다. 다시, 시계열 분석은 예를 제공합니다.

  3. 여기서 요점으로, 우리는 실제로 모집단 또는 프로세스의 모든 속성을 매개 변수로 생각하지 않습니다. 일부 절차에서 정규 분포 모형을 가정하면 최소값과 최대 값은 모수가 아닙니다. 실제로 모델에 따르면 최소값과 최대 값은 임의의 큰 음수와 양수이며 어떤 식 으로든 걱정할 필요가 없습니다.

Wikipedia가 여기서 올바른 방향을 가리키고 있다고 말하면 매개 변수가 우리가 추정하는 것이라고 말하면 연습과 원칙이 모두 존중됩니다 .

이것은 의문을 일으킨 다른 질문에도 도움이됩니다. 예를 들어, 25 % 트림 평균을 계산하면 무엇을 추정할까요? 합리적인 답은 모집단의 해당 속성이며, 실제로는 추정 방법에 의해 정의됩니다. 한 가지 용어는 견적자가 견적에 관계없이 견적서를 가지고 있다는 것입니다. 데이터를 분석하고 추론으로 간주 할 때 암시하는 것을 통해 생각하는 좋은 레시피를 생각하는 것처럼 "배급 모드"라는 속성에 대한 플라톤의 아이디어로 시작하고 합리적인 방법을 생각하는 것부터 시작합니다.

응용 수학이나 과학에서 자주 사용되는 것처럼 매개 변수에는 두 가지 측면이 있습니다. 우리는 종종 그것을 우리가 발견하고있는 실제의 것으로 생각하지만, 그것이 프로세스의 모델에 의해 정의 된 것이기 때문에 모델의 맥락 밖에서는 의미가 없다는 것도 사실입니다.

두 가지 다른 점 :

  1. 많은 과학자들은 통계학자가 변수를 사용하는 방식으로 "매개 변수"라는 단어를 사용합니다. 나는 통계적인 것뿐만 아니라 과학자 페르소나를 가지고 있으며, 그것은 불행한 것이라고 말할 것입니다. 변수와 속성이 더 나은 단어입니다.

  2. 넓은 범위의 영어 사용에서 매개 변수가 한계 또는 한계를 의미하는 것으로 생각되는 것은 일반적입니다. 이는 "매개 변수"와 "주변"사이의 일부 원래 혼동에서 비롯 될 수 있습니다.

예상 관점에 대한 메모

고전적인 입장은 매개 변수를 미리 식별 한 다음 추정 방법을 결정하는 것이며, 이는 대부분의 관행으로 남아 있지만 프로세스 반전은 어리석지 않으며 일부 문제에 도움이 될 수 있습니다. 나는 이것을 estimand 관점이라고 부릅니다. 그것은 적어도 50 년 동안 문헌에있었습니다. Tukey (1962, p.60)는

"우리는 견적을 시작하고 합리적인 견적을 찾는 것, 견적을 견적으로 생각하는 것이 합리적인 것을 발견하는 데 더 많은주의를 기울여야합니다."

유사한 관점은 Bickel and Lehmann (1975)에 의해 공식적으로 상당히 상세하고 깊이 정교 해졌으며 Mosteller and Tukey (1977, pp.32-34)에 의해 비공식적으로 비명 질적으로 설명되었다.

기본 버전도 있습니다. (예를 들어) 표본 중앙값 또는 기하 평균을 사용하여 해당 모집단 모수를 추정하는 것은 기본 분포가 대칭인지 여부에 관계없이 의미가 있으며, 동일한 영업권을 (예를 들어) 표본 다듬은 수단으로 확장 할 수 있습니다. .

Bickel, PJ 및 EL Lehmann. 1975. 비모수 적 모델에 대한 설명 통계. II. 위치 . 통계의 연대기 3 : 1045-1069.

Mosteller, F. 및 JW Tukey. 1977. 데이터 분석 및 회귀. 독서, MA : 애디슨-웨슬리.

Tukey, JW 1962. 데이터 분석의 미래 . 수학 통계 연대기 33 : 1-67.


이것의 대부분은 표준 통계 문헌, 특히 매개 변수 정의와 상충됩니다. 의 프로세스를 혼동하는 표시 추정치를 계산하는 방법을 발견 하고 추정 할 작업을 식별합니다. 후자를 선택하는 것은 과학 자나 연구자가 결정해야 할 문제입니다. 그 후, 통계학자는 추정치를 추정하기위한 모든 가능한 절차 중에서 바람직한 특성을 갖도록 전자를 선택한다. 기술적 인 문제도 있습니다. 매개 변수 가 임의의 예상치보다 더 제한적 이라고 말하면 충분합니다 .
whuber

이 문제를 해결하기 위해 답변을 확장하겠습니다.
닉 콕스

1
Tukey에 동의하지만이 스레드에 대한 나의 대답에서 그가 도전하는 "정립 된"통계 학자 중 하나라고 생각할 수도 있습니다. 문제는 당신이 문맥에서 그의 인용을 취했다는 것입니다. Tukey는 "절차 적으로 개발 된 가설이 유지되지 않는 경우"절차의 속성을 평가하는 방법에 대한 문제를 구체적으로 다루고있다. 이것은 매개 변수, 추정기 및 추정치와 같은 것의 정의 를 결코 변경하지 않습니다 . 특히 매개 변수는 여전히 "무엇을 추정하든" 이 아닙니다 .
whuber

3
여기에 생각할 음식이 많습니다. 빠른 답변으로 : 저의 대답은 우리가 어떤 일이있는 리버티 홀에 있다는 것을 의미하지는 않았습니다. 내가 환영하는 Tukey 인용문의 맥락은 모든 모델이 데이터와 정확히 일치하지 않는 근사치 인 경우 관례 가설이 적용되지 않는 것이 일반적 이라는 것입니다 . 물지 않는 한,이 절은 다른 관점의 가치를 강조합니다. 일반적으로, 나는보다 추상적이고 수학적으로 정제 된 공식적인 정의를 만들려고 노력하지도 않고 자격도 없습니다.
닉 콕스

6


pdf=12πσ2e12(xiμ)2σ2
12π3.1415926e2.718281828Xxi가치도. 즉, 위의 방정식이 내가 작업 해야하는 것임을 알면 의 값을 배우면σ 2μσ2 알아야 할 모든 것을 알고 있습니다. 이러한 값은 매개 변수 입니다. 특히 분포의 동작을 제어하는 알려지지 않은 상수 입니다. 따라서 예를 들어 해당하는 값 을 알고 싶다면 및 알고 나면 그 분포 (또는 그 분포에 대한 다른 것)를 확인할 수 있습니다 (그러나 다른 방법은 아닙니다). 위의 방정식 권한 X 25 th % μ σ 2 μ σ 2X25th%μσ2μ그리고 다른 값을 가지지 않는 방식으로 . σ2

마찬가지로 OLS 다중 회귀 모델로 작업하는 경우 데이터 생성 프로세스는 다음과 같이 가정합니다. 그런 다음 , , 의 값을 배우면 (실제로 추정 ) 모든 것이 있다는 것을 알고 있습니다 알고 있습니다. 다른 건, 같은 같은 의 조건부 분포 , 나는 내 지식을 바탕으로 계산할 수있다

Y=β0+β1X1+β2X2+εwhere εN(0,σ2)
β0β1β2σ225th%YX=xiβ0, , 및 입니다. 위의 다중 회귀 모델 은 다른 값이 아닌 방식으로 , , 및 권한을 갖습니다. β1β2σ2β0β1β2σ2

(이 모든 것은 물론 인구 분포 또는 데이터 생성 프로세스의 모델이 정확하다고 가정합니다. 항상 "모두의 모델이 잘못되었지만 일부는 유용합니다" -George Box 라는 것을 명심할 가치가 있습니다.

더 명확하게 질문에 대답하기 위해 다음과 같이 말합니다.

  • 아닙니다. 구식 정량 분석에 "매개 변수"라는 레이블을 붙여서는 안됩니다.
  • 해당 없음
  • "파라미터"로 표시되어야하는 특성은 모델 사양에 따라 다릅니다. 다른 정량적 특성에 대한 특별한 이름은 없지만 속성 이나 특성 또는 결과 등 을 호출하는 것이 좋습니다 .

감사. 그러나 모수 모형에서 도출 할 수 있지만 해당 모형을 나타내는 편리한 매개 변수 세트에는없는 모든 모집단 값을 설명하기 위해 어떤 용어를 사용합니까? 또는 인구 모델을 모르고 특별히 신경 쓰지 않지만 인구 모델의 특정 비표준 측면에 관심이있는 경우가 있습니다.
Jeromy Anglim

일반적으로 적용 가능한 특수 이름이 없지만 특정 값의 이름이 있습니다. 예를 들어, 인구가 잘 연구 된 분포에 충분히 가깝다고 생각하지 않는 경우, 중앙값, 사 분위수, 힌지 점 등으로 특성화를 시도 할 수 있습니다.
gung-Reinstate Monica

3
매개 변수에 대한 미묘한 문제는 오래된 컴퓨터 트릭에 의해 노출됩니다. 및 의 이진 (또는 십진) 표현을 새 이진 (또는 소수) number . 분명히 프로세스는 되돌릴 수 있습니다. 의 첫 번째, 다섯 번째, 아홉 번째, ... 등의 숫자에서 읽을 수 있습니다 . 그러므로 "한 번 당신은 의 가치를 배우고, 당신은 알아야 할 모든 것을 알고 있습니다." 그러나 는 가능한 분포에 레이블을 지정하는 방식으로 인해 유효한 매개 변수 가 아닙니다 . σ θ β 0 θ θ θβ0,β1,β2,σθβ0θθθ
우버

3

이 질문에 대한 몇 가지 훌륭한 답변이 있었으며, 나는 견적 담당자에 대해 상당히 엄격한 토론을 제공하는 흥미로운 참고 문헌을 요약한다고 생각했습니다.

견적 담당자 의 가상 실험실 페이지에서 다음을 정의합니다.

  • "결과 변수의 관찰 가능한 함수" 라는 통계 입니다.
  • "기술적 인 의미에서 매개 변수 는 X 분포의 함수입니다"θ

분포 함수의 개념은 매우 일반적인 아이디어입니다. 따라서 위에 제공된 모든 예는 특정 분포의 함수로 볼 수 있습니다.

  • 최소, 중간, 25 번째 Quantile을 포함한 모든 Quantile은 최대가 분포의 함수일 수 있습니다.
  • 왜도는 분포의 함수입니다. 해당 모집단 분포가 정상이면이 값이 0이되지만 이러한 값의 계산은 중단되지 않습니다.
  • 특정 값보다 큰 상관 수를 계산하는 것은 공분산 행렬의 함수이며, 이는 다변량 분포의 함수입니다.
  • R 제곱은 분포의 함수입니다.

1
내가 좀 더 정교하게 대답 한 한 가지 이유는 "매개 변수"의 정의가 충분하지 않기 때문입니다. 하나의 반례에 대해서는 @ gung 's answer에 대한 내 의견을 참조하십시오 . 직관적으로, 파라미터 화 된 분포 세트는 경계를 갖는 유한 차원의 토폴로지 매니 폴드를 형성한다; 매개 변수는 매니 폴드에 정의 된 연속 기능 이어야합니다 . 이는 추정의 샘플링 분포와 관련되어 있기 때문에 기술 요구 사항 그 이상입니다.
whuber
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.