세타는 무엇을 의미합니까?


16

나는 통계에 초보자이며 이것을 찾았 습니다 .

통계에서 소문자 그리스 문자 'theta'인 θ는 일반적인 확률 분포의 (벡터로 구성된) 모수에 대한 일반적인 이름입니다. 일반적인 문제는 세타의 값을 찾는 것입니다. 이런 식으로 매개 변수 이름을 지정하는 것은 의미가 없습니다. 우리는 그것을 다른 것으로 부를 수도 있습니다. 실제로 많은 배포판에는 일반적으로 다른 이름이 지정된 매개 변수가 있습니다. 예를 들어, 정규 분포 μ (읽기 : 'mu')와 편차 σ ( 'sigma')의 평균과 편차의 이름을 지정하는 것이 일반적으로 사용됩니다.

그러나 나는 그것이 일반 영어로 그것이 무엇을 의미하는지 아직도 모른다.


10
는 수학적 기호 일 뿐이며 상황에 따라 다른 것을 의미합니다. 때때로 θ 는 추정 할 매개 변수를 나타내는 데 사용되지만 " θ 란 무엇입니까?"라는질문에 대한 실제 답변은 없습니다. "A는 무엇입니까?"라고 묻는 것과 같습니다. 그것은 말할 때 귀하의 링크도이 암시"이런 식으로 매개 변수를 이름에 어떤 의미가없는 것을 알 수있다. 우리뿐만 아니라 다른 어떤을 호출 할 수 있습니다." . θθθ
Macro

통계 매개 변수 (이 '파라미터'와 관련된 수량 분포를 정의)의 이름을 특수 문자 (영문 이외의 문자)로 지정하는 방법입니다.
Stat-R

4
우리 대부분은이 인용문을 실제로 매우 평범한 영어로 받아 들일 것이지만, 진전을 이루기 위해서는 영어를 읽는 방법에 관한 질문이 아니라는 점을 받아 들여야합니다 . 그렇다면 무엇에 관한 것일까 요? 나는 인용문에 기술 용어 를 설명 해달라고 요청한다 . 우리가 너무 친숙한 용어 는 통계적으로 시작되지 않은 것이 더 이상 이상하지 않다는 것을 알 수있다. 이것은 분포모수 의 의미 ( 적합한 곡선이나 다른 결정 론적 모형이 아닌 분포) 의 의미를 다룰 것을 요구합니다 .
whuber

답변:


31

관습은 아니지만 는 분포의 모수 집합을 나타냅니다.θ

그것은 평범한 영어를위한 것이 었습니다. 대신 예제를 보여 드리겠습니다.

예 1. 구식 압핀 (큰 원형 바닥이있는 것)의 던지기를 연구하려고합니다. 포인트가 떨어질 확률이 라고하는 알 수없는 값이라고 가정합니다 . 임의의 변수 X를 호출 하고 압정이 포인트 아래로 떨어지면 X = 1 이고 포인트가 떨어지면 X = 0 이라고 말할 수 있습니다. 당신은 모델을 쓸 것입니다θXX=1X=0

P(X=1)=θP(X=0)=1θ,

θ 추정에 관심이있을 것입니다θ (여기서, 압정이 떨어지는 확률은 아래로 떨어집니다).

예 2. 방사성 원자의 붕괴를 연구하려고합니다. 문헌에 따르면 방사능의 양이 기하 급수적으로 감소한다는 것을 알고 있으므로 지수 분포를 사용하여 분해 시간을 모형화하기로 결정합니다. 만약 붕괴에 시간이 모델은t

f(t)=θeθt.

여기서 에 대한 확률 밀도가되는 것을 의미 원자 시간 간격에서 붕 해제 확률 ( t , t + D t가 )F ( t ) D t . 다시, 당신은 θ (여기서는 붕괴 속도) 를 추정하는데 관심이있을 것 입니다.f(t)(t,t+dt)f(t)dtθ

예 3. 계량 기기의 정밀도를 연구하려고합니다. 문헌에 따르면 측정이 가우시안이라는 것을 알고 있으므로 표준 1kg 물체의 무게를 다음과 같이 모델링하기로 결정합니다.

f(x)=1σ2πexp{(xμ2σ)2}.

Here x is the measure given by the scale, f(x) is the density of probability, and the parameters are μ and σ, so θ=(μ,σ). The paramter μ is the target weight (the scale is biased if μ1), and σ is the standard deviation of the measure every time you weigh the object. Again, you will be interested in estimating θ (here, the bias and the imprecision of the scale).


1
+1 FWIW, I recently posted a worked example along the same lines at stats.stackexchange.com/a/34894. Although it would be misleading to construe it as "plain English"--it does not shy from using technical terms--I made an effort to explain as clearly and briefly as possible what is going on, what assumptions are made, and how one works with a parameterized family of distributions to produce an estimate based on data. For some, this might be an informative adjunct to your answer here.
whuber

1
Great answer! I am confused when you state the scale is biased if mu != 1, though. In fact, upon "normalizing", the standard normal distribution becomes x ~ N(0, 1). Or, in English, the mu = 0 and the variance = 1. See e.g., en.wikipedia.org/wiki/…
Mike Williamson

I just mean that the instrument has a bias if it indicates something else than 1 kg when it measures a 1 kg object. Perhaps the word "scale" is confusing. Here it just designates the instrument.
gui11aume

3

What θ refers to depends on what model you are working with. For example, in ordinary least squares regression, you model a dependent variable (usually called Y) as a linear combination of one or more independent variables (usually called X), getting something like

Yi=b0+b1x1+b2x2+...+bpxp

where p is the number of independent variables. The parameters to be estimated here are the βs and θ is a name for all the βs. But θ is more general can apply to any parameters we want to estimate.


3
Peter, although you didn't say this exactly, I'm afraid this answer may give a novice the incorrect impression that the symbol θ will always refer to a parameter vector and, conversely, that this is the only way to refer to a parameter value. As my comment above indicates, I think the answer is nothing more than "θ is a mathematical symbol", making it not really a statistical question.
Macro

1
@Macro I think, in this context, it's clear that this is the meaning of θ that Kamilski wanted. Sure, any symbol can refer to anything. But in this paragraph, Macro means you, and not a course in Economics or a part of SAS or whatnot.
Peter Flom - Reinstate Monica

1
ok well I don't think that analogy is really apt but I will take it as an attempt at hyperbole. In any case, I'm really referring to something very basic which is that mathematical novices often mistake notation as something inherently meaningful and as something other than what it is - simply a label. My point was that this answer (I think unintentionally) does nothing to dispel that idea. As you know, θ can refer to other things a statistician may encounter. For example, angles are often denoted by θ.
Macro

4
This explanation, although it is clear and technically correct, does not explicitly involve any distributions whatsoever, and thus appears not to be relevant to the quotation in the question.
whuber

1

In plain English:

Statistical distribution is a mathematical function f that tells you what is the probability of different values of your random variable X that has the distribution f, i.e. f(x) outputs a probability of x. There are different such a functions, but for now let consider f as some kind of "general" function.

However, for f to be universal, that is, one that is possible to apply to different data (that share similar properties), it needs parameters that change its shape so that it fits different data. A simple example of such a parameter is μ in normal distribution that tells where is the center (mean) of this distribution and so it can describe random variables with different mean values. Normal distribution has another parameter σ and other distributions also have at least one such a parameters. The parameters are often called θ, where for normal distribution θ is a shorthand for both μ and σ (i.e. is a vector of the two values).

Why is θ important? Statistical distributions are used to approximate the empirical distributions of data. Say you have dataset of ages of a group of people and on average they are 50 years old and you want to approximate the distribution of their ages using a normal distribution. If normal distribution didn't allow for different values of μ (e.g. had a fixed value of this parameter, say μ=0), then it would be useless for this data. However, since μ is not fixed, normal distribution could use different values of μ, with μ=50 being one of them. This is a simple example, but there are more complicated cases where the values of θ parameters are not so clear and so you have to use statistical tools for estimating (finding the most appropriate) θ values.

So you could say that statistics is about finding the best θ values given the data (Bayesians would say: given the data and priors).

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.