밀도 플롯을 해석하는 방법


12

밀도 플롯의 높이를 어떻게 해석해야합니까?

여기에 이미지 설명을 입력하십시오

예를 들어 위의 그림에서 피크는 x = 18에서 약 0.07입니다. 값의 약 7 %가 약 18이라고 추론 할 수 있습니까? 그보다 더 구체적으로 설명 할 수 있습니까? 높이가 0.02 인 x = 30에서 두 번째 피크도 있습니다. 값의 약 2 %가 30 정도라는 것을 의미합니까?

편집 :의 확률 분포 값이 1을 초과해도 괜찮습니까?여기서는 전혀 문제가되지 않는> 1의 확률 값에 대해 설명합니다. 또한 Naive Bayes 분류와 관련하여 여기서도 중요하지 않다고 설명합니다. 간단한 언어로 그러한 밀도 곡선에서 도출 할 수있는 수치 적 추론을 갖고 싶습니다. 곡선 아래 면적의 역할에 대해 논의하지만 제 질문은 구체적으로 곡선에 존재하는 특정 x 및 y 조합과 관련하여 추론 할 수있는 것입니다. 예를 들어이 그래프에서 x = 30과 y = 0.02를 어떻게 연관시킬 수 있습니까? 여기서 30과 0.02 사이의 관계에 관해 어떤 진술을 쓸 수 있습니까? 밀도는 하나의 단위 값에 대한 것이므로 29.5와 30.5 사이에서 2 %의 값이 발생한다고 말할 수 있습니까? 이 경우 다음 그림과 같이 값이 0에서 1까지만 변하는 지 어떻게 해석합니까?

여기에 이미지 설명을 입력하십시오

값의 100 %가 0과 1 사이에서 발생하면 왜 0과 1 밖에 곡선이 있습니까?

여기에 x = 0.1 ~ x = 0.2의 평평한 부분이 있습니다. 여기서 y는 0.8입니다. 직사각형을 형성합니다. x = 0.1과 x = 0.2 사이에서 발생하는 값의 비율을 어떻게 알 수 있습니까?

(PS :이 질문이 흥미롭고 중요하다고 생각되면 찬성하십시오.)



4
중복으로 언급 된 첫 번째 스레드는 제목에 정확한 문구가 있음에도 불구하고 관련이 있습니다. 연속 변수에 대해 계산할 때 확률 밀도는 확률이 아니라는 점이 중요합니다. (더 미묘한 버전은 밀도를 엄격하게 정의하고 밀도를 세어 측정 할 가능성을 포함합니다.)
Nick Cox

@NickCox에 동의하지만 추가 편집을 수행하면 Tim의 밀접한 관련 질문 목록에 높이 (두 번째 질문과 유사)뿐만 아니라 영역 (세 번째 질문과 유사)에 더 많은 초점이 있습니다.
Silverfish

3
이 질문들에서 제기 되지 않은 별도의 문제도 있습니다. 이것이 이것이 전체적으로 개별적으로 그러한 질문들과 중복 된다고 생각 하지 않는 이유입니다. 분포의지지 (또는 관찰 된 값) 대역폭 에 대한 추가 논의 와 커널 밀도 도표의 구성 및 해석 이 필요합니다 . 아마도이 질문은 기존 질문과 중복되지 않는 문제에 대한 편집과 초점을 다시 맞출 때 도움이 될 것입니다.
Silverfish

답변:


6

당신은 여기에 당신의 표현에주의해야합니다. x 가 연속 변수 라고 가정하면 개별 값 의 확률 은 정확히 0입니다. 당신이 그랬던 것처럼 거짓말 값의 확률에 대해, 이야기 의 주위에 당신이 조금 더 정확하게 할 수 있습니다하지만 어떤 시점 것은 괜찮습니다. 확률과 함께 구간을 제공 한 두 번째 진술은 내가 찾고있는 것입니다.

본질적으로 x 와 관련하여 밀도 함수의 적분은 확률 자체에 대해 알려줍니다 (그래서 밀도 라고합니다 ). 분명히 통합 할 간격이 임의로 작을 수 있으므로 임의의 정도에 가까워 질 수 있습니다. 즉, 밀도 함수가 해당 간격에 걸쳐 매우 느리게 변할 때, 사다리꼴 규칙 과 같은 수치 기술에 의해 적분을 근사화 할 수 있습니다 .

요약하자면, 밀도 함수의 높이는 바로 그 높이입니다. 확률에 대해 결론을 내릴 수있는 것은 어떤 형태 나 다른 형태의 통합을 포함해야합니다.


이러한 종류의 플롯에서 곡선 아래 면적이 항상 1.0으로 합산됩니까?
ecologist1234

1
@ ecologist1234 그렇습니다. 이것은 확률 밀도 분포이므로 에서 ( "최악의") 까지의 적분은 1.0이됩니다. 이는 모든 데이터가 100 % 확률로 해당 간격을 따라 어딘가에 있음을 의미합니다.
Fato39
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.