변동 계수에 대한 직감 및 용도


11

현재 Coursera.org의 운영 관리 소개 과정에 참석하고 있습니다. 코스의 어느 시점에서 교수는 운영 시간의 변화를 다루기 시작했습니다.

그가 사용하는 측정 값 은 표준 편차와 평균의 비율 인 변동 계수입니다 .

V=σμ

이 측정이 왜 사용됩니까? 표준 편차를 사용하는 것 외에 CV를 사용할 경우의 장단점은 무엇입니까 ? 이 측정의 직관은 무엇입니까?

답변:


8

데이터의 분산 또는 변동성에 대한 상대적인 척도로 생각합니다. "표준 편차는 2.4"라는 문장을 생각하면 실제로 평균에 관계없이 아무것도 알려주지 않습니다 (따라서 측정 단위라고 생각합니다). 평균이 104와 같으면 2.4의 표준 편차는 평균이 25,452 인 경우와 표준 편차가 2.4 인 경우와는 상당히 다른 스프레드 그림을 나타냅니다.

데이터를 정규화 (평균을 빼고 표준 편차로 나눔)하는 것과 같은 이유는 비교를 돕기 위해 서로 다른 단위로 표현 된 데이터를 비교 가능하거나 동일한 기반에 배치하는 것이므로이 변동성 측정도 정규화됩니다.


2

변동 계수는 데이터 세트의 변동 (예 : 시계열)의 비율을 비례 (따라서 백분율로 표시 할 수 있음)라는 점에서 정규화되거나 상대적으로 상대적으로 측정됩니다. 직관적으로, 평균이 예상 값이면 변동 계수는 평균에 대한 측정의 예상 변동입니다.

이 방법은 여러 이기종 데이터 세트 또는 동일한 데이터 세트에서 측정 한 여러 측정에서 측정을 비교할 때 유용합니다. 두 데이터 세트 간의 변동 계수 또는 두 세트의 측정 세트에 대해 계산 된 데이터는 각각의 데이터가 매우 다른 스케일, 샘플링 속도 또는 해상도로 측정됩니다. 대조적으로 표준 편차는 측정 / 샘플에 따라 달라집니다. 즉, 상대적인 변동 측정이 아니라 절대입니다.


이 부분을 더 자세히 설명 할 수 있습니까? "변동 계수는 간격에 따른 측정의 예상 변동성"입니까?
B_Miner

@B_Miner 신호 처리 의미에서 간격을 의미했으며 위에서 편집했습니다. 표준 편차는 사실상 평균 또는 예상 변동입니다.
BGreene

-2

내 이해에 따르면 평균은 위치 매개 변수입니다. sd / 평균은 변동 계수로 간주해서는 안됩니다. 왜? 간단한 주장은 통계적 거리가 유클리드 거리와 다르다는 것입니다. 통계 거리를 측정하기 위해 sd를 사용합니다. 하나의 변수에 대한 원유 거리. 50이 평균이고 2가 sd라고 가정하면 4 %는 cv가됩니다. 이제 평균은 5이고 sd는 2 cv = 40 %입니다. 통계적 변동 항은 원점과 무관합니다. sd 자체는 변화의 좋은 척도입니다. 물리학에서 하나의 문제에서 두 개의 단위 시스템을 비교하지 않는 규칙을 기억하십시오.


2
여기서 일관된 주장을하기는 어렵다. sd / mean을 변동 계수로 간주해서는 안됩니까? 그것이 정의 된 방법입니다. 그것이 유용하지 않다는 것을 의미한다면 그 이유를 설명하십시오. (이름이 잘못되었다고 생각하면 다른 이야기입니다.) 통계 거리가 유클리드 거리와 다른가요? 그것은 단지 단언 일 뿐이며 통계적 거리가 무엇을 의미하는지 아는 데 달려 있습니다. 통계에 많은 종류의 거리가 표시되면 어설 션이 모호합니다. (나는 공감하지는 않았지만 이것을 다시 쓰라고 촉구한다. 영어로 된 더 나은 명령으로 친구와 함께 일해야 할 수도있다.)
Nick Cox
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.