서수 데이터에 사용할 기본 통계는 무엇입니까?


67

좀이 서수 데이터 설문 조사 질문에서 얻은합니다. 제 경우에는 리 커트 스타일 응답입니다 (강하게 동의하지 않음-반대-중립-동의 함-매우 동의 함). 내 데이터에서 그들은 1-5로 코딩됩니다.

나는 의미가 여기에 많은 의미가 있다고 생각하지 않으므로 유용한 기본 요약 통계는 무엇입니까?


2
일반적인 선택은 다음과 같습니다-각 그룹의 중앙값, 모드, 비율 또는 누적 비율
Glen_b

답변:


29

빈도 표는 시작하기에 좋은 장소입니다. 각 레벨에 대한 카운트 및 상대 빈도를 수행 할 수 있습니다. 또한 총 개수 및 결 측값 수가 사용될 수 있습니다.

분할 표를 사용하여 두 변수를 한 번에 비교할 수도 있습니다. 모자이크 플롯을 사용하여 표시 할 수도 있습니다.


32

적용된 관점에서 평균은 종종 리 커트 항목의 중심 경향을 요약하기위한 최선의 선택이라고 주장합니다. 특히 학생 만족도 조사, 시장 조사 척도, 직원 의견 조사, 성격 테스트 항목 및 많은 사회 과학 설문 항목과 같은 맥락을 생각하고 있습니다.

이러한 맥락에서 연구 소비자는 종종 다음과 같은 질문에 대한 답변을 원합니다.

  • 어떤 문장이 다른 문장과 비교하여 다소 일치합니까?
  • 주어진 진술에 어느 그룹이 어느 정도 동의 했습니까?
  • 시간이 지남에 따라 계약서가 올라가거나 내려 갔습니까?

이러한 목적으로 평균에는 몇 가지 이점이 있습니다.

1. 평균은 계산하기 쉽다 :

  • 원시 데이터와 평균 간의 관계를 쉽게 확인할 수 있습니다.
  • 실제로 계산하기 쉽습니다. 따라서 평균을보고 시스템에 쉽게 포함시킬 수 있습니다.
  • 또한 컨텍스트와 설정에서 비교할 수 있습니다.

2. 평균은 비교적 잘 이해되고 직관적입니다.

  • 평균은 리 커트 항목의 중심 경향을보고하는 데 종종 사용됩니다. 따라서 연구 소비자는 평균을 이해하고 (따라서 신뢰하고 그에 따라 행동) 가능성이 높습니다.
  • 일부 연구자들은 4 또는 5에 응답하는 샘플의 비율을보고하는보다 직관적 인 옵션을 선호합니다. 즉, "백분율 합의"에 대한 비교적 직관적 인 해석이 있습니다. 본질적으로 이것은 0, 0, 0, 1, 1코딩 과 함께 평균의 대체 형태입니다 .
  • 또한 시간이 지남에 따라 연구 소비자는 참조 프레임을 구축합니다. 예를 들어, 매년 또는 여러 과목에서 교수 성과를 비교할 때 평균 3.7, 3.9 또는 4.1이 의미하는 미묘한 의미를 구축합니다.

3. 평균은 단일 숫자입니다.

  • "학생이 과목 Y보다 과목 X에 더 만족했다"와 같은 주장을하려는 경우 특히 단일 숫자가 유용합니다.
  • 또한 경험적으로, 하나의 숫자가 실제로 리 커트 항목에서 주요 관심 정보임을 알게되었습니다. 표준 편차는 평균이 중앙 점수에 가까운 정도 (예 : 3.0)와 관련이있는 경향이 있습니다. 물론 경험적으로 이것은 귀하의 상황에 적용되지 않을 수 있습니다. 예를 들어, 유튜브 등급에 별 시스템이있을 때 가장 낮은 등급 또는 가장 높은 등급이 많은 곳을 읽었습니다. 이러한 이유로 카테고리 빈도를 검사하는 것이 중요합니다.

4. 큰 차이가 없습니다

  • 공식적으로 테스트하지는 않았지만 항목이나 참가자 그룹간에 중앙 경향 등급을 비교할 목적으로 또는 시간이 지남에 따라 평균을 생성하기 위해 적절한 스케일링을 선택하면 비슷한 결론을 내릴 수 있다고 가정합니다.

4
좋은 포스트! 다른 문화 / 국가가 이런 종류의 결과에 큰 영향을 줄 수있는 리 커트 척도를 어떻게 사용할 수 있을지에 대한 생각이 있습니까?
Chase

@chase 이것에 대한 연구가 있었지만, 내가 본 이후로 오랜 시간이 지났습니다. 여기에 구글 학자에 예를 들어 검색의 scholar.google.com.au/...은
제로미 Anglim

나는 가장 신뢰할 수로 (즉, 가중 평균 정확한 수) 평균의 사용에 씨 제로미 Anglim의 정당성에 동의 편견 같은 데이터 포인트의 각각에 기여 리 커트 척도의 사용으로 주문 범주 변수의 더 자세한 설명 해석 최종 평균.


28

기본 요약을 위해, 나는보고 빈도 표와 중심 경향에 대한 일부 표시가 적절하다는 데 동의합니다. 추론을 위해, PARE에 실린 최근 기사는 t- vs. MWW- 테스트, 5 점 리 커트 아이템 : t 테스트 대 Mann-Whitney-Wilcoxon에 대해 논의했습니다 .

좀 더 정교하게 치료하려면 정렬 된 범주 형 변수에 대한 Agresti의 검토를 읽는 것이 좋습니다.

Liu, Y and Agresti, A (2005). 정렬 된 범주 형 데이터 분석 : 최근 개발에 대한 개요 및 조사 . Sociedad de Estadística e Investigación Operativa Test , 14 (1), 1-73.

임계치 기반 모델 (예 : 비례 배당률)과 같은 일반적인 통계를 넘어서서 Agresti의 CDA 책 대신 읽을 가치가 있습니다.

아래는 리 커트 항목을 처리하는 세 가지 방법의 사진을 보여줍니다. "빈도"(공칭)보기, "숫자"보기 및 "확률 적"보기 ( 부분 신용 모델 ) : 위에서 아래로 :

대체 텍스트

데이터는 관련 기술 항목 ( "신기술은 기본 과학 연구에 의존하지 않음", 4 점 척도에 대한 "강하게 동의하지 않음"에 대한 "강하게 동의하지 않음")과 관련된 패키지 의 Science데이터에서 가져옵니다.ltm


14

일반적인 관행은 비모수 통계 순위 합평균 순위 를 사용하여 서수 데이터를 설명하는 것입니다.

작동 방식은 다음과 같습니다.

순위 합계

  • 각 그룹의 각 구성원에게 순위를 할당합니다.

  • 예를 들어, 두 개의 반대 축구 팀에서 각 선수의 목표를보고 있다고 가정하면 팀의 각 팀원이 처음부터 끝까지 순위를 매 깁니다 .

  • 그룹당 순위를 추가하여 순위 합계를 계산합니다 .

  • 순위 합계의 크기는 각 그룹의 순위가 얼마나 가까운 지 알려줍니다.

평균 순위

M / R은 R / S보다 복잡한 통계입니다. 비교하는 그룹의 크기가 같지 않기 때문입니다. 따라서 위의 단계 외에도 각 합계를 그룹의 구성원 수로 나눕니다.

이 두 통계가되면 두 그룹 사이의 차이가 통계적으로 유의 경우, 당신은, 예를 들어, 내가 그가로 알려진 믿을 (확인하기 위해 순위 합계를 Z-테스트 할 수 있습니다 윌 콕슨 순위 합 테스트 기능, 즉 상호 교환, Mann-Whitney U 테스트와 동일합니다.

이 통계에 대한 R 함수 (어쨌든 내가 아는 것) :

표준 R 설치에서 wilcox.test

meanranks 에서 크랭크의 패키지


3

추상 바탕으로 이 글은 리 커트 척도 몇 가지 변수를 비교하기위한 도움이 될 수 있습니다. 두 가지 유형의 비모수 적 다중 비교 테스트를 비교합니다. 하나는 순위를 기반으로하고 다른 하나는 Chacko의 테스트를 기반으로합니다. 시뮬레이션이 포함됩니다.


현재, 이것은 거의 @PeterFlom의 주석처럼 보입니다. ACM 디지털 라이브러리는 썩음 링크에 영향을 덜 받기는하지만 기사에 대해 설명하는 것이 도움이 될 것입니다.
gung-복직 모니카

2
안녕하세요 @ gung이 긴 스레드에서 주석을 어디에 둘지 잘 모르겠습니다. 오늘 게시 된 질문이 마감 된 후 여기에 인용을 추가했으며이 기사가 유용 해 보입니다 (다른 곳에서는 보지 못한 문제를 다루고 있음)
Peter Flom

2

저는 보통 Mosaic plot을 사용하고 싶습니다. 관심있는 다른 공변량 (예 : 성, 층화 요인 등)을 통합하여 생성 할 수 있습니다.


2

Jeromy Anglim의 평가에 동의합니다. 리 커트 응답은 추정치입니다. 안정적인 치수를 가진 물리적 물체를 측정하기 위해 완벽하게 신뢰할 수있는 눈금자를 사용하지는 마십시오. 평균은 합리적인 표본 크기를 사용할 때 강력한 척도입니다.

비즈니스 및 제품 R & D에서 평균은 Likert 스케일에 사용되는 가장 일반적인 통계입니다. 리 커트 척도를 사용할 때 나는 보통 연구 문제에 가장 적합한 척도를 선택했습니다. 예를 들어 "선호도"또는 "태도"에 대해 이야기하는 경우 여러 개의 Likert 기반 표시기를 사용할 수 있으며 각 표시기는 약간 다른 통찰력을 제공합니다.

iX


1

"상자 점수"는 특히 의미있는 언어 앵커와 함께 제공되는 경우 서수 데이터를 요약하는 데 사용됩니다. 즉, "동의"또는 "강하게 동의"를 선택한 비율 인 "상위 2 상자"를보고 할 수 있습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.