스티븐스 '규모의 유형학은 반드시 변수의 몇 가지 고유 한 특성이 아니며, 심지어 데이터 자체하지만, 우리가 정보를 처리하는 방법에 - 우리가 그것을 사용하고 무엇을 할 의미 .
어떤 상황에서, 우리가 무엇을하고 있는지에 따라 정확히 같은 값을 비율, 간격, 서수 또는 명목으로 간주 할 수 있습니다. 그것은 하나의 분석에서 다음 분석으로 변경 될 수있는 값을주는 의미에 달려 있습니다. 스티븐스의 유형학에는 가치가 있지만 그것에 대해 지나치게 처방 할 필요는 없습니다.
스케일이 의미라는 중요성의 중요성에 관한이 문제는 적어도 같은 주 (1953)로 거슬러 올라갑니다.
이 시점은 Velleman과 Wilkinson (1993)에 의해 더욱 명확 해 졌는데, 이들은 티켓 중 하나에 경품이 수여되는 리셉션에 입장 할 때 연속 번호가 매겨진 티켓을받는 사람들의 예를 제공합니다. 티켓의 숫자를 사용하는 것에 따라 4 가지 스케일 모두에 대한 해석이 있습니다.
예를 들어 '내가 이겼 니?' 숫자를 명목으로 취급하는 질문인데, '승차권을 얻기에는 너무 일찍 도착 했습니까?' 그것을 서수로 취급하는 질문입니다. 반면에, 방에있는 사람들의 수를 추정하기 위해 5 개의 무작위 티켓 번호를 사용하는 (그리고 이것은 종이에 없다고 생각합니다.) 위로 상을 받으면 총 출석을 추정 할 수있는 5 개의 난수가 있습니다.
"좋은 데이터 분석은 데이터 유형을 가정하지 않습니다", "Stevens 카테고리는 데이터의 고정 된 속성을 설명하지 않습니다", "Stevens 카테고리는 데이터 스케일을 설명하기에 불충분합니다"및 "Stevens의 기준에 따라 통계 절차를 분류 할 수 없음"(실제로) 각 진술은 섹션 제목입니다).
Tukey는 비판을 여러 곳에서 제공하기도했다 (예 : Mosteller의 5 장과 Tu1977의 1977 년 책 데이터 분석 및 회귀 ). Mosteller와 Tukey는
이름 , 등급 (주문 된 레이블), 순위
(1에서 시작하여 가장 크거나 가장 작은 것을 나타낼 수 있음), 계산 된 분수 (0과 1로 제한되며 백분율 포함), 개수 (음수가 아닌)를 제공했습니다. 정수), 금액 (음수가 아닌 실수), 잔액 (무한, 양수 또는 음수).
저의 작업에서, 레벨 과 관련된 변수 (때때로 '주식'변수라고도 함)와 흐름 사이의 큰 차이를 인식하지 못하는 사람들로 인해 분석에 심각한 문제가 발생하는 상황을 보았습니다. 이러한 유형의 간단한 예는 차이점입니다 저장 탱크에 실제로있는 물의 양과 순서대로 흐르는 물의 양에 적합한 분석 종류. 이것들은 (일부 경우) Mosteller 및 Tukey ' amounts '유형 의 하위 범주 (그리고 동일한 경우 Stevens의 체계에서 비율 변수 모두) 일 것이므로 유형학 문제는 매우 미묘하지만 여전히 적절한 분석에 중대한 영향을 미칠 수 있습니다.
PFVelleman and L.Wilkinson (1993),
"호칭, 서수, 간격 및 비율 유형이 잘못되었습니다 "
American Statistician , vol. 47 1 호 pp. 65-72
(작동중인 버전은 여기 2 차 저자 웹 페이지에서 제공되는 것 같습니다 )
Lord, F. (1953),
"축구 숫자의 통계적 처리",
American Psychologist , 8 , pp.750-751
(본 논문의 연도는 내가 링크 한 Velleman 및 Wilkinson 논문의 버전에 대한 참조에서 잘못 제공되었지만 논문 본문에서 올바르게 언급 됨)