(역설, 역설, 가장 독창적 인 역설)
이것은 다른 R 기능에서 영감을 얻은 멀티 파트 시리즈의 첫 번째 부분입니다.
작업
데이터 집합을 감안할 때 양의 정수, 난 당신이 계산해야 할 5 수를 요약 의 . 그러나 큰 데이터 세트를 작업 중이므로 코드를 최대한 작게하여 컴퓨터에 저장할 수 있습니다.D
5 개의 숫자 요약은 다음으로 구성됩니다.
- 최소값
- 제 1 사 분위수 (Q1)
- 중앙값 / 제 2 사 분위수 (Q2)
- 3 분위 (Q3)
- 최대 값
사 분위수를 정의하는 방법에는 여러 가지가 있지만 R로 구현 된 방법을 사용합니다.
정의 :
- 최소값 및 최대 값 : 각각 가장 작은 값과 가장 큰 값
- 중앙값 경우, 중간 값 경우, 엔트리 홀수, 두 중 가장 값의 산술 평균을 갖는 항목 짝수있다. 이는 중앙값이 정수가 아닌 값일 수 있음을 의미합니다. 우리는 전에 중앙값 을 계산해야했습니다 .
- 1 사 분위 및 3 사 분위수 : 에 홀수 개의 항목이있는 경우 각 반쪽의 중앙 요소를 포함하여 데이터를 두 개의 반쪽으로 나누고 각 반쪽 의 중앙값을 찾습니다. 하반부의 중앙값은 1 사 분위이고, 상반부의 중앙값은 3 사 분위입니다.
예 :
. 그런 다음 중앙값은 이고 아래쪽 절반은 이고 첫 번째 사 분위수는 이고 위쪽 절반은 이고 세 번째 사 분위수는 입니다.
. 중앙값은 이고 아래쪽 절반은 이고 첫 번째 사 분위수는 이고 위쪽 절반은 이며, 제 3 사 분위수는 입니다.
추가 규칙 :
- 입력 값은 배열 또는 해당 언어의 가장 가까운 항목입니다.
- 배열이 오름차순 또는 내림차순으로 정렬되어 있다고 가정 할 수 있습니다 (그러나 어느 것을 지정하십시오).
- 일관된 순서와 원하는 유연한 형식으로 결과를 반환 / 인쇄 할 수 있지만 답에 순서와 형식을 표시하십시오.
- 기본 제공 기능은 동일
fivenum
하지만 자체 솔루션을 구현하십시오. - 당신은 할 수 없는 정수가됩니다 다섯 개 각 숫자를 가정합니다.
- 설명이 권장됩니다.
- 이것은 code-golf 이므로 각 언어에서 가장 짧은 답변이 이깁니다!
무작위로 생성 된 테스트 사례
1 1 1 1 1 2 2 2 2 2 3 3 4 4 4 4 4 5 5 5 -> 1 1.5 2.5 4 5
1 2 2 2 4 4 5 5 6 7 7 8 9 9 9 9 9 10 10 10 -> 1 4 7 9 10
2 2 2 6 8 10 15 16 21 22 23 24 26 33 35 38 38 45 46 47 48 -> 2 10 23 38 48
1 2 9 -> 1 1.5 2 5.5 9
1 2 3 3 3 4 9 -> 1 2.5 3 3.5 9
1 1 2 5 7 7 8 8 15 16 18 24 24 26 26 27 27 28 28 28 29 29 39 39 40 45 46 48 48 48 48 49 50 52 60 63 72 73 79 85 86 87 88 90 91 93 94 95 95 97 100 -> 1 25 45 76 100
2 2 4 4 6 8 10 11 13 14 14 15 17 21 23 24 26 27 27 28 28 30 31 33 33 34 36 36 38 38 39 40 41 42 42 43 45 45 47 47 47 47 47 48 48 48 50 51 53 53 55 56 56 56 57 57 58 62 62 63 64 64 65 65 66 67 67 67 68 69 69 71 71 71 74 79 80 81 81 81 82 82 83 83 86 86 86 87 89 94 94 94 95 95 97 98 99 100 100 100 -> 2 33.5 54 76.5 100
1 3 3 4 -> 1 2 3 3.5 4
1 3 3 3 4 -> 1 3 3 3 4
quantile
명명 된 벡터 를 반환하고 명명fivenum
되지 않은 것입니다. 어쩌면 그것은 어디에서fivenum
사용되는 문제 입니까?