"대부분의 남성이 대부분의 여성보다 빠르다"는 잠재적으로 다소 모호하지만, 일반적으로 우리가 임의의 parirings를 보면 대부분의 경우 남자가 더 빠를 것입니다. 피(미디엄나는<에프제이) >12 무작위로 I , J (어디 미디엄나는 '시간입니다 나는-남성 남성 등).
물론 그 구절에 대한 다른 해석도 가능합니다 (결국 모호한 것임). 그리고 다른 가능성들 중 일부는 당신의 추론과 일치 할 수 있습니다.
[우리는 또한 표본 또는 집단에 대해 이야기하고 있는지에 대한 문제가 있습니다 ... "대부분의 남성 [...] 대부분의 여성"은 인구 성명서 (잠재적 인 시간의 인구에 관한 것)로 보이지만 우리는 단지 시간을 관찰했습니다 우리는 표본으로 취급하고있는 것 같아서 주장을 얼마나 광범위하게하는지주의해야합니다.]
참고 피(미디엄나는<에프제이) >12 에 의해 암시되지 않습니다 미디엄~<에프~. 그들은 반대 방향으로 갈 수 있습니다.
[ 남자가 여자보다 빠른 임의의 MF 쌍의 비율이 1/2 이상이라고 생각하는 것은 틀렸다고 말하는 것이 아닙니다 . 거의 확실합니다. 나는 중간 값을 비교하여 말할 수 없다고 말하고 있습니다. 다른 샘플의 중앙값 위나 아래에있는 각 샘플의 비율을 보면 알 수 없습니다. 다른 비교를해야합니다.]
즉, 중간 남자는 중간 여자보다 빠를 수 있지만, 임의의 남자가 임의의 여자보다 빠를 가능성이있는 시간의 샘플 (또는 그 문제에 대한 연속적인 분포)을 가질 수 있습니다. 적은 보다는12. 큰 샘플에서 두 개의 반대 표시는 각각 중요 할 수 있습니다.
예:
데이터 세트 A :
1.58 2.10 16.64 17.34 18.74 19.90 1.53 2.78 16.48 17.53 18.57 19.05
1.64 2.01 16.79 17.10 18.14 19.70 1.25 2.73 16.19 17.76 18.82 19.08
1.42 2.56 16.73 17.01 18.86 19.98
데이터 세트 B :
3.35 4.62 5.03 20.97 21.25 22.92 3.12 4.83 5.29 20.82 21.64 22.06
3.39 4.67 5.34 20.52 21.10 22.29 3.38 4.96 5.70 20.45 21.67 22.89
3.44 4.13 6.00 20.85 21.82 22.05
데이터 세트 C :
6.63 7.92 8.15 9.97 23.34 24.70 6.40 7.54 8.24 9.37 23.33 24.26
6.18 7.74 8.63 9.62 23.07 24.80 6.54 7.37 8.37 9.09 23.22 24.16
6.57 7.58 8.81 9.08 23.43 24.45
(데이터는 여기 에 있지만 다른 목적으로 사용됩니다. 내 기억에 나는 이것을 직접 생성했습니다)
A <B의 비율은 2/3이고, A <C의 비율은 5/9이며, B <C의 비율은 2/3입니다. A vs B와 B vs C는 모두 5 % 수준에서 유의미하지만 충분한 샘플 사본을 추가하여 모든 수준의 중요성을 달성 할 수 있습니다. 우리는 샘플을 복제하지만 충분히 작은 지터 (점들 사이의 가장 작은 간격보다 충분히 작은)를 추가하여 동점을 피할 수도 있습니다.
중앙값 (A)> 중앙값 (B)> 중앙값 (C)
다시 우리는 표본을 반복함으로써 중앙값을 임의의 유의 수준과 비교하여 유의성을 달성 할 수 있었다.
그것을 현재의 문제와 관련시키기 위해, A는 "여성의 시간"이고 B는 "남자의 시간"이라고 상상해보십시오. 그런 다음 남성의 평균 시간이 더 빠르지 만 무작위로 선택된 남자는 무작위로 선택된 여자보다 2/3의 시간이 느려집니다.
샘플 A와 C에서 큐를 가져와 다음과 같이 더 큰 데이터 세트 (R)를 생성 할 수 있습니다.
n <- 300
F <- c(runif(n/3,0,5),runif(n-n/3,15,20))
M <- c(runif(n-n/3,7.5,12.5),runif(n/3,22.5,27.5))
F의 중앙값은 약 16.25이고 M의 중앙값은 약 11.25이지만 F <M 인 경우의 비율은 5/9입니다.
[n / 3을 이항 변량으로 대체하고 n 과 13
우리는 F 분포의 중앙값이 16.25 인 반면 M 분포의 중앙값이 11.25 인 모집단에서 표본을 추출 할 것입니다. 한편이 모집단에서 F <M 일 확률은 다시 5/9 일 것입니다.]
또한 P(F<med(M))=23 과 P(M>med(F))=23 동안 med(M)<med(F) (실제로).