업데이트 : 문제의 요점은 시간 복잡성 을 달성 하기 위해서는 스토리지 순서로 필요하다는 것입니다 .O ( n 로그( n ) )O ( n )
아니요, 은 모든 중에서 요소를 선택하는 시간 복잡성에 대한 이론적 하한 입니다 ((1) 참조 가능한 .O ( n 로그( n ) )K t H N ( N - 1 )케이t의 시간n ( n - 1 )2| 엑스나는− x제이| :1≤i<j≤n
공간을 얻을 수 있지만 시간 에서 의 모든 조합을 순진하게 확인해야 합니다.O ( 1 )엑스나는− x제이O ( n2)
좋은 소식은 패키지 의 함수 에 구현 된 스케일 의 추정기 (개선 된 버전 및 일부 타이밍 비교에 대해서는 (2) 및 (3) 참조)를
사용할 수 있다는 것 입니다. 일 변량 추정량은 스케일의 2 단계 (예 : 재가 중) 추정량입니다. 95 % 가우시안 효율, 50 % 고 장점 및 시간 및 공간의 복잡성 을가집니다 (또한 온라인으로 쉽게 만들 수있어 반복 사용으로 계산 비용의 절반을 절감 할 수 있음) 이 옵션을 구현하기 위해 코드 를 파헤쳐 야 할 것입니다.ττ O ( n ) O ( 1 )scaleTau2()
R
robustbase
τO ( n )O ( 1 )R
- 정렬 된 열 GN Frederickson 및 DB Johnson, 컴퓨터 및 시스템 과학 저널 24 권 2 호, 1982 년 4 월 2 일, 197-208 페이지의 X + Y 및 행렬에서 선택 및 순위의 복잡성.
- Yohai, V. 및 Zamar, R. (1988). 효율적인 척도를 최소화하여 회귀에 대한 높은 분류 점 추정치. 미국 통계 협회의 전표 83 406–413.
- Maronna, R. 및 Zamar, R. (2002). 고차원 데이터 세트에 대한 강력한 위치 및 분산 추정치. 기술 측정 44307–317
이것을 사용하려면 편집
- 실행
R
(무료이며 여기 에서 다운로드 할 수 있음 )
- 다음을 입력하여 패키지를 설치하십시오.
install.packages("robustbase")
- 다음을 입력하여 패키지를로드하십시오.
library("robustbase")
- 데이터 파일을로드하고 함수를 실행하십시오.
mydatavector <- read.table("address to my file in text format", header=T)
scaleTau2(mydatavector)