«robust» 태그된 질문

견고성은 일반적으로 기본 가정과의 편차에 대한 통계의 둔감성을 나타냅니다 (Huber and Ronchetti, 2009).

14
왜 견고하고 저항력있는 통계가 고전 기술을 대체하지 않았습니까?
데이터를 사용하여 비즈니스 문제를 해결할 때 고전 통계를 과소 평가하는 최소한 하나의 주요 가정이 유효하지 않은 것이 일반적입니다. 대부분의 경우 아무도 그러한 가정을 확인하지 않아도되므로 실제로 알 수 없습니다. 예를 들어, 많은 일반 웹 메트릭이 "정규 분포"에 비해 "긴 꼬리"라는 사실은 당연히 문서화되어 당연한 것으로 간주됩니다. 또 다른 예를 들자면, …

3
왜 우리가 필요하지 않을 때 선형 회귀 분석에서 정규 분포 분포 오차 항 (및 등분 산성)에 관심이 많은가?
누군가가 비정규 잔차 및 / 또는이 분산이 OLS 가정을 위반한다고 말할 때마다 좌절감을 느낍니다. OLS 모델에서 모수 를 추정 하기 위해 Gauss-Markov 정리에는 이러한 가정이 필요하지 않습니다. OLS 모델에 대한 가설 검정 에서 이것이 중요한 이유를 알 수 있습니다. 이러한 점을 가정하면 t- 검정, F- 검정 및보다 일반적인 Wald 통계에 …

4
특이 치에 강력한 고속 선형 회귀
나는 특이 치에 대한 선형 데이터를 다루고 있는데, 그중 일부는 추정 회귀선에서 5 표준 편차 이상입니다. 이러한 점의 영향을 줄이는 선형 회귀 기술을 찾고 있습니다. 지금까지 내가 한 일은 모든 데이터로 회귀선을 추정 한 다음 매우 큰 제곱 잔차 (예 : 상위 10 %)가있는 데이터 포인트를 버리고 해당 포인트없이 회귀를 …

4
R에서 Stata의 "견고한"옵션 복제
robustR 에서 Stata 옵션의 결과를 복제하려고했습니다 rlm. MASS 패키지와 lmrob"robustbase"패키지 의 명령 을 사용했습니다. 두 경우 모두 결과는 Stata의 "robust"옵션과 상당히 다릅니다. 이 맥락에서 누군가 제안 할 수 있습니까? Stata에서 강력한 옵션을 실행할 때 얻은 결과는 다음과 같습니다. . reg yb7 buildsqb7 no_bed no_bath rain_harv swim_pl pr_terrace, robust Linear regression …

6
대략 정규 분포의 규모를 추정하기위한 강력한 베이지안 모델은 무엇입니까?
많은 규모 의 강력한 추정기 가 존재한다 . 주목할만한 예로는 표준 편차와 의 중앙값 절대 편차가 σ=MAD⋅1.4826σ=엠에이디⋅1.4826\sigma = \mathrm{MAD}\cdot1.4826있습니다. 베이지안 프레임 워크에는 대략 정규 분포 (예 : 특이 치로 오염 된 정규 분포) 의 위치 를 강력하게 추정 할 수있는 여러 가지 방법이 있습니다. 예를 들어 데이터가 분포 또는 라플라스 …

8
특이 값을 평균으로 바꾸기
이 질문은 인터넷에 정통하지 않은 친구가 물었습니다. 통계 배경이 없으며이 질문에 대해 인터넷을 검색했습니다. 문제는 : 특이 치를 평균값으로 대체 할 수 있습니까? 가능하다면이 진술을 뒷받침 할 책 참조 / 저널이 있습니까?


2
왜 일반 오류 대신 t 오류를 사용해야합니까?
에서 이 앤드류 겔만으로 블로그 게시물, 다음과 같은 구절이있다 : 50 년 전의 베이지안 모델은 절망적으로 단순 해 보이지만 (물론 간단한 문제는 제외하고) 오늘날의 베이지안 모델은 50 년 동안 절망적으로 단순 해 보일 것으로 기대합니다. (간단한 예를 들자면, 우리는 아마도 어디에서나 일반적인 오류 대신에 t를 일상적으로 사용해야 할 것입니다. 그러나 …

2
glm을 실행할 때 오류“시스템이 계산적으로 특이하다”
glm 추정을 실행하기 위해 튼튼베이스 패키지를 사용하고 있습니다. 그러나 그렇게하면 다음과 같은 오류가 발생합니다. Error in solve.default(crossprod(X, DiagB * X)/nobs, EEq) : system is computationally singular: reciprocal condition number = 1.66807e-16 이것은 무엇을 의미 / 표시합니까? 어떻게 디버깅 할 수 있습니까? 추신. 답을 구하기 위해 무언가 (공식 / 사양 또는 …

4
RANSAC이 통계에서 가장 널리 사용되지 않는 이유는 무엇입니까?
컴퓨터 비전 분야에서 나온 저는 종종 RANSAC (Random Sample Consensus) 방법을 사용하여 많은 특이 치가있는 데이터에 모델을 적합 시켰습니다. 그러나 나는 통계 학자들이 사용하는 것을 본 적이 없으며, "통계적으로 건전한"방법으로 간주되지 않았다는 인상을 항상 받았다. 왜 이렇게이다? 본질적으로 무작위이므로 분석하기가 어렵지만 부트 스트랩 방법도 마찬가지입니다. 아니면 단순히 학문적 사일로가 서로 …

5
표본 분포가 비정규 일 때 독립 표본 t- 검정은 얼마나 강력합니까?
샘플 분포가 정규성을 벗어날 때 t- 검정 이 "합리적으로 강력" 하다는 것을 읽었습니다 . 물론 중요한 차이의 샘플링 분포입니다. 두 그룹에 대한 데이터가 있습니다. 그룹 중 하나가 종속 변수에 치우쳐 있습니다. 표본 크기는 두 그룹 모두에 대해 상당히 작습니다 (하나는 n = 33, 다른 하나는 45). 이러한 조건에서 내 t- …

4
PCA 공간에 새로운 벡터를 투영하는 방법?
주성분 분석 (PCA)을 수행 한 후 PCA 공간에 새 벡터를 투영하려고합니다 (즉, PCA 좌표계에서 해당 좌표를 찾습니다). 를 사용하여 R 언어로 PCA를 계산했습니다 prcomp. 이제 내 벡터에 PCA 회전 행렬을 곱할 수 있어야합니다. 이 매트릭스의 주요 구성 요소를 행 또는 열로 배열해야합니까?
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 

2
견고한 선형 모형 의 가중
MASS 패키지를 R사용하여 MM 가중치 로 강력한 선형 모델을 추정했습니다 rlm(). `R``은 모델에 값을 제공하지 않지만 의미있는 수량이라면 값을 원합니다. 또한 관측치가 강력한 회귀 분석에서 가중치를 적용한 것과 같은 방식으로 총 및 잔류 분산을 측정 하는 R 2 값을 갖는 데 어떤 의미가 있는지 알고 싶습니다 . 나의 일반적인 생각은, …

5
어떤 강력한 상관 관계 분석법이 실제로 사용됩니까?
여러 분포 (비틀림, 특이 치 등)가있는 여러 강력한 상관 관계 기술의 성능을 비교하는 시뮬레이션 연구를 수행 할 계획입니다. 으로 강력한 , I)는 비대칭 분포, b) 특이점 및 c) 무거운 끌리는 강인한되는 이상적인 경우를 의미한다. Pearson 상관 관계를 기준으로하여 다음과 같은보다 강력한 측정 방법을 포함 시키려고했습니다. 스피어 맨의 ρρ\rho 백분율 굽힘 …

4
평균 및 중앙값 속성
누군가 두 문장 (a)와 (b)를 연결하는 수학적 논리를 명확하게 설명해 줄 수 있습니까? 일련의 값을 갖도록하자 (일부 분포). 지금, a) 중간 값은 모든 값에 의존하지는 않는다 [단 하나 또는 두 개의 중간 값에 의존한다]. b) 중앙값은 최소 절대 합산 편차의 위치입니다. 마찬가지로, 대조적으로 a) (산술) 평균은 모든 값에 따라 다릅니다. …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.