«kernel-smoothing» 태그된 질문

커널 밀도 추정 (KDE) 및 Nadaraya-Watson 커널 회귀와 같은 커널 스무딩 기술은 데이터 포인트에서 로컬 보간법으로 함수를 추정합니다. 예를 들어 SVM에서 사용되는 커널의 경우 [kernel-trick]과 혼동하지 마십시오.


4
R에서 음이 아닌 변수의 밀도 플롯에 대한 좋은 방법?
plot(density(rexp(100)) 분명히 0 왼쪽의 모든 밀도는 바이어스를 나타냅니다. 통계가 아닌 사람들을 위해 일부 데이터를 요약하려고하는데, 음이 아닌 데이터가 왜 밀도가 0의 왼쪽인지에 대한 질문을 피하고 싶습니다. 플롯은 무작위 검사 용입니다. 처리 및 제어 그룹별로 변수 분포를 보여주고 싶습니다. 분포는 종종 지수 적입니다. 히스토그램은 여러 가지 이유로 까다 롭습니다. 빠른 Google …

2
커널 밀도 추정기의 대역폭 선택
단 변량 커널 밀도 추정기 (KDE)의 경우 계산에 Silverman의 규칙을 사용합니다 .hhh 0.9 분 ( S D, IQ R / 1.34 ) × n− 0.20.9min(sd,IQR/1.34)×n−0.2\begin{equation} 0.9 \min(sd, IQR/1.34)\times n^{-0.2} \end{equation} 다변량 KDE의 표준 규칙은 무엇입니까 (일반 커널 가정).

1
"커널 밀도 추정"은 무엇의 컨볼 루션입니까?
커널 밀도 추정에 대해 더 잘 이해하려고합니다. Wikipedia의 정의 사용 : https://en.wikipedia.org/wiki/Kernel_density_estimation#Definition 에프h^( x ) = 1엔∑엔나는 = 1케이h( x − x나는)= 1N 시간∑엔나는 = 1케이( x − x나는h)fh^(x)=1n∑i=1nKh(x−xi)=1nh∑i=1nK(x−xih) \hat{f_h}(x) = \frac{1}{n}\sum_{i=1}^n K_h (x - x_i) \quad = \frac{1}{nh} \sum_{i=1}^n K\Big(\frac{x-x_i}{h}\Big) 하자 걸릴 제공하는 직사각형의 함수로 경우에 사이 및 및 …

2
평신도의 관점에서 Parzen 창 (커널) 밀도 추정을 설명 할 수 있습니까?
Parzen 창 밀도 추정은 다음과 같이 설명됩니다 p ( x ) = 1엔∑나는 = 1엔1h2ϕ ( x나는− xh)p(x)=1n∑i=1n1h2ϕ(xi−xh) p(x)=\frac{1}{n}\sum_{i=1}^{n} \frac{1}{h^2} \phi \left(\frac{x_i - x}{h} \right) 여기서, 벡터의 요소 수이고, 벡터이며, 의 확률 밀도 , 파젠 윈도우의 사이즈이고, 윈도우 함수이다.x p ( x ) x h ϕ엔nn엑스xxp ( x )p(x)p(x)엑스xxhhhϕϕ\phi 내 …

4
PCA 공간에 새로운 벡터를 투영하는 방법?
주성분 분석 (PCA)을 수행 한 후 PCA 공간에 새 벡터를 투영하려고합니다 (즉, PCA 좌표계에서 해당 좌표를 찾습니다). 를 사용하여 R 언어로 PCA를 계산했습니다 prcomp. 이제 내 벡터에 PCA 회전 행렬을 곱할 수 있어야합니다. 이 매트릭스의 주요 구성 요소를 행 또는 열로 배열해야합니까?
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 


2
가변 커널 너비가 종종 커널 회귀에 적합하다면 왜 커널 밀도 추정에 적합하지 않습니까?
이 질문은 다른 곳 에서 논의 함으로써 촉발됩니다 . 가변 커널은 종종 로컬 회귀에서 사용됩니다. 예를 들어, 황토는 널리 사용되며 회귀가 원활하게 작동하며 데이터 희소성에 적응하는 가변 폭의 커널을 기반으로합니다. 반면에, 가변 커널은 일반적으로 커널 밀도 추정에서 추정량을 떨어 뜨릴 것으로 생각된다 ( Terrell and Scott, 1992 참조 ). 회귀에는 …

1
귀무 가설 하에서 교환 가능한 샘플의 직관은 무엇입니까?
순열 검정 (랜덤 화 검정, 재 랜덤 화 검정 또는 정확한 검정이라고도 함)은 매우 유용하며, 예를 들어 요구되는 정규 분포 가정이 t-test충족되지 않고 순위에 따라 값을 변환 할 때 유용합니다. 비모수 테스트 Mann-Whitney-U-test는 더 많은 정보가 손실 될 수 있습니다. 그러나 이러한 종류의 테스트를 사용할 때 단 하나의 가정 만 …
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

2
R의 커널 밀도 추정에서 "pdf"영역
커널 밀도 추정을 위해 R 의 ' density '기능 을 사용하려고합니다 . 곡선 아래 면적이 반드시 1 인 것처럼 보이지 않기 때문에 결과를 해석하고 다양한 데이터 세트를 비교하는 데 약간의 어려움이 있습니다. 확률 밀도 함수 (pdf) 경우 입니다. 커널 밀도 추정치가 pdf를보고한다고 가정합니다. 내가 사용하고 integrate.xy 에서 sfsmisc 곡선 아래의 …

3
경험적 확률 밀도 간의 중첩을 계산하는 방법은 무엇입니까?
두 샘플 간의 유사성을 측정하기 위해 R에서 두 커널 밀도 추정치 사이의 겹침 영역을 계산하는 방법을 찾고 있습니다. 명확히하기 위해, 다음 예에서, 자 p 중첩 영역의 면적을 정량화해야합니다. library(ggplot2) set.seed(1234) d <- data.frame(variable=c(rep("a", 50), rep("b", 30)), value=c(rnorm(50), runif(30, 0, 3))) ggplot(d, aes(value, fill=variable)) + geom_density(alpha=.4, color=NA) 비슷한 질문이 여기 에서 …


1
파생물의 커널 밀도 추정기를위한 최적의 대역폭이 있습니까?
커널 밀도 추정기를 사용하여 일련의 관측 값을 기반으로 밀도 함수를 추정해야합니다. 동일한 관측치에 기초하여, 커널 밀도 추정기의 도함수를 사용하여 밀도의 1 차 및 2 차 도함수도 추정해야합니다. 대역폭은 확실히 최종 결과에 큰 영향을 미칩니다. 먼저 KDE 대역폭을 제공하는 몇 가지 R 기능이 있다는 것을 알고 있습니다. 어느 것이 더 선호되는지 …

1
커널 대역폭 : Scott과 Silverman의 규칙
스콧과 실버 맨의 대역폭 선택 규칙의 차이점이 무엇인지 일반 영어로 설명 할 수 있습니까? 특히, 때 하나가 다른 것보다 낫다? 기본 분포와 관련이 있습니까? 샘플 수는? 추신 : 나는 SciPy의 코드를 언급하고 있습니다.

3
밀도 추정은 어디에 유용합니까?
약간 간결한 수학을 겪은 후에는 커널 밀도 추정에 약간의 직관이 있다고 생각합니다. 그러나 나는 또한 세 가지 이상의 변수에 대한 다변량 밀도를 추정하는 것이 추정기의 통계적 특성 측면에서 좋은 생각이 아닐 수 있음을 알고 있습니다. 그렇다면, 비모수 적 방법을 사용하여 이변 량 밀도를 어떤 종류의 상황에서 추정하고 싶습니까? 두 개 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.