«self-study» 태그된 질문

수업이나 자습에 사용되는 교과서, 코스 또는 시험에서 일상적인 운동. 이 커뮤니티의 정책은 완전한 답변이 아닌 그러한 질문에 대해 "유용한 힌트를 제공"하는 것입니다.

5
매우 많은 수의 데이터 포인트에서 값을 대치하는 방법은 무엇입니까?
데이터 세트가 매우 커서 약 5 %의 임의 값이 없습니다. 이 변수들은 서로 상관되어 있습니다. 다음 예제 R 데이터 세트는 더미 상관 데이터가있는 장난감 예제 일뿐입니다. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, sep ="") rownames(xmat) …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 


4
카드를 뽑은 후 에이스, 2, 3 등을 얻을 때까지 예상되는 수
다음을 해결하는 데 문제가 있습니다. 에이스를 얻을 때까지 교체하지 않고 표준 52 카드 데크에서 카드를 가져옵니다. 당신은 2를 얻을 때까지 남은 것에서 뽑습니다. 계속해서 3을 계속합니다. 시키는 것이 자연 스러웠다 Ti=first position of card whose value is iTi=first position of card whose value is iT_i = \text{first position of card …

2
충분한 통계는 무엇입니까?
충분한 통계를 이해하는 데 어려움이 있습니까? 하자 충분한 통계합니다.T=ΣxiT=ΣxiT=\Sigma x_i 경우 확률 1로, 어떤 기능에 대한 , 그것은 전체 충분한 통계치이다.E[g(T)]=0E[g(T)]=0E[g(T)]=0ggg 그러나 이것이 무엇을 의미합니까? 유니폼과 Bernoulli (페이지 6 http://amath.colorado.edu/courses/4520/2011fall/HandOuts/umvue.pdf )의 예를 보았지만 직관적이지 않으므로 통합을 보는 것이 더 혼란스러워졌습니다. 누군가 간단하고 직관적 인 방법으로 설명 할 수 있습니까?

1
R-자유도에서 PROC Mixed과 lme / lmer의 차이점
참고 :이 질문은 법적 이유로 인해 이전 질문을 삭제해야했기 때문에 다시 게시되었습니다. SAS의 PROC MIXED를 R lme의 nlme패키지 기능과 비교하는 동안 다소 혼란스러운 차이점을 발견했습니다. 구체적으로는, 다른 시험에서 자유도간에 상이 PROC MIXED하고 lme, 그리고 왜 생각해. 다음 데이터 세트에서 시작하십시오 (아래 제공된 R 코드). ind : 측정 대상을 나타내는 계수 …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

2
R에서 Monte Carlo 시뮬레이션을 사용한 근사 적분
MC 시뮬레이션을 사용하여 다음 적분을 어떻게 근사합니까? ∫1− 1∫1− 1| x-y|d xD Y∫−11∫−11|x−y|dxdy \int_{-1}^{1} \int_{-1}^{1} |x-y| \,\mathrm{d}x \,\mathrm{d}y 감사! 편집 (일부 상황) : 시뮬레이션을 사용하여 적분을 근사화하는 방법을 배우려고 노력하고 있으며 어려움을 겪을 때 연습을하고 있습니다. 편집 2 + 3 : 어떻게 든 혼란스러워서 적분을 별도의 부분으로 나눌 필요가 있다고 …

5
로지스틱 회귀 분석에서 더 나은 불이행 분류
전체 공개 : 이것은 숙제입니다. 데이터 세트에 대한 링크를 포함 시켰습니다 ( http://www.bertelsen.ca/R/logistic-regression.sav ) 저의 목표는이 데이터 세트에서 대출 불이행자 예측을 최대화하는 것입니다. 지금까지 생각해 낸 모든 모델은 기본값이 아닌 사용자의> 90 %를 예측하지만 분류기의 전체 효율을 ~ 80 %로 만드는 기본값의 <40 %를 예측합니다. 변수 사이에 상호 작용 효과가 …
12 r  logistic  spss  self-study 

4
기능 선택에서 올가미가 불안정 해지는 원인은 무엇입니까?
압축 감지에서는 에 고유 한 희소 솔루션 c 가 있음을 보장하는 정리 가 있습니다 (자세한 내용은 부록 참조).argmin∥c∥1subject to y=Xcargmin‖c‖1subject to y=Xc\text{argmin} \Vert c \Vert_1\\ \text{subject to } y = Xc ccc 올가미에 대한 비슷한 정리가 있습니까? 그러한 정리가 있다면 올가미의 안정성을 보장 할뿐만 아니라 올가미에보다 의미있는 해석을 제공합니다. 올가미 …


3
단위 볼에서 N 샘플의 원점에 가장 가까운 중간 값에 대한 공식 설명
에서는 통계 학습 요소 , 문제는 고차원 공간에서 K-NN으로 하이라이트 문제로 도입된다. 거기 균일하게 분포되어 데이터 포인트 차원 부 공.P엔NN피pp 원점에서 가장 가까운 데이터 포인트까지의 중간 거리는 다음 식으로 제공됩니다. 디( p , N) = ( 1 − ( 12)1엔)1피d(p,N)=(1−(12)1N)1pd(p,N) = \left(1-\left(\frac{1}{2}\right)^\frac{1}{N}\right)^\frac{1}{p} 때 가장 가까운 지점으로 국경에 접근하는 방법, 볼의 …

1
Fisher의 정확한 테스트 및 초기 하 분포
피셔의 정확한 테스트를 더 잘 이해하고 싶기 때문에 f와 m이 남성과 여성에 해당하고 n과 y가 "소다 소비"에 해당하는 다음 장난감 예제를 고안했습니다. > soda_gender f m n 0 5 y 5 0 분명히 이것은 과감한 단순화이지만 컨텍스트가 방해되는 것을 원하지 않았습니다. 여기서 나는 남자들이 음료수를 마시지 않고 여자들은 음료수를 마시고 …


4
부트 스트랩, 몬테카를로
숙제의 일부로 다음 질문을 설정했습니다. 일 변량 데이터 표본의 평균에 대한 95 % 신뢰 구간을 얻기 위해 부트 스트랩의 성능을 검사하기위한 시뮬레이션 연구를 설계하고 구현합니다. 구현은 R 또는 SAS에있을 수 있습니다. 보고자하는 성능 측면은 신뢰 구간 적용 범위 (즉, 신뢰 구간에 실제 평균이 포함되는 비율)와 Monte Carlo 변동 (즉, 상한과 …

1
가우스 분포에서 MLE of Variance가 바이어스됨을 이해하는 방법은 무엇입니까?
PRML을 읽고 있는데 그림을 이해하지 못합니다. 그림을 이해하기위한 힌트와 가우시안 분포의 분산 MLE이 왜 편향 될 수 있습니까? 공식 1.55 : 공식 1.56 σ 2 M L E =1μ미디엄L E= 1엔∑n = 1엔엑스엔μ미디엄엘이자형=1엔∑엔=1엔엑스엔 \mu_{MLE}=\frac{1}{N} \sum_{n=1}^N x_n σ2미디엄L E= 1엔∑n = 1엔( x엔− μ미디엄L E)2σ미디엄엘이자형2=1엔∑엔=1엔(엑스엔−μ미디엄엘이자형)2 \sigma_{MLE}^2=\frac{1}{N}\sum_{n=1}^{N}(x_n-\mu_{MLE})^2

3
코스 라 머신 러닝 코스 당 정규화 된 선형 회귀 비용 함수 도출
나는 몇 개월 전에 코스 트라를 통해 앤드류 응 (Andrew Ng)의 "머신 러닝 (Machine Learning)"과정을 수강했고, 대부분의 수학 / 유도에주의를 기울이지 않고 구현과 실용성에 중점을 두었습니다. 그 이후로 나는 기본 이론의 일부를 연구하기 시작했고 Ng 교수의 강의를 다시 방문했다. 나는 "Regularized Linear Regression"에 대한 강의를 읽고 그가 다음과 같은 비용 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.