«non-independent» 태그된 질문

데이터, 이벤트, 프로세스 등은 1에 대한 지식이 다른 사람의 상태 또는 가치에 대한 정보를 제공하는 경우 독립적이지 않습니다.

5
통계 학습에서 iid 가정의 중요성
통계적 학습, 내재적으로 또는 명시 적으로, 하나는 반드시 학습 집합에 있다고 가정 으로 구성되는 N 입력 / 응답 튜플 ( X I , Y I ) 되어 독립적 같은 조인트 분포로부터 인출 P ( X를 , Y ) 과D={X,y}D={X,y}\mathcal{D} = \{ \bf {X}, \bf{y} \}NNN(Xi,yi)(Xi,yi)({\bf{X}}_i,y_i) P(X,y)P(X,y)\mathbb{P}({\bf{X}},y) p(X,y)=p(y|X)p(X)p(X,y)=p(y|X)p(X) p({\bf{X}},y) = p( …


5
FDR 제어를위한 일반적인 방법을 사용하기위한 조건으로 "긍정적 종속성"의 의미
Benjamini와 Hochberg 는 FDR (False Discovery Rate)을 제어하기위한 첫 번째 (아직 가장 널리 사용되는) 방법을 개발했습니다. 각기 다른 비교를 위해 P 값을 묶어 시작하고 FDR을 지정된 값 (예 : 10 %)으로 제어하여 "발견"이라고 할 정도로 낮은 값을 결정하려고합니다. 일반적인 방법의 한 가정은 비교 세트가 독립적이거나 "긍정적 의존성"을 가지고 있지만 P …

7
상관 관계가 연관과 동등합니까?
저의 통계 교수는 "상관 관계"라는 단어는 변수 간의 선형 관계에만 엄격하게 적용되는 반면 "연관"이라는 단어는 모든 유형의 관계에 광범위하게 적용된다고 주장합니다. 다시 말해, 그는 "비선형 상관 관계"라는 용어가 옥시 모론이라고 주장합니다. " 상관 및 의존성 " 에 대한 Wikipedia 기사 의이 섹션 에서 수행 할 수있는 것에서 피어슨 상관 계수는 …

1
의존적 관찰을위한 PCA의 특성
우리는 일반적으로 PCA를 사례가 iid로 가정되는 데이터의 차원 축소 기술로 사용합니다. 질문 : 종속적이지 않은 IId 데이터에 PCA를 적용 할 때의 일반적인 뉘앙스는 무엇입니까? iid 데이터를 보유하고있는 PCA의 어떤 좋은 / 유용한 속성이 손상되거나 완전히 손실됩니까? 예를 들어, 데이터는 다변량 시계열 일 수 있으며,이 경우 자기 상관 또는 자기 회귀 …

1
다중 비교 문헌에서 "종속"및 "독립"테스트의 일반 언어 의미?
양쪽에서 가족 와이즈 에러율 (FWER)와 거짓 검색 속도 (FDR) 문헌 FWER 또는 FDR 제어 방법은 특정 의존적 또는 독립적 인 시험에 적합한 것으로 알려져있다. 예를 들어, 1979 년 논문 "간단한 순차 거부 다중 테스트 절차"에서 Holm은 스텝 업 시닥 방법과 스텝 업 Bonferroni 제어 방법을 대조하여 썼습니다. 테스트 통계가 독립적 …

3
직관을 위해, 상관 관계는 없지만 종속적 인 랜덤 변수의 실제 예는 무엇입니까?
비 상관이 독립성을 의미하지 않는 이유를 설명 할 때, 여러 랜덤 변수를 포함하는 몇 가지 예가 있지만 모두 추상적으로 보입니다. 1 2 3 4 . 이 대답 은 의미가있는 것 같습니다. 내 해석 : 임의의 변수와 제곱은 상관이 없을 수 있습니다 (상관 관계의 부족은 선형 독립과 유사하기 때문에). 예를 들어 …

1
혼합 효과 모델이 종속성을 해결하는 이유는 무엇입니까?
학생 시험 성적이 해당 학생이 공부하는 시간의 수에 어떻게 영향을 받는지 관심이 있다고 가정 해 봅시다. 이 관계를 탐색하기 위해 다음 선형 회귀 분석을 실행할 수 있습니다. exam.gradesi=a+β1×hours.studiedi+eiexam.gradesi=a+β1×hours.studiedi+ei \text{exam.grades}_i = a + \beta_1 \times \text{hours.studied}_i + e_i 그러나 여러 학교에서 학생들을 채취하면 같은 학교의 학생들이 다른 학교의 학생들보다 서로 더 …

1
트윈 스터디 데이터를 사용한 선형 혼합 효과 모델링
번째 패밀리의 번째 형제에서 측정 한 응답 변수 있다고 가정합니다. 또한, 일부 행동 데이터 는 각 과목에서 동시에 수집되었습니다. 다음 선형 혼합 효과 모델로 상황을 분석하려고합니다.yijyijy_{ij}jjjiiixijxijx_{ij} yij=α0+α1xij+δ1ixij+εijyij=α0+α1xij+δ1ixij+εijy_{ij} = \alpha_0 + \alpha_1 x_{ij} + \delta_{1i} x_{ij} + \varepsilon_{ij} 여기서 및 은 각각 고정 절편 및 기울기이고, 는 임의 기울기이며 는 잔차입니다.α0α0\alpha_0α1α1\alpha_1δ1iδ1i\delta_{1i}εijεij\varepsilon_{ij} …

1
장기 분산이란 무엇입니까?
시계열 분석 영역에서 장기 분산은 어떻게 정의됩니까? 데이터에 상관 관계 구조가있는 경우에 사용된다는 것을 알고 있습니다. 따라서 확률 론적 과정은 iid 임의 변수가 아니라 동일하게 분포 된 것입니까?X1,X2…X1,X2…X_1, X_2 \dots 개념에 대한 소개 및 추정과 관련된 어려움으로 표준 참조를 할 수 있습니까?



5
매우 많은 수의 데이터 포인트에서 값을 대치하는 방법은 무엇입니까?
데이터 세트가 매우 커서 약 5 %의 임의 값이 없습니다. 이 변수들은 서로 상관되어 있습니다. 다음 예제 R 데이터 세트는 더미 상관 데이터가있는 장난감 예제 일뿐입니다. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, sep ="") rownames(xmat) …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 


6
관찰 (즉, 비 랜덤 화) 연구에서 비 독립적 공변량을 제어하는 ​​것이 얼마나 문제가됩니까?
Miller and Chapman (2001)은 관찰 (비 랜덤 화되지 않은) 연구에서 독립 변수와 종속 변수 둘 다와 관련된 비 독립 공변량을 제어하는 ​​것은 절대적으로 부적절하다고 주장합니다. 그렇게하는 것이 얼마나 문제가됩니까? 이 문제를 처리하는 가장 좋은 방법은 무엇입니까? 자신의 연구에서 관측 연구에서 비 독립적 공변량을 일상적으로 관리한다면 어떻게 정당화 할 수 있습니까? …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.