«regression» 태그된 질문

하나 이상의 "종속"변수와 "독립"변수 간의 관계를 분석하는 기술.

4
특이 치에 강력한 고속 선형 회귀
나는 특이 치에 대한 선형 데이터를 다루고 있는데, 그중 일부는 추정 회귀선에서 5 표준 편차 이상입니다. 이러한 점의 영향을 줄이는 선형 회귀 기술을 찾고 있습니다. 지금까지 내가 한 일은 모든 데이터로 회귀선을 추정 한 다음 매우 큰 제곱 잔차 (예 : 상위 10 %)가있는 데이터 포인트를 버리고 해당 포인트없이 회귀를 …

1
Scikit-learn의 One-hot vs Dummy 인코딩
범주 형 변수를 인코딩하는 방법에는 두 가지가 있습니다. 하나의 범주 형 변수에는 n 개의 값이 있습니다. 원핫 인코딩은 이를 n 개의 변수 로 변환하고 더미 인코딩은 이를 n-1 변수 로 변환합니다 . k 개의 범주 형 변수 가있는 경우 각각 n 개의 값을 갖습니다. 하나의 핫 인코딩은 kn 변수로 끝나고 …

2
다중 회귀 분석에서 '제어하기'와 다른 변수를 '무시'하는 것에는 차이가 있습니까?
다중 회귀 분석에서 설명 변수의 계수는 해당 설명 변수와 종속 변수의 관계를 알려줍니다. 이 모든 것은 다른 설명 변수에 대한 '제어'입니다. 내가 지금까지 본 방법 : 각 계수가 계산되는 동안 다른 변수는 고려되지 않으므로 무시됩니다. '제어 된'과 '무시 된'이라는 용어를 서로 바꿔서 사용할 수 있다고 생각할 때 적절합니까?

4
분산 분석이 선형 회귀 분석과 동일한 이유는 무엇입니까?
분산 분석과 선형 회귀 분석이 동일하다는 것을 읽었습니다. ANOVA의 출력이 일부 값이고 일부 다른 p- 값 이라는 점을 고려할 때 어떻게 할 수 있습니까? 다른 샘플에서 샘플 평균이 동일하거나 다른지 여부를 결론으로 ​​결정합니다.에프FF피pp 그러나 평균이 같지 않다고 가정하면 (널 가설 제거) ANOVA는 선형 모형의 계수에 대해 아무 것도 알려주지 않습니다. …
50 regression  anova 


7
간단한 선형 회귀 분석에서 스위칭 응답 및 설명 변수의 효과
와 사이 에 과 같은 "true"관계가 존재한다고 가정 해 봅시다 . 여기서 와 는 상수이고 은 iid 일반 노이즈입니다. 그 R 코드에서 무작위로 데이터를 생성 한 다음과 같은 모델을 적합 하게 만들면 분명히 와 대한 합리적인 추정치를 얻습니다 .yyyxxxy=ax+b+ϵy=ax+b+ϵy = ax + b + \epsilonaaabbbϵϵ\epsilonx <- 1:100; y <- ax …
48 regression 

11
플롯과 선형 대수를 사용하지 않고 간단한 선형 회귀를 수행 할 수 있습니까?
나는 완전히 장님이고 프로그래밍 배경에서 왔습니다. 내가하려는 것은 기계 학습을 배우는 것입니다.이를 위해서는 먼저 선형 회귀에 대해 알아야합니다. 이 주제에 대해 내가 찾은 인터넷의 모든 설명은 먼저 데이터를 표시합니다. 그래프와 플롯에 의존하지 않는 선형 회귀에 대한 실용적인 설명을 찾고 있습니다. 간단한 선형 회귀의 목표에 대한 나의 이해는 다음과 같습니다. 간단한 …

7
숙련 된 개발자를위한 통계로 시작하는 곳
2015 년 상반기 동안 저는 기계 학습 과정 (GREAT 과정 Andrew Andrew)을 수행했습니다. 기계 학습의 기본 사항 (선형 회귀, 로지스틱 회귀, SVM, 신경망 ...)을 배웠습니다. 또한 나는 10 년 동안 개발자 였으므로 새로운 프로그래밍 언어를 배우는 것은 문제가되지 않습니다. 최근에 기계 학습 알고리즘을 구현하기 위해 R 학습을 시작했습니다. 그러나 나는 …

2
스플라인이 데이터에 비해 적합합니까?
내 문제 : 최근 스플라인은 데이터 탐색에만 유용하고 과적 합되어 예측에 유용하지 않다는 통계학자를 만났습니다. 그는 간단한 다항식으로 탐색하는 것을 선호했습니다 ... 나는 스플라인을 좋아하는 팬이므로, 나는이 주장이 얼마나 유효한지, 그리고 안티 스플라인 그룹이 큰지에 관심이 있습니다. 거기 운동가 ? 배경 : 모델을 만들 때 Frank Harrell, Regression Modeling Strategies …

5
두 그룹에 대한 t- 검정과 분산 분석이 동일하다면 왜 가정이 같지 않습니까?
나는 이것을 머리 둘레에 완전히 감쌌다 고 확신하지만 그것을 알아낼 수는 없다. t- 검정은 Z 분포를 사용하여 두 정규 분포를 비교합니다. 이것이 DATA에 정규성이 있다고 가정 한 이유입니다. 분산 분석은 더미 변수를 사용한 선형 회귀 분석과 동일하며 OLS와 마찬가지로 제곱합을 사용합니다. 이것이 RESIDUALS의 정규성에 대한 가정이있는 이유입니다. 몇 년이 걸렸지 …

4
대비 행렬이란 무엇입니까?
무엇 정확히 대비 매트릭스 (용어, 범주 예측과 분석에 관한)이며 어떻게 정확히 대비 행렬을 지정? 즉, 열이란 무엇이며, 행은 무엇이며, 해당 행렬의 제약 조건은 무엇이며 열 j및 행의 숫자는 무엇을 i의미합니까? 나는 문서와 웹을 살펴 보려고했지만 모든 사람들이 그것을 사용하지만 아직 어디에도 정의가없는 것 같습니다. 사용 가능한 사전 정의 된 대비를 …

5
회귀 이해-모델의 역할
매개 변수를 얻으려는 함수를 모르는 경우 회귀 모델을 어떻게 사용할 수 있습니까? 나는 한 자녀가 모유를 먹인 어머니가 후기에 당뇨병에 걸릴 가능성이 적다는 연구 결과를 보았다. 이 연구는 약 1000 명의 어머니를 대상으로 한 조사에서 이루어졌으며 기타 요인에 대한 통제가 이루어졌으며 로그 선형 모델이 사용되었습니다. 이것은 당뇨병의 가능성을 결정하는 훌륭한 …

3
로그 변환 예측 변수 및 / 또는 응답의 해석
종속 변수, 종속 변수 및 독립 변수 또는 독립 변수 만 로그 변환인지 해석에 차이가 있는지 궁금합니다. 의 경우를 고려 log(DV) = Intercept + B1*IV + Error IV를 백분율 증가로 해석 할 수 있지만 log(DV) = Intercept + B1*log(IV) + Error 또는 내가있을 때 DV = Intercept + B1*log(IV) + …
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

3
Y를 정규 분포해야한다는 오해는 어디에서 오는가?
겉보기에 평판이 좋은 소스는 종속 변수가 정상적으로 분포되어야한다고 주장합니다. 모형 가정 : 는 정규 분포, 오차는 정규 분포 및 독립적이며 는 고정되어 있으며 상수 분산은 입니다.YYYei∼N(0,σ2)ei∼N(0,σ2)e_i \sim N(0,\sigma^2)XXXσ2σ2\sigma^2 Penn State, STAT 504 불연속 데이터 분석 둘째, 선형 회귀 분석에서는 모든 변수가 다변량 정규이어야합니다. 통계적 해법, 선형 회귀 가정 이것은 반응 …

3
다중 회귀 모델에서 상관 예측 변수를 갖는 효과는 무엇입니까?
선형 모델 클래스에서 두 예측 변수가 서로 연관되어 있고 두 예측 변수가 모두 모형에 포함되면 하나는 중요하지 않다는 것을 알게되었습니다. 예를 들어, 집의 크기와 침실 수가 서로 연관되어 있다고 가정하십시오. 이 두 예측 변수를 사용하여 주택 비용을 예측할 때 둘 다 동일한 정보를 많이 제공하기 때문에 그 중 하나를 삭제할 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.