통계 및 빅 데이터 linear-model

3

선형 회귀와 로지스틱 회귀의 차이점은 무엇입니까? 언제 사용합니까?

122 regression logistic linear-model

9

선형 회귀 모델을 실행하고 절편 항을 제거하기위한 조건이 무엇인지 궁금합니다. 하나는 절편이 있고 다른 하나는 절편이없는 두 개의 서로 다른 회귀 분석 결과를 비교할 때 절편이없는 함수 의 가 훨씬 높다는 것을 알 수 있습니다. 절편 항의 제거가 유효한지 확인하기 위해 따라야하는 특정 조건이나 가정이 있습니까?아르 자형2R2R^2

118 regression linear-model r-squared intercept

2

통계적으로 유의 한 절편 항을 제거하면 선형 모형에서

단일 설명 변수가 포함 된 간단한 선형 모형에서 αi=β0+β1δi+ϵiαi=β0+β1δi+ϵi\alpha_i = \beta_0 + \beta_1 \delta_i + \epsilon_i 절편 항을 제거하면 적합도가 크게 향상됩니다 ( R 2 값).R2R2R^2 0.3에서 0.9로 이동). 그러나 절편 항은 통계적으로 유의 한 것으로 보입니다. 가로 채기 : Call: lm(formula = alpha ~ delta, data = cf) Residuals: …

101 r linear-model interpretation r-squared intercept

9

x의 y와 x의 y에 대한 선형 회귀의 차이점은 무엇입니까?

pearson (x, y) 또는 pearson (y, x)을 계산하든 x와 y의 Pearson 상관 계수는 동일합니다. 이것은 주어진 x 또는 x 주어진 y에 대해 y의 선형 회귀를 수행하는 것이 동일해야 함을 시사하지만, 그렇지 않다고 생각합니다. 관계가 대칭이 아닐 때 누군가가 밝힐 수 있습니까? 그리고 그것이 피어슨 상관 계수와 어떻게 관련이 있습니까?

97 regression correlation linear-model pearson-r

4

PCA 및 분산 비율 설명

일반적으로 PCA와 같은 분석에서 분산 의 비율 가 첫 번째 주요 구성 요소로 설명 된다는 것은 무엇을 의미 합니까? 누군가 이것을 직관적으로 설명 할 수 있지만 주성분 분석 (PCA) 측면에서 "변형 설명"의 의미에 대한 정확한 수학적 정의를 제공 할 수 있습니까?엑스엑스x 간단한 선형 회귀 분석의 경우, 최적 제곱의 r 제곱은 …

90 regression pca linear-model dimensionality-reduction

2

선형 회귀 분석에서 예측 된 값에 대한 신뢰 구간

선형 회귀 분석에서 예측 된 값에 대한 신뢰 구간이 예측 변수의 평균 주변에서 좁고 예측 변수의 최소 및 최대 값 주변에서 뚱뚱한 경향이 있음을 알았습니다. 이것은 다음 4 가지 선형 회귀의 도표에서 볼 수 있습니다. 처음에 이것은 예측 변수의 대부분의 값이 예측 변수의 평균에 집중되어 있기 때문이라고 생각했습니다. 그러나 왼쪽 …

69 regression confidence-interval linear-model standard-error prediction-interval

4

로그 변환 된 응답 변수에 대해 LM과 GLM 중에서 선택

GLM (Generalized Linear Model)과 LM (Linear Model)을 사용하는 철학을 이해하려고합니다. 아래에 예제 데이터 세트를 만들었습니다. log(y)=x+εlog⁡(y)=x+ε\log(y) = x + \varepsilon 이 예제에는 크기의 함수로 오류가 없으므로 로그 변환 된 y의 선형 모델이 가장 좋다고 가정합니다. 아래 예제에서는 로그 변환 된 데이터에 대한 LM의 AIC가 가장 낮기 때문에 실제로 그런 경우입니다. …

55 r generalized-linear-model linear-model gamma-distribution link-function

4

특이 치에 강력한 고속 선형 회귀

나는 특이 치에 대한 선형 데이터를 다루고 있는데, 그중 일부는 추정 회귀선에서 5 표준 편차 이상입니다. 이러한 점의 영향을 줄이는 선형 회귀 기술을 찾고 있습니다. 지금까지 내가 한 일은 모든 데이터로 회귀선을 추정 한 다음 매우 큰 제곱 잔차 (예 : 상위 10 %)가있는 데이터 포인트를 버리고 해당 포인트없이 회귀를 …

50 regression linear-model outliers robust fused-lasso

3

로그 변환 예측 변수 및 / 또는 응답의 해석

종속 변수, 종속 변수 및 독립 변수 또는 독립 변수 만 로그 변환인지 해석에 차이가 있는지 궁금합니다. 의 경우를 고려 log(DV) = Intercept + B1*IV + Error IV를 백분율 증가로 해석 할 수 있지만 log(DV) = Intercept + B1*log(IV) + Error 또는 내가있을 때 DV = Intercept + B1*log(IV) + …

46 regression data-transformation interpretation regression-coefficients logarithm r dataset stata hypothesis-testing contingency-tables hypothesis-testing statistical-significance standard-deviation unbiased-estimator t-distribution r functional-data-analysis maximum-likelihood bootstrap regression change-point regression sas hypothesis-testing bayesian randomness predictive-models nonparametric terminology parametric correlation effect-size loess mean pdf quantile-function bioinformatics regression terminology r-squared pdf maximum multivariate-analysis references data-visualization r pca r mixed-model lme4-nlme distributions probability bayesian prior anova chi-squared binomial generalized-linear-model anova repeated-measures t-test post-hoc clustering variance probability hypothesis-testing references binomial profile-likelihood self-study excel data-transformation skewness distributions statistical-significance econometrics spatial r regression anova spss linear-model

3

Y를 정규 분포해야한다는 오해는 어디에서 오는가?

겉보기에 평판이 좋은 소스는 종속 변수가 정상적으로 분포되어야한다고 주장합니다. 모형 가정 : 는 정규 분포, 오차는 정규 분포 및 독립적이며 는 고정되어 있으며 상수 분산은 입니다.YYYei∼N(0,σ2)ei∼N(0,σ2)e_i \sim N(0,\sigma^2)XXXσ2σ2\sigma^2 Penn State, STAT 504 불연속 데이터 분석 둘째, 선형 회귀 분석에서는 모든 변수가 다변량 정규이어야합니다. 통계적 해법, 선형 회귀 가정 이것은 반응 …

45 regression least-squares linear-model dependent-variable

3

다중 회귀 모델에서 상관 예측 변수를 갖는 효과는 무엇입니까?

선형 모델 클래스에서 두 예측 변수가 서로 연관되어 있고 두 예측 변수가 모두 모형에 포함되면 하나는 중요하지 않다는 것을 알게되었습니다. 예를 들어, 집의 크기와 침실 수가 서로 연관되어 있다고 가정하십시오. 이 두 예측 변수를 사용하여 주택 비용을 예측할 때 둘 다 동일한 정보를 많이 제공하기 때문에 그 중 하나를 삭제할 …

45 regression multiple-regression p-value linear-model multicollinearity

3

다항식 회귀는 왜 다중 선형 회귀의 특별한 경우로 간주됩니까?

다항식 회귀 분석이 비선형 관계를 모델링하는 경우 다중 선형 회귀 분석의 특별한 경우로 간주 할 수있는 방법은 무엇입니까? Wikipedia는 "다항식 회귀 분석은 비선형 모형을 데이터에 적합하지만 통계적 추정 문제로서 회귀 함수 가 데이터로부터 추정 된 미지의 모수에서 선형이라는 점에서 선형 적이라는 점에서 선형 적입니다. "E(y|x)E(y|x)\mathbb{E}(y | x) 모수가 2 인 …

38 regression multiple-regression linear-model nonlinear-regression polynomial

3

간단한 선형 회귀 분석에서 회귀 계수의 편차 도출

간단한 선형 회귀 분석에서 y=β0+β1x+uy=β0+β1x+uy = \beta_0 + \beta_1 x + u . 여기서 u∼iidN(0,σ2)u∼iidN(0,σ2)u \sim iid\;\mathcal N(0,\sigma^2) . 추정값을 도출했습니다 : β1^=∑i(xi−x¯)(yi−y¯)∑i(xi−x¯)2 ,β1^=∑i(xi−x¯)(yi−y¯)∑i(xi−x¯)2 , \hat{\beta_1} = \frac{\sum_i (x_i - \bar{x})(y_i - \bar{y})}{\sum_i (x_i - \bar{x})^2}\ , 여기서x¯x¯\bar{x} 및y¯y¯\bar{y} 는xxx와y의 표본 평균입니다.yyy . 지금은의 분산 찾으려면 β 1 . 나는 …

37 regression mathematical-statistics variance linear-model regression-coefficients

2

어떤 교차 검증 방법이 가장 좋은지 어떻게 알 수 있습니까?

내 상황에 가장 적합한 교차 유효성 검사 방법을 찾으려고합니다. 다음 데이터는 문제를 해결하기위한 예제 (R)이지만 실제 X데이터 ( xmat)는 서로 상관 관계가 있으며 y변수 ( ymat)를 사용하여 다른 정도와 상관 관계가 있습니다. R 코드를 제공했지만 R에 대한 질문이 아니라 메서드에 대한 질문입니다. XmatX 변수 V1-V100을 ymat포함하고 단일 y 변수 를 …

36 r regression cross-validation linear-model

5

선형 회귀 데이터에 여러 개의 혼합 선형 관계가 포함되어 있으면 어떻게됩니까?

수선화가 다양한 토양 조건에 어떻게 반응하는지 연구하고 있다고 가정 해 봅시다. 토양의 pH와 수선화의 성숙한 높이에 대한 데이터를 수집했습니다. 선형 관계를 기대하고 있으므로 선형 회귀 분석을 실행합니다. 그러나 연구를 시작했을 때 인구가 실제로 두 종류의 수선화를 포함하고 있다는 사실을 알지 못했습니다. 각 수종은 토양 pH에 매우 다르게 반응합니다. 따라서 그래프에는 …

34 regression linear-model dataset

«linear-model» 태그된 질문