선형 회귀 모델을 실행하고 절편 항을 제거하기위한 조건이 무엇인지 궁금합니다. 하나는 절편이 있고 다른 하나는 절편이없는 두 개의 서로 다른 회귀 분석 결과를 비교할 때 절편이없는 함수 의 가 훨씬 높다는 것을 알 수 있습니다. 절편 항의 제거가 유효한지 확인하기 위해 따라야하는 특정 조건이나 가정이 있습니까?아르 자형2R2R^2
단일 설명 변수가 포함 된 간단한 선형 모형에서 αi=β0+β1δi+ϵiαi=β0+β1δi+ϵi\alpha_i = \beta_0 + \beta_1 \delta_i + \epsilon_i 절편 항을 제거하면 적합도가 크게 향상됩니다 ( R 2 값).R2R2R^2 0.3에서 0.9로 이동). 그러나 절편 항은 통계적으로 유의 한 것으로 보입니다. 가로 채기 : Call: lm(formula = alpha ~ delta, data = cf) Residuals: …
pearson (x, y) 또는 pearson (y, x)을 계산하든 x와 y의 Pearson 상관 계수는 동일합니다. 이것은 주어진 x 또는 x 주어진 y에 대해 y의 선형 회귀를 수행하는 것이 동일해야 함을 시사하지만, 그렇지 않다고 생각합니다. 관계가 대칭이 아닐 때 누군가가 밝힐 수 있습니까? 그리고 그것이 피어슨 상관 계수와 어떻게 관련이 있습니까?
일반적으로 PCA와 같은 분석에서 분산 의 비율 가 첫 번째 주요 구성 요소로 설명 된다는 것은 무엇을 의미 합니까? 누군가 이것을 직관적으로 설명 할 수 있지만 주성분 분석 (PCA) 측면에서 "변형 설명"의 의미에 대한 정확한 수학적 정의를 제공 할 수 있습니까?엑스엑스x 간단한 선형 회귀 분석의 경우, 최적 제곱의 r 제곱은 …
선형 회귀 분석에서 예측 된 값에 대한 신뢰 구간이 예측 변수의 평균 주변에서 좁고 예측 변수의 최소 및 최대 값 주변에서 뚱뚱한 경향이 있음을 알았습니다. 이것은 다음 4 가지 선형 회귀의 도표에서 볼 수 있습니다. 처음에 이것은 예측 변수의 대부분의 값이 예측 변수의 평균에 집중되어 있기 때문이라고 생각했습니다. 그러나 왼쪽 …
GLM (Generalized Linear Model)과 LM (Linear Model)을 사용하는 철학을 이해하려고합니다. 아래에 예제 데이터 세트를 만들었습니다. log(y)=x+εlog(y)=x+ε\log(y) = x + \varepsilon 이 예제에는 크기의 함수로 오류가 없으므로 로그 변환 된 y의 선형 모델이 가장 좋다고 가정합니다. 아래 예제에서는 로그 변환 된 데이터에 대한 LM의 AIC가 가장 낮기 때문에 실제로 그런 경우입니다. …
나는 특이 치에 대한 선형 데이터를 다루고 있는데, 그중 일부는 추정 회귀선에서 5 표준 편차 이상입니다. 이러한 점의 영향을 줄이는 선형 회귀 기술을 찾고 있습니다. 지금까지 내가 한 일은 모든 데이터로 회귀선을 추정 한 다음 매우 큰 제곱 잔차 (예 : 상위 10 %)가있는 데이터 포인트를 버리고 해당 포인트없이 회귀를 …
종속 변수, 종속 변수 및 독립 변수 또는 독립 변수 만 로그 변환인지 해석에 차이가 있는지 궁금합니다. 의 경우를 고려 log(DV) = Intercept + B1*IV + Error IV를 백분율 증가로 해석 할 수 있지만 log(DV) = Intercept + B1*log(IV) + Error 또는 내가있을 때 DV = Intercept + B1*log(IV) + …
겉보기에 평판이 좋은 소스는 종속 변수가 정상적으로 분포되어야한다고 주장합니다. 모형 가정 : 는 정규 분포, 오차는 정규 분포 및 독립적이며 는 고정되어 있으며 상수 분산은 입니다.YYYei∼N(0,σ2)ei∼N(0,σ2)e_i \sim N(0,\sigma^2)XXXσ2σ2\sigma^2 Penn State, STAT 504 불연속 데이터 분석 둘째, 선형 회귀 분석에서는 모든 변수가 다변량 정규이어야합니다. 통계적 해법, 선형 회귀 가정 이것은 반응 …
선형 모델 클래스에서 두 예측 변수가 서로 연관되어 있고 두 예측 변수가 모두 모형에 포함되면 하나는 중요하지 않다는 것을 알게되었습니다. 예를 들어, 집의 크기와 침실 수가 서로 연관되어 있다고 가정하십시오. 이 두 예측 변수를 사용하여 주택 비용을 예측할 때 둘 다 동일한 정보를 많이 제공하기 때문에 그 중 하나를 삭제할 …
다항식 회귀 분석이 비선형 관계를 모델링하는 경우 다중 선형 회귀 분석의 특별한 경우로 간주 할 수있는 방법은 무엇입니까? Wikipedia는 "다항식 회귀 분석은 비선형 모형을 데이터에 적합하지만 통계적 추정 문제로서 회귀 함수 가 데이터로부터 추정 된 미지의 모수에서 선형이라는 점에서 선형 적이라는 점에서 선형 적입니다. "E(y|x)E(y|x)\mathbb{E}(y | x) 모수가 2 인 …
내 상황에 가장 적합한 교차 유효성 검사 방법을 찾으려고합니다. 다음 데이터는 문제를 해결하기위한 예제 (R)이지만 실제 X데이터 ( xmat)는 서로 상관 관계가 있으며 y변수 ( ymat)를 사용하여 다른 정도와 상관 관계가 있습니다. R 코드를 제공했지만 R에 대한 질문이 아니라 메서드에 대한 질문입니다. XmatX 변수 V1-V100을 ymat포함하고 단일 y 변수 를 …
수선화가 다양한 토양 조건에 어떻게 반응하는지 연구하고 있다고 가정 해 봅시다. 토양의 pH와 수선화의 성숙한 높이에 대한 데이터를 수집했습니다. 선형 관계를 기대하고 있으므로 선형 회귀 분석을 실행합니다. 그러나 연구를 시작했을 때 인구가 실제로 두 종류의 수선화를 포함하고 있다는 사실을 알지 못했습니다. 각 수종은 토양 pH에 매우 다르게 반응합니다. 따라서 그래프에는 …