«regression» 태그된 질문

하나 이상의 "종속"변수와 "독립"변수 간의 관계를 분석하는 기술.

1
선형 모형으로 일반적인 통계 검정
(업데이트 : 나는 이것에 대해 더 깊이 빠져들고 결과를 여기에 게시했습니다 ) 명명 된 통계 테스트 목록은 엄청납니다. 많은 일반적인 테스트는 간단한 선형 모델의 추론에 의존합니다. 예를 들어 1- 표본 t- 테스트는 y = β + ε입니다. 이는 null 모델 y = μ + ε 에 대해 테스트됩니다. 즉, β …

3
회귀 오차 항이 설명 변수와 어떻게 연관 될 수 있습니까?
이 중 첫 번째 문장 위키 "설명 변수가 에러 항과 상관 될 때 경제학에서, 내 생성의 문제가 발생한다. 것이 페이지 청구항 1 " 내 질문은 어떻게 이런 일이 일어날 수 있습니까? 오류 항이 설계 행렬의 열 공간과 직교하도록 회귀 베타를 선택하지 않았습니까?
22 regression 

9
신경망 예측의 신뢰도를 결정하는 방법은 무엇입니까?
내 질문을 설명하기 위해 입력에 잡음이 있지만 출력이없는 훈련 세트가 있다고 가정하십시오. # Training data [1.02, 1.95, 2.01, 3.06] : [1.0] [2.03, 4.11, 5.92, 8.00] : [2.0] [10.01, 11.02, 11.96, 12.04] : [1.0] [2.99, 6.06, 9.01, 12.10] : [3.0] 여기서 출력은 노이즈가없는 경우 (실제 그래디언트가 아닌) 입력 어레이의 그래디언트입니다. 네트워크를 …

2
가중 최소 제곱 회귀에 대한 가중치는 어떻게 찾습니까?
나는 WLS 회귀 과정에서 약간 길을 잃었다. 나는 데이터 세트를 받았으며 내 임무는 이분산성이 있는지 테스트하고 그렇다면 WLS 회귀를 실행해야합니다. 테스트를 수행하고 이분산성에 대한 증거를 찾았으므로 WLS를 실행해야합니다. WLS는 기본적으로 변환 된 모델의 OLS 회귀라고 들었지만 변환 함수를 찾는 데 약간 혼란 스럽습니다. 나는 변환이 OLS 회귀에서 제곱 잔차의 함수가 …

3
심슨의 역설 이해하기 : 성별과 신장에 대한 회귀 소득을 가진 앤드류 겔먼의 사례
최근 블로그 게시물 중 하나 에서 Andrew Gelman 은 다음과 같이 말합니다. 나는 심슨의 역설에 반의 상이나 잠재적 인 결과가 필요하다고 생각하지 않는다. 나는 조작 할 수 없거나 조작이 직접 관심이없는 변수로 심슨의 역설을 설정할 수 있기 때문에 이것을 말합니다. Simpson의 역설은 예측 변수를 더 추가하면 회귀 계수가 변경되는 일반적인 …

2
회귀 분석의 Wald 테스트 (OLS 및 GLM) : t- vs. z- 분포
회귀 계수에 대한 Wald 검정은 무증상으로 유지되는 다음 특성을 기반으로한다는 것을 이해합니다 (예 : Wasserman (2006) : All of Statistics , 153, 214-215) : 여기서 는 추정 회귀 계수, 은 회귀 계수의 표준 오차를 나타내고 은 관심 값입니다 ( 은 계수가 0과 크게 다릅니다. 크기 그래서 월드 테스트는 다음과 같습니다 …

3
Lars와 Glmnet은 왜 Lasso 문제에 대해 다른 솔루션을 제공합니까?
R 패키지 Lars와 GlmnetLasso 문제를 해결하는 데 사용되는 R 패키지를 더 잘 이해하고 싶습니다 . ( 변수 및 샘플의 경우, 참조 www.stanford.edu/~hastie/Papers/glmnet.pdf를 ) 3 페이지pN해요 난 N( β0β) ∈ Rp + 1[ 12 N∑나는 = 1엔( y나는− β0− x티나는β)2+ λ | | β| |엘1]엠나는엔(β0β)∈아르 자형피+1[12엔∑나는=1엔(와이나는−β0−엑스나는티β)2+λ||β||엘1]min_{(\beta_0 \beta) \in R^{p+1}} \left[\frac{1}{2N}\sum_{i=1}^{N}(y_i-\beta_0-x_i^T\beta)^2 + …

5
회귀 분석에서 불균형 데이터 샘플링
분류 컨텍스트 에서 불균형 데이터 처리에 대한 좋은 질문이 있었지만 회귀 분석을 위해 사람들이 무엇을하는지 궁금합니다. 문제 영역이 부호에 매우 민감하지만 목표의 크기에만 다소 민감하다고 가정하십시오. 그러나 크기는 분류가 아닌 회귀 (연속 목표) 여야합니다 (양성 클래스와 음수 클래스). 그리고이 문제 영역에서 모든 훈련 데이터는 긍정적 인 목표보다 10 배 더 …

5
원시 또는 직교 다항식 회귀 분석?
변수 를 로 되돌리고 싶습니다 . 원시 다항식 또는 직교 다항식을 사용하여이 작업을 수행해야합니까? 나는 이것들을 다루는 사이트에서 질문을 보았지만 그것들을 사용하는 것의 차이점이 무엇인지 실제로 이해하지 못한다. 와이와이yx , x2, ... , x5엑스,엑스2,…,엑스5x,x^2,\ldots,x^5 왜 난 그냥 계수를 얻기 위해 "정상"회귀 할 수 없습니다 의β나는β나는\beta_iy=∑5i=0βixi와이=∑나는=05β나는엑스나는y=\sum_{i=0}^5 \beta_i x^i (P-값과 다른 모든 …

1
one-hot 인코딩을 사용할 때 열 중 하나를 삭제
기계 학습에서 동일한 정보를 효과적으로 인코딩하기 때문에 데이터 세트에 상관 관계가 높은 기능이 있으면 문제가 될 수 있습니다. 최근 누군가 범주 형 변수에 대해 원핫 인코딩을 수행하면 관련 기능이 생겨서 그 중 하나를 "참조"로 삭제해야한다고 지적했습니다. 예를 들어 성별을 두 변수로 인코딩하면 is_male과 is_female음의 상관 관계를 갖는 두 가지 기능이 …

4
상관 관계의 기본 가정과 유의성 회귀 기울기 검정의 차이
내 질문은 다른 질문 에 대한 의견에서 @whuber와의 토론에서 자랐습니다 . 구체적으로 @whuber의 의견은 다음과 같습니다. 놀랍게도 한 가지 이유는 상관 관계 테스트와 회귀 기울기 테스트의 기본 가정이 다르기 때문에 상관 관계와 기울기가 실제로 같은 것을 측정한다는 것을 이해하더라도 p- 값이 동일한 이유는 무엇입니까? 이것은 과 가 수치 적으로 같아야하는 …

1
상자와 수염이 같은 Anscombe와 유사한 데이터 세트 (평균 / 표준 / 중앙 / MAD / 최소 / 최대)
편집 :이 질문이 팽창함에 따라 요약 : 동일한 혼합 통계 (평균, 중간, 중간 범위 및 관련 분산 및 회귀)로 다른 의미 있고 해석 가능한 데이터 집합 찾기 Anscombe 중주 (참조 ? 고차원 데이터를 시각화 목적 ) 네의 유명한 예는 - (네에서 동일한 한계 평균 / 표준 편차, 데이터 집합 4 …

2
불균형 데이터에 대한 로지스틱 회귀에 가중치 추가
불균형 데이터 (9 : 1)로 로지스틱 회귀를 모델링하려고합니다. glmR 의 함수에서 가중치 옵션을 시도하고 싶었지만 100 % 확실하지 않습니다. 내 출력 변수가 c(0,0,0,0,0,0,0,0,0,1)입니다. 이제 "1"의 무게를 10 배 더 늘리고 싶습니다. 그래서 가중치 인수를 제공합니다 weights=c(1,1,1,1,1,1,1,1,1,1,1,10). 그렇게하면 최대 가능성을 계산할 때 고려됩니다. 내가 맞아? "1"의 오 분류는 "0"의 오 분류보다 …

2
회귀선 추정의 목적으로 잔차의 정규성이 왜“거의 중요하지 않은가?”
Gelman and Hill (2006)은 p46에 다음과 같이 썼다. 일반적으로 가장 중요하지 않은 회귀 가정은 오류가 정규 분포되어 있다는 것입니다. 실제로 회귀선을 추정하기 위해서는 (개별 데이터 요소를 예측하는 것과 비교하여) 정규성의 가정이 전혀 중요하지 않습니다. 따라서 많은 회귀 교과서와 달리 회귀 잔차의 정규성을 진단하는 것은 권장하지 않습니다. Gelman과 Hill은이 점을 더 …


당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.