«regression» 태그된 질문

하나 이상의 "종속"변수와 "독립"변수 간의 관계를 분석하는 기술.

4
다중 회귀 분석에 대한 잔차 대 적합치 그림의 대각선 직선
데이터의 잔차에서 이상한 패턴이 관찰됩니다. [편집] 다음은 두 변수에 대한 부분 회귀 그림입니다. [EDIT2] PP 플롯 추가 배포판이 제대로 작동하는 것 같지만 (아래 참조)이 직선이 어디에서 오는지 전혀 모르겠습니다. 어떤 아이디어? [업데이트 31.07] 그것은 당신이 절대적으로 옳은 것으로 나타났습니다, 나는 리트 윗 수가 실제로 0 인 경우를 가지고 있었고 ~ …

2
간단한 선형 회귀 분석 결과 : 어떤 정보를 포함해야합니까?
방금 Genstat에서 (아주) 간단한 선형 회귀를 수행했으며 보고서에 간결하고 의미있는 결과 요약을 포함하고 싶습니다. 정확히 어떤 정보를 포함해야하는지 잘 모르겠습니다. 내 Genstat 출력의 주요 비트는 다음과 같습니다. Summary of analysis Source d.f. s.s. m.s. v.r. F pr. Regression 1 8128935. 8128935. 814.41 <.001 Residual 53 529015. 9981. Total 54 8657950. …

1
GLM에 어떤 종류의 잔차와 쿡 거리가 사용됩니까?
쿡의 거리 공식이 무엇인지 아는 사람이 있습니까? 원래 Cook의 거리 공식은 학생 화 된 잔차를 사용하지만 R이 표준을 사용하는 이유는 무엇입니까? GLM에 대한 Cook의 거리 플롯을 계산할 때 Pearson 잔차가 발생합니다. 학생 화 된 잔차가 GLM에 대해 정의되지 않았지만 Cook의 거리를 계산하는 공식은 어떻게 생겼습니까? 다음 예제를 가정하십시오. numberofdrugs <- …

1
제한된 입방 스플라인과 페널티 스플라인은 어떻게 다릅니 까?
다양한 회귀 문제에서 스플라인 사용에 대해 많이 읽고 있습니다. 일부 책 (예 : Hodges Richly Parrameterized Linear Models )은 불이익 스플라인을 권장합니다. 다른 사람 (예 : Harrell Regression Modeling Strategies )은 제한된 입방 스플라인을 선택합니다. 실제로 이것들은 얼마나 다른가? 하나 또는 다른 것을 사용하여 종종 실질적으로 다른 결과를 얻습니까? 하나 …

1
"먼저 스파 스"라는 용어는 (FBProphet Paper)를 의미합니까?
"예측 규모 예측"(FBProphet 예측 도구, https://peerj.com/preprints/3190.pdf 참조 )을 읽으면서 나는 "먼저 스파 스"라는 용어를 발견했습니다. 저자 는 로지스틱 성장 모델의 모델 매개 변수 인 스칼라 비율 에서 속도 편차 벡터를 모델링 할 때 이러한 "스파 스 이전"을 사용했다고 설명합니다 .δδ\mathbf{\delta}kkk 그들이 라고 말하면서, 매개 변수 가 작 으면 "sparse"가 0에 …

1
R의 각 예측에 대해 회귀에서 신뢰 점수 (임의의 포리스트 / XGBoost 포함)를 계산하는 방법은 무엇입니까?
Random Forests 또는 Extreme Gradient Boosting (XGBoost)과 같은 알고리즘을 사용할 때 각 예측 값에 대한 신뢰 점수를 얻는 방법이 있습니까? 이 신뢰 점수의 범위는 0에서 1까지이며 특정 예측에 대해 내가 얼마나 확신하는지 보여 줍니다 . 인터넷에서 신뢰에 대해 찾은 것에서 일반적으로 간격으로 측정됩니다. 다음은 라이브러리의 confpred함수를 사용하여 계산 된 신뢰 …

3
one-hot 인코딩과 더미 인코딩의 문제
k 레벨의 범주 변수가 더미 인코딩에서 k-1 변수로 인코딩되어야한다는 사실을 알고 있습니다 (다중 값 범주 변수의 경우와 유사). 다른 회귀 방법, 주로 선형 회귀, 페널티 선형 회귀 (Lasso, Ridge, ElasticNet), 트리 기반 (임의 포리스트) , 그래디언트 부스팅 머신). 선형 회귀에서 다중 공선 성 문제가 발생한다는 것을 알고 있습니다 (실제로 아무런 …

3
단계적 회귀의 장점은 무엇입니까?
나는 문제에 대한 접근 방식의 다양성을 위해 단계적 회귀를 실험하고 있습니다. 그래서 두 가지 질문이 있습니다. 단계적 회귀의 장점은 무엇입니까? 구체적인 강점은 무엇입니까? 단계적 회귀를 사용하여 피처를 선택한 다음 선택한 모든 피처를 함께 가져 오는 규칙적인 회귀를 적용하는 하이브리드 접근 방식에 대해 어떻게 생각하십니까?

2
증분 가우스 프로세스 회귀
스트림을 통해 하나씩 도착하는 데이터 포인트 위에 슬라이딩 창을 사용하여 증분 가우시안 프로세스 회귀를 구현하고 싶습니다. 하자 입력 공간의 차원을 나타낸다. 따라서, 모든 데이터는 지적 갖는 원소의 수.dddxixix_iddd 슬라이딩 윈도우의 크기를 이라고하자 .nnn 예측을하기 위해 그램 행렬 의 역수를 계산해야합니다 . 여기서 이고 k는 제곱 지수 커널입니다.KKKKij=k(xi,xj)Kij=k(xi,xj)K_{ij} = k(x_i, x_j) …



1
선형 회귀 분석의 정규성 가정
선형 회귀의 가정으로, 오차 분포의 정규성은 때때로 "확장"되거나 y 또는 x의 정규성이 필요하다고 해석됩니다. X와 Y가 비정규이지만 오차항이 존재하여 얻어진 선형 회귀 추정값이 유효한 시나리오 / 데이터 세트를 구성 할 수 있습니까?

1
커널 릿지 회귀 효율
릿지 회귀는 여기서 는 예측 된 레이블입니다. , , 매트릭스를 식별 우리가 레이블을 찾기 위해 노력하고있는 객체와 의 매트릭스 객체 :y^=(X′X+aId)−1Xxy^=(X′X+aId)−1Xx\hat{y} = (\mathbf{X'X} + a\mathbf{I}_d)^{-1}\mathbf{X}xy^y^\hat{y}IdId\mathbf{I}_dd×dd×dd \times dxx\mathbf{x}XX\mathbf{X}n×dn×dn \times dnnnxi=(xi,1,...,xi,d)∈Rdxi=(xi,1,...,xi,d)∈Rd\mathbf{x}_i = (x_{i,1}, ..., x_{i,d})\in \mathbb{R}^d X=⎛⎝⎜⎜⎜⎜⎜x1,1x2,1⋮xn,1x1,2x2,2⋮x1,2……⋱…x1,dx2,d⋮xn,d⎞⎠⎟⎟⎟⎟⎟X=(x1,1x1,2…x1,dx2,1x2,2…x2,d⋮⋮⋱⋮xn,1x1,2…xn,d) \mathbf{X} = \begin{pmatrix} x_{1,1} & x_{1,2} & \ldots & x_{1,d}\\ x_{2,1} & x_{2,2} & \ldots …

2
그룹화 된 데이터의 임의 포리스트
계층 적 구조를 갖는 고차원 그룹화 된 데이터 (50 개의 숫자 입력 변수)에 임의 포리스트를 사용하고 있습니다. 70 개의 서로 다른 개체의 30 개 위치에서 6 개의 복제로 데이터를 수집하여 12600 개의 데이터 포인트를 생성했으며, 이는 독립적이지 않습니다. oob 오류는 훈련 중에 하나의 개체에서 데이터를 남기고 훈련 된 임의의 포리스트로 …

4
오차가 정규 분포를 따르지 않는 경우 최소 제곱 법과 최대 가능성 회귀 분석법이 다른 이유는 무엇입니까?
제목은 모든 것을 말합니다. 최소 오차와 최대 확률은 모형의 오차가 정규 분포를 따르는 경우 회귀 계수에 대해 동일한 결과를 제공한다는 것을 이해합니다. 그러나 오류가 정상적으로 분포되지 않으면 어떻게됩니까? 두 방법이 더 이상 동일하지 않은 이유는 무엇입니까?

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.