«separation» 태그된 질문

범주 형 결과의 일부 클래스가 다른 변수의 선형 조합에 의해 완벽하게 구별 될 수있는 경우 분리가 발생합니다.

8
로지스틱 회귀 분석에서 완벽한 분리를 처리하는 방법은 무엇입니까?
대상 변수에서 0과 1을 완벽하게 분리하는 변수가있는 경우 R은 다음과 같은 "완벽 또는 준 완벽 분리"경고 메시지를 생성합니다. Warning message: glm.fit: fitted probabilities numerically 0 or 1 occurred 우리는 여전히 모델을 얻지 만 계수 추정치는 팽창됩니다. 실제로 이것을 어떻게 처리합니까?

1
R의 로지스틱 회귀는 완벽한 분리 (Hauck-Donner 현상)를 초래했습니다. 이제 뭐?
50 개의 연속 설명 변수를 사용하여 이진 결과를 예측하려고합니다 (대부분의 변수 범위는 ~ ). 내 데이터 세트에는 거의 24,000 개의 행이 있습니다. 내가 실행하면 R에, 내가 얻을 :−∞−∞-\infty∞∞\inftyglm Warning messages: 1: glm.fit: algorithm did not converge 2: glm.fit: fitted probabilities numerically 0 or 1 occurred 완벽한 분리가 발생할 수 있음을 …

2
로지스틱 회귀 모델이 수렴되지 않습니다
항공사 항공편에 대한 데이터가 있는데 (데이터 프레임 flights) 비행 시간이 도착이 상당히 지연 될 확률 (10 분 이상)에 영향을 미치는지 확인하고 싶습니다. 나는 비행 시간을 예측 자로 사용하고 각 비행이 응답으로 상당히 지연되었는지 (베르누이 무리) 여부와 함께 로지스틱 회귀 분석을 사용할 것이라고 생각했습니다. 다음 코드를 사용했습니다 ... flights$BigDelay <- flights$ArrDelay …
39 r  logistic  separation 


1
차원 에서 임의의 점이 선형으로 분리 될 확률은 얼마입니까?
각각 특징을 갖는 데이터 점이 주어지면 는 으로 표시되고 다른 는 로 표시됩니다 . 각 피처는 임의로 값을받습니다 (균일 분포). 두 클래스를 나눌 수있는 초평면이 존재할 확률은 얼마입니까?nnndddn/2n/2n/2000n/2n/2n/2111[0,1][0,1][0,1] 가장 쉬운 경우를 먼저 고려하십시오 (예 : .d=1d=1d = 1

1
Firth 로지스틱 회귀 분석을 통한 모델 선택
내가 작업하고 있는 작은 데이터 세트 ( )에서 여러 변수가 완벽한 예측 / 분리를 제공 합니다. 따라서 Firth 로지스틱 회귀 를 사용하여 문제를 해결합니다.n∼100n∼100n\sim100 AIC 또는 BIC에 의해 최상의 모델을 선택할 경우 이러한 정보 기준을 계산할 때 Firth 페널티 항을 가능성에 포함시켜야합니까?

1
왜 로지스틱 회귀가 완벽한 분리 사례에서 작동하지 않는지에 대한 직관적 인 설명이 있습니까? 왜 정규화를 추가하면 문제가 해결됩니까?
로지스틱 회귀 분석에서 완벽한 분리에 대한 많은 토론이 있습니다. 예를 들어 R의 로지스틱 회귀는 완벽한 분리 (Hauck-Donner 현상)를 초래했습니다. 이제 뭐? 및 로지스틱 회귀 모델은 수렴하지 않습니다 . 개인적으로 여전히 문제가되는 이유와 정규화를 추가하면 문제가 해결되는 것은 직관적이지 않다고 생각합니다. 애니메이션을 만들어서 도움이 될 것이라고 생각합니다. 따라서 자신의 질문을 게시하고 …

3
서포트 벡터 머신 및 하이퍼 플레인에 대한 직감
내 프로젝트에서 이진 분류 (1 또는 0)를 예측하기위한 로지스틱 회귀 모델을 만들고 싶습니다. 나는 15 개의 변수를 가지고 있는데 그중 2 개는 범주 형이며 나머지는 연속 형과 이산 형 변수가 혼합되어 있습니다. 로지스틱 회귀 모델에 맞추기 위해 SVM, 퍼셉트론 또는 선형 프로그래밍을 사용하여 선형 분리 성을 확인하는 것이 좋습니다. 제안 …

1
GBM 패키지와 GBM을 사용하는 Caret
을 사용하여 모델 튜닝을 수행 caret했지만 gbm패키지를 사용하여 모델을 다시 실행했습니다 . caret패키지가 사용 gbm하고 출력이 동일해야한다는 것을 이해합니다 . 그러나 data(iris)RMSE와 R ^ 2를 평가 지표로 사용하면 약 5 %의 모델에서 불일치가 발생합니다. 부분 종속성 플롯을 사용 하기 위해 최적의 모델 성능을 찾고 caret싶지만 다시 실행 하고 싶습니다 gbm. …

1
Firth Logistic Regression의 이론적 이해 추구
Firth 로지스틱 회귀 분석 (로지스틱 회귀 분석에서 완전 / 완전 또는 준-완전 분리를 처리하는 방법)을 이해하려고하므로 다른 사람들에게 단순화 된 용어로 설명 할 수 있습니다. 누구든지 Firth 추정이 MLE에 어떤 수정을했는지에 대한 간단한 설명이 있습니까? 나는 최선을 다해 Firth (1993)를 읽었으며 점수 함수에 수정이 적용되고 있음을 이해합니다. 나는 교정의 기원과 …

1
전체 성공을 가진 범주 형 변수가있는 이항 glmm
이항 반응 변수와 범주 형 예측 변수로 glmm을 실행하고 있습니다. 무작위 효과는 데이터 수집에 사용 된 중첩 디자인에 의해 제공됩니다. 데이터는 다음과 같습니다. m.gen1$treatment [1] sucrose control protein control no_injection ..... Levels: no_injection control sucrose protein m.gen1$emergence [1] 1 0 0 1 0 1 1 1 1 1 1 0 …

1
R / mgcv : te () 및 ti () 텐서 제품이 다른 표면을 생성하는 이유는 무엇입니까?
mgcv에 대한 패키지는 R텐서 제품의 상호 작용을 피팅에 대한 두 가지 기능이 있습니다 : te()와 ti(). 나는 둘 사이의 기본 노동 분열을 이해한다 (비선형 상호 작용에 적합하고이 상호 작용을 주요 효과와 상호 작용으로 분해). 내가 이해할 수없는 것은 왜 te(x1, x2)와 ti(x1) + ti(x2) + ti(x1, x2)(약간) 다른 결과가 발생할 …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 

1
로지스틱 회귀 분석의 거대한 계수-의미와 수행 할 작업
로지스틱 회귀 분석 중에 거대한 계수를 얻습니다 krajULKV. > summary(m5) Call: glm(formula = cbind(ml, ad) ~ rok + obdobi + kraj + resid_usili2 + rok:obdobi + rok:kraj + obdobi:kraj + kraj:resid_usili2 + rok:obdobi:kraj, family = "quasibinomial") Deviance Residuals: Min 1Q Median 3Q Max -2.7796 -1.0958 -0.3101 1.0034 2.8370 Coefficients: Estimate …
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.