«categorical-data» 태그된 질문

범주 형 (명목이라고도 함) 데이터는 범주라고하는 제한된 수의 값을 취할 수 있습니다. 범주 형 값 "label"은 "측정"되지 않습니다. 불연속이지만 주문 된 데이터 유형에는 [ordinal-data] 태그를 사용하십시오.

1
범주 형 변수와 연속 형 변수 간의 상호 작용 계수 해석
연속 변수와 범주 변수 간의 상호 작용 계수 해석에 대한 질문이 있습니다. 내 모델은 다음과 같습니다. model_glm3=glm(cog~lg_hag+race+pdg+sex+as.factor(educa)+(lg_hag:as.factor(educa)), data=base_708) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 21.4836 2.0698 10.380 < 2e-16 *** lg_hag 8.5691 3.7688 2.274 0.02334 * raceblack -8.4715 1.7482 -4.846 1.61e-06 *** racemexican -3.0483 1.7073 -1.785 0.07469 . …

1
R 선형 회귀 범주 형 변수 "숨김"값
이것은 여러 번 나온 예제 일뿐이므로 샘플 데이터가 없습니다. R에서 선형 회귀 모델 실행 : a.lm = lm(Y ~ x1 + x2) x1연속 변수입니다. x2범주 형이며 "낮음", "중간"및 "높음"의 세 가지 값이 있습니다. 그러나 R이 제공하는 출력은 다음과 같습니다. summary(a.lm) Estimate Std. Error t value Pr(>|t|) (Intercept) 0.521 0.20 1.446 …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

3
더미 변수 트랩 문제
모든 독립 변수 (약 400 개)가 더미 변수 인 큰 OLS 회귀 분석을 실행 중입니다. 모든 것이 포함되면 완벽한 다중 공선 성 (더미 변수 트랩)이 있으므로 회귀를 실행하기 전에 변수 중 하나를 생략해야합니다. 첫 번째 질문은 어떤 변수를 생략해야합니까? 몇 개만있는 것보다는 많은 관측치에있는 변수를 생략하는 것이 좋습니다 (예 : …


4
두 제품을 구별하기위한 통계 테스트 개발
고객 설문 조사에서 얻은 데이터 세트가 있는데 제품 1과 제품 2 사이에 유의 한 차이가 있는지 확인하기 위해 통계 테스트를 배포하려고합니다. 다음은 고객 리뷰 데이터입니다. 비율은 매우 나쁘고, 나쁘고, 좋아요, 아주 좋습니다. customer product1 product2 1 very good very bad 2 good bad 3 okay bad 4 very good okay …

1
개인 문제에 대한 조사 방법
내 통계학자인 친구는 민감한 문제를 다루는 설문 조사에 대한 정직한 응답을 얻는 데 사용되는 흥미로운 기술에 대해 이야기했습니다. 나는 그 방법의 일반적인 요점을 기억하지만, 누군가가 세부 사항을 알고 있는지 그리고 그것이 어디에서나 참조되는지 궁금합니다. 이야기는 플로리다 AMA가 의사들 사이에서 약물 사용을 평가하기를 원했다는 것입니다. 그들은 하나의 주사위로 설문지를 보냈습니다. IIRC, …



2
혼합 모델을위한 파라 메트릭, 세미 파라 메트릭 및 비 파라 메트릭 부트 스트랩
이 기사 에서 다음과 같은 이식편을 가져옵니다 . 부트 스트랩을 사용하고 R boot패키지가있는 선형 혼합 모델을 위해 파라 메트릭, 반 파라 메트릭 및 비 파라 메트릭 부트 스트랩 부트 스트랩을 구현하려고 초보자 입니다. R 코드 내 R코드 는 다음과 같습니다 . library(SASmixed) library(lme4) library(boot) fm1Cult <- lmer(drywt ~ Inoc + …
9 r  mixed-model  bootstrap  central-limit-theorem  stable-distribution  time-series  hypothesis-testing  markov-process  r  correlation  categorical-data  association-measure  meta-analysis  r  anova  confidence-interval  lm  r  bayesian  multilevel-analysis  logit  regression  logistic  least-squares  eda  regression  notation  distributions  random-variable  expected-value  distributions  markov-process  hidden-markov-model  r  variance  group-differences  microarray  r  descriptive-statistics  machine-learning  references  r  regression  r  categorical-data  random-forest  data-transformation  data-visualization  interactive-visualization  binomial  beta-distribution  time-series  forecasting  logistic  arima  beta-regression  r  time-series  seasonality  large-data  unevenly-spaced-time-series  correlation  statistical-significance  normalization  population  group-differences  demography 


1
복잡한 공식없이 Bradley–Terry–Luce 모델을 R에 맞추는 방법은 무엇입니까?
Bradley–Terry–Luce (BTL) 모델은 피j 나는= L O g나는티− 1(δ제이−δ나는)피제이나는=엘영형지나는티−1(δ제이−δ나는)p_{ji} = logit^{-1}(\delta_j - \delta_i), 어디 피나는 j피나는제이p_{ij} 그 물체는 확률입니다 제이제이j 물체보다 "더 나은", 더 무거운 것으로 판단 나는나는i, δ나는δ나는\delta_i, δ제이δ제이\delta_j 매개 변수입니다. 이것은 family = binomial 인 glm 함수의 후보 인 것 같습니다. 그러나 공식은 "성공 ~ S1 + S2 …

4
n-1 변수를 사용하여 더미 변수를 구현하는 방법은 무엇입니까?
4 레벨의 변수가있는 경우 이론적으로 3 개의 더미 변수를 사용해야합니다. 실제로 이것은 실제로 어떻게 수행됩니까? 0-3을 사용합니까, 1-3을 사용하고 4를 비워 두나요? 어떤 제안? 참고 : 저는 R에서 일할 것입니다. 업데이트 : AD에 해당하는 1-4를 사용하는 열을 하나만 사용하면 어떻게됩니까? 작동하거나 문제가 발생합니까?


3
랜덤 효과는 범주 형 변수에만 적용 할 수 있습니까?
이 질문은 어리석은 것처럼 들릴 수 있지만 ... 랜덤 효과가 범주 형 변수 (예 : 개별 id, 모집단 id 등) 에만 적용될 수 있다는 것이 맞 습니까?엑스나는xix_i 범주 형 변수입니다. 와이나는y나는y_i ~ β엑스나는βx나는\beta_{x_i} β엑스나는βx나는\beta_{x_i} ~ 엔o r m ( μ ,δ2)엔영형아르 자형미디엄(μ,δ2)Norm(\mu, \delta^2) 그러나 원칙적으로 무작위 효과는 연속 변수 (높이, …

2
2 x 2 비 상표에 대한 Yates 연속성 수정
2 x 2 비상 테이블의 Yates 연속성 수정에 대한 필드의 사람들로부터 입력을 수집하고 싶습니다. Wikipedia 기사 는 너무 멀리 조정되어 제한된 의미로만 사용된다고 언급했습니다. 여기에 관련 게시물이 훨씬 더 통찰력을 제공하지 않습니다. 이 테스트를 정기적으로 사용하는 사람들에게 당신의 생각은 어떻습니까? 수정을 사용하는 것이 좋습니까? 그리고 95 % 신뢰 수준에서 다른 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.