«data-transformation» 태그된 질문

종종 비선형 인 데이터 값의 수학적 재 표현. 데이터는 종종 통계 모델의 가정을 충족 시키거나 분석 결과를보다 해석하기 쉽도록 변환합니다.

4
통계에서 데시벨 사용
나는 RFID 태그를 읽고 안테나 구성 (안테나 수, 위치 등)을 변경할 때 독자가 보는 신호 강도를 비교하는 프로젝트를 진행하고 있습니다. 프로젝트의 일환으로 설정을 비교하여 가장 효과적인 것을 확인해야합니다. 이상적으로, 나는 Unpaired t-Test 또는 두 안테나 위치 사이의 분산 분석 (또는 다중 사이의 MANOVA)을 수행 할 수 있습니다. 그러나 응답이 로그인 …

2
바틀렛 테스트 대 레벤 테스트
현재 분산 분석 가정에 대한 위반을 해결하려고합니다. 나는 Shapiro-Wilk를 사용하여 정규성을 테스트했으며 Levene의 검정과 Bartlett의 분산 평등 검정을 모두 다루었습니다. 이후 로그가 불균형 분산을 시도하고 수정하기 위해 데이터를 변환했습니다. 나는 로그 변환 된 데이터에 대한 Bartlett의 테스트를 다시 수행했지만 여전히 중요한 p- 값을 받았으며 호기심으로 Levene의 테스트를 실행하여 중요하지 않은 …


3
P, LSD, MSD, HSD, CI를 SE로 변환하기위한 이러한 공식이 의 정확하거나 부풀려진 / 보수적 인 추정값으로 맞습니까?
배경 이전에 게시 된 데이터가 포함 된 메타 분석을 수행하고 있습니다. 종종, 치료 간의 차이는 P- 값, 최하위 차이 (LSD) 및 기타 통계로보고되지만 분산의 직접적인 추정치는 제공하지 않습니다. 내가 사용하는 모델과 관련하여 과대 평가의 분산은 괜찮습니다. 문제 다음은 제가 고려하고 있는 (Saville 2003)의 로의 변환 목록입니다 . 아래에서는 이므로 이며 …

3
첨도에 영향을주지 않고 왜곡을 변화시키는 변형?
첨도에 영향을 미치지 않고 임의 변수의 왜곡을 변경하는 변환이 있는지 궁금합니다. 이것은 RV의 아핀 변환이 평균과 분산에 어떻게 영향을 미치나, 왜도 및 첨도에는 영향을 미치지 않는 것과 유사합니다 (부분적으로는 삐와 첨도는 규모의 변화에 ​​불변으로 정의되기 때문에). 이것은 알려진 문제입니까?

1
역변환 된 신뢰 구간
건너면서 이 토론 나는 다시 변환 된 신뢰 구간 규칙에 의문을 제기하고있다. 이 기사 에 따르면 로그 정규 확률 변수의 평균에 대한 공칭 적용 범위 역변환 CI는 다음과 같습니다. LCL(X)=exp(Y+var(Y) 유씨L ( X) = exp( Y+ var ( Y)2+ zvar ( Y)엔+ var ( Y)22 ( n - 1 )−−−−−−−−−−−−√) …

1
비정상적으로 제한된 반응 변수의 회귀 처리
이론적으로 -225와 +225 사이에 묶인 응답 변수를 모델링하려고합니다. 변수는 게임을 할 때 피험자가 얻은 총 점수입니다. 이론적으로는 피험자들이 +225를 득점하는 것이 가능합니다. 그럼에도 불구하고 점수는 주체의 행동뿐만 아니라 다른 사람의 행동에 따라 달라졌 기 때문에 최대 득점 한 사람은 모두 최대 125 명이었습니다 (이것은 서로 점수를 매길 수있는 최고 2 …

2
로지스틱 회귀 분석을위한 연속 변수 변환
큰 설문 조사 데이터, 이진 결과 변수 및 이진 및 연속을 포함한 많은 설명 변수가 있습니다. 모델 세트를 구축하고 (GLM과 혼합 GLM을 모두 사용하여 실험) 정보 이론적 접근 방식을 사용하여 최상위 모델을 선택합니다. 상관 관계에 대한 설명 (연속적 및 범주 적)에 대한 설명을주의 깊게 검사했으며 피어슨 또는 피 코르 계수가 …

2
R에서 요인에서 숫자 변수로 변환하는 중 문제 발생
닫은. 이 질문은 주제에 맞지 않습니다 . 현재 답변을받지 않습니다. 이 질문을 개선하고 싶습니까? 교차 검증에 대한 주제가 되도록 질문을 업데이트하십시오 . 휴일 칠년 전에 . 요인 변수를 숫자로 변환하고 싶지만 as.numeric기대 효과가 없습니다. 아래는 원래 변수를 기반으로 한 숫자 버전의 변수에 대한 요약 통계를 얻습니다. 수단은 1까지 계속 카운트합니다 …

2
매우 비뚤어진 카운트 데이터의 클러스터링 : 수행 할 제안 (변환 등)이 있습니까?
기본 문제 기본 문제는 다음과 같습니다. 매우 치우친 변수가 포함 된 데이터 세트를 개수로 묶으려고합니다. 변수는 많은 0을 포함하므로 클러스터링 절차에 대한 정보가 많지 않습니다. k- 평균 알고리즘 일 가능성이 큽니다. 예를 들어, 제곱근, 박스 콕스 또는 로그를 사용하여 변수를 변환하면됩니다. 그러나 내 변수는 범주 형 변수를 기반으로하기 때문에 변수를 …

4
주요 관심 대상이 아닌 모든 변수를 로그 변환하지 않는 이유는 무엇입니까?
책과 토론에는 종종 예측 변수에 문제가있을 때 (몇 가지가 있음) 로그 변환이 가능하다는 내용이 있습니다. 저는 이것이 분포에 의존하고 예측 변수의 정규성은 회귀의 가정이 아니라는 것을 이해합니다. 그러나 로그 변환은 데이터의 균일 성을 높이고 특이 치의 영향을 덜받습니다. 나는 주요 interesr가 아닌 모든 연속 변수, 즉 내가 조정하는 변수를 로그 …

2
역 독립 변수를 사용한 회귀
종속 변수 의 벡터 와 독립 변수 의 벡터 가 있다고 가정 해 봅시다 . 가 에 대해 그려 질 때 , 둘 사이에 선형 관계 (상향 추세)가 있음을 알 수 있습니다. 이제 이것은 또한 와 사이에 선형 하향 추세가 있음을 의미합니다 .Y N X Y 1NNNYYYNNNXXXYYY YX1X1X\frac{1}{X}YYYXXX 이제 회귀 …

3
American Community Survey 다양성 데이터의 가중치를 재조정하면 오류 한계에 어떤 영향을 미칩니 까?
배경 : 저의 조직은 현재 미국 사회 조사 (미국 인구 조사국의 조사 프로젝트)를 기반으로하는 인력 다양성 통계 (예 : 장애인 %, 여성 %, 재향 군인 %)를 해당 그룹의 총 노동력 가용성과 비교합니다. 우리는 노동 인구와는 다른 인구 통계를 가진 매우 구체적인 직업 세트를 가지고 있기 때문에 이것은 부정확 한 벤치 …

1
종속 변수를 로그 변환했습니다. LOG 링크 기능과 함께 GLM 정규 분포를 사용할 수 있습니까?
GLM (Generalized Linear Models)과 관련하여 질문이 있습니다 .DV (종속 변수)는 연속적이고 정상이 아닙니다. 그래서 로그를 변환했습니다 (여전히 정상은 아니지만 개선되었습니다). DV를 두 가지 범주 형 변수와 하나의 연속 공변량과 관련시키고 싶습니다. 이를 위해 GLM (SPSS를 사용하고 있음)을 수행하려고하지만 선택할 배포 및 기능을 결정하는 방법을 잘 모르겠습니다. Levene의 비모수 검정을 수행했으며 …

1
ARIMA 모델의 관측치 48에서 혁신적인 특이 치를 어떻게 통합합니까?
데이터 세트를 작업 중입니다. 일부 모델 식별 기술을 사용한 후 ARIMA (0,2,1) 모델을 만들었습니다. R detectIO의 패키지 TSA에 있는 함수를 사용하여 48 번째 원본 데이터 세트에서 혁신적인 이상치 (IO) 를 감지했습니다 . 이 특이 치를 내 모델에 어떻게 통합하여 예측 목적으로 사용할 수 있습니까? R에서 예측할 수 없기 때문에 ARIMAX …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.