«skewness» 태그된 질문

왜도는 변수 분포의 비대칭 정도를 측정합니다.

3
로그 변환 예측 변수 및 / 또는 응답의 해석
종속 변수, 종속 변수 및 독립 변수 또는 독립 변수 만 로그 변환인지 해석에 차이가 있는지 궁금합니다. 의 경우를 고려 log(DV) = Intercept + B1*IV + Error IV를 백분율 증가로 해석 할 수 있지만 log(DV) = Intercept + B1*log(IV) + Error 또는 내가있을 때 DV = Intercept + B1*log(IV) + …
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 


6
누군가는 왜도는 0이지만 대칭이 아닌 단봉 분포의 예를 제공 할 수 있습니까?
2010 년 5 월 위키 백과 사용자 인 Mcorazao 는 "이 값이 0이면 값이 평균의 양쪽에 비교적 고르게 분포되어 있지만 반드시 대칭 분포를 암시하지는 않는다" 는 문장을 왜곡 기사에 추가했습니다 . 그러나 위키 페이지에는이 규칙을 위반하는 실제 배포 예제가 없습니다. 인터넷 검색 "비대칭 분포가 0 인 비대칭 분포의 예"는 적어도 …


3
R : 데이터 집합에 NaN이 없어도 "외부 함수 호출"오류에서 NaN / Inf를 발생시키는 임의 포리스트 [닫기]
캐럿을 사용하여 데이터 세트에 대해 교차 유효성 검사 임의 포리스트를 실행하고 있습니다. Y 변수는 요인입니다. 내 데이터 세트에 NaN, Inf 또는 NA가 없습니다. 그러나 임의의 포리스트를 실행하면 Error in randomForest.default(m, y, ...) : NA/NaN/Inf in foreign function call (arg 1) In addition: There were 28 warnings (use warnings() to see …

3
치우친 분포에 대한 이상치 탐지
데이터 점으로서의 특이점에 대한 고전적인 정의에서 상하 사 분위의 1.5 * IQR을 능가하는 경우 비대칭 분포가 가정됩니다. 기울어 진 분포 (지수, 포아송, 기하 등)의 경우 원래 함수의 변환을 분석하여 특이 치를 탐지하는 가장 좋은 방법은 무엇입니까? 예를 들어 지수 분포가 느슨하게 분포 된 분포는 로그 함수로 변환 할 수 있습니다.이 …

2
테스트 세트와 트레이닝 세트의 분포 차이를 처리하는 방법은 무엇입니까?
머신 러닝이나 파라미터 추정의 기본 가정 중 하나는 보이지 않는 데이터가 훈련 세트와 동일한 분포에서 나온다고 생각합니다. 그러나 실제 사례의 경우 테스트 세트의 분포가 훈련 세트와 거의 다릅니다. 제품 설명을 약 17,000 개의 클래스로 분류하려는 대규모 다중 분류 문제가 있다고 가정 해보십시오. 훈련 세트는 수업에 치우친 수업이 있기 때문에 일부 …

4
데이터 분포가 대칭인지 확인하는 방법
중간 값과 평균이 거의 같으면 대칭 분포가 있음을 의미하지만이 특별한 경우 확실하지 않습니다. 평균과 중앙값은 상당히 가깝고 (0.487m / 갤런 차이) 대칭 분포가 있다고 말하지만 박스 플롯을 보면 약간 긍정적으로 치우친 것처럼 보입니다 (확인 된 중앙값은 Q3보다 Q1에 가깝습니다) 값으로). (이 소프트웨어에 대한 특정 조언이 있으면 Minitab을 사용하고 있습니다.)

12
음의 왜도를 갖는 분포의 실제 예
" 공통 분포의 실제 예 "에서 영감을 받아 사람들이 부정적인 왜곡을 나타 내기 위해 어떤 교육 학적 예를 사용하는지 궁금합니다. 가르치는 데 사용되는 대칭 또는 정규 분포에 대한 많은 "정규적인"예가 있습니다. 키와 몸무게 같은 것이 생물학적 면밀한 조사에서 살아남지 않더라도! 혈압이 정상에 가까울 수 있습니다. 나는 천문학적 측정 오류를 좋아합니다. …

4
정상 rv의 첨도 및 왜도를 증가시키는 변형
나는 관측 값 가 정규 분포 되어 있다는 사실에 의존하는 알고리즘을 연구하고 있으며 경험적 으로이 가정에 대한 알고리즘의 견고성을 테스트하고 싶습니다.와이YY 이를 위해 의 정규성을 점진적으로 중단시키는 일련의 변환 을 . 예를 들어, 가 정상 왜도 이고 첨도 이므로 점진적으로 증가하는 변형 순서를 찾는 것이 좋습니다.Y Y = 0 = …

3
상자 그림에서 왜도를 평가하는 방법?
이 데이터로 작성된 상자 그림을보고 왜도를 결정하는 방법 : 340, 300, 520, 340, 320, 290, 260, 330 한 책은 "하위 사 분위수가 위 사 분위수보다 중앙값에서 더 멀면 분포가 부정적으로 왜곡된다"고 말합니다. 다른 여러 출처는 거의 동일하다고 말했다. R을 사용하여 상자 그림을 만들었습니다. 다음과 같습니다. 나는 그것의 것을 가지고 부정적으로 …

3
비정규 분포 표본에서 평균의 신뢰 구간을 어떻게 계산할 수 있습니까?
비정규 분포 표본에서 평균의 신뢰 구간을 어떻게 계산할 수 있습니까? 부트 스트랩 방법이 여기에서 일반적으로 사용된다는 것을 알고 있지만 다른 옵션을 사용할 수 있습니다. 비모수 적 옵션을 찾고있는 동안 누군가 파라 메트릭 솔루션이 유효하다고 확신 할 수 있다면 좋을 것입니다. 샘플 크기는> 400입니다. 누구나 R로 샘플을 줄 수 있다면 대단히 …


3
치우친 데이터에 대한 t- 검정
의료 비용 데이터를 수만 번 관찰 한 데이터 세트가 있습니다. 이 데이터는 오른쪽으로 치우 치며 0이 많이 있습니다. 두 세트의 사람들에 대해 다음과 같이 보입니다 (이 경우 각각> 3000 obs를 갖는 두 개의 나이 밴드). Min. 1st Qu. Median Mean 3rd Qu. Max. 0.0 0.0 0.0 4536.0 302.6 395300.0 Min. …

5
오른쪽으로 치우친 분포에 로그 변환이 사용되는 이유는 무엇입니까?
나는 한 번 들었다 로그 변환은 선형 회귀 또는 분위수 회귀 분석에서 오른쪽으로 치우친 분포에 가장 많이 사용됩니다. 이 진술의 근거가되는 이유가 무엇인지 알고 싶습니다. 로그 변환이 오른쪽으로 치우친 분포에 적합한 이유는 무엇입니까? 왼쪽으로 치우친 분포는 어떻습니까?

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.