통계 및 빅 데이터 skewness

7

사람들이 변수 예측 (예측 변수와 반응 변수 모두)에 대해 이야기 할 때 대부분의 경우 로그 왜곡, 상자 및 콕스 변환 등의 데이터 왜곡을 처리하는 방법에 대해 논의합니다. 내가 이해할 수없는 것은 왜도를 제거하는 것이 일반적인 모범 사례로 간주됩니까? 왜도는 트리 기반 모델, 선형 모델 및 비선형 모델과 같은 다양한 모델의 …

17 modeling skewness

2

감마 랜덤 변수의 로그 왜곡

고려 감마 확률 변수 . 평균, 분산 및 왜곡에 대한 깔끔한 수식이 있습니다.X∼Γ(α,θ)X∼Γ(α,θ)X\sim\Gamma(\alpha, \theta) E[X]Var[X]Skewness[X]=αθ=αθ2=1/α⋅E[X]2=2/α−−√E[X]=αθVar⁡[X]=αθ2=1/α⋅E[X]2Skewness⁡[X]=2/α\begin{align} \mathbb E[X]&=\alpha\theta\\ \operatorname{Var}[X]&=\alpha\theta^2=1/\alpha\cdot\mathbb E[X]^2\\ \operatorname{Skewness}[X]&=2/\sqrt{\alpha} \end{align} 이제 로그 변환 된 랜덤 변수 . Wikipedia는 평균과 분산에 대한 공식을 제공합니다.Y=log(X)Y=log⁡(X)Y=\log(X) E[Y]Var[Y]=ψ(α)+log(θ)=ψ1(α)E[Y]=ψ(α)+log⁡(θ)Var⁡[Y]=ψ1(α)\begin{align} \mathbb E[Y]&=\psi(\alpha)+\log(\theta)\\ \operatorname{Var}[Y]&=\psi_1(\alpha)\\ \end{align} 감마 함수의 로그의 1 차 및 2 차 미분으로 정의되는 디 …

16 gamma-distribution skewness logarithm

1

치우친 데이터에 t-test를 사용해야합니까? 과학적인 증거 요?

크기가 다르지만 (200 개 이상) 사용자 참여 (예 : 게시물 수)에 대한 고도로 치우친 (지수 분포처럼 보이는) 데이터 집합의 샘플이 있으며 평균을 비교하고 싶습니다. 이를 위해, 나는 2- 표본 쌍을 이루지 않은 t- 검정 (및 표본이 다른 분산을 가질 때 Welch 's factor를 사용한 t- 검정)을 사용하고 있습니다. 내가 들었 …

15 hypothesis-testing t-test nonparametric mean skewness

5

상관 된 비정규 데이터 생성 방법

상관 된 비정규 데이터를 생성하는 방법을 찾는 데 관심이 있습니다. 따라서 공분산 (또는 상관) 행렬을 모수로 사용하고 근사치에 가까운 데이터를 생성하는 분포가 이상적입니다. 그러나 여기에 캐치가 있습니다. 제가 찾고자하는 방법은 다변량 왜도 및 / 또는 첨도를 제어 할 수있는 유연성을 가져야합니다. 나는 익숙한 Fleishman의 방법과 정규 변량의 거듭 제곱 방법의 …

14 multivariate-analysis references random-generation skewness copula

4

데이터가 왜곡 될 때 평균을 사용해야합니까?

종종 입문 적용된 통계 텍스트는 평균이 평균과 구별됩니다 (종종 설명 통계의 맥락에서 평균이 평균, 중간 값 및 모드를 사용하여 중심 경향의 요약을 유발 함). 평균이 샘플 데이터 및 / 또는 인구 분포를 왜곡하여 데이터가 대칭이 아닌 경우 중앙값이 선호된다는 주장의 근거로 사용됩니다. 예를 들면 다음과 같습니다. 주어진 데이터 세트에 대한 …

14 mean skewness median winsorizing central-tendency

2

분포의 평균에 대한 순간 직감?

누군가가 왜 세 번째와 네 번째 모멘트와 같이 확률 분포 의 더 높은 모멘트 가 왜도 및 첨도에 해당 하는지에 대한 직감을 제공 할 수 있습니까 ? 구체적으로, 왜 세 번째 또는 네 번째 거듭 제곱으로 올린 평균에 대한 편차가 왜도 및 첨도의 척도로 변환 되는가? 이것을 함수의 3 차 …

14 mathematical-statistics skewness moments intuition kurtosis

3

극도로 치우친 분포 변환

분포가 매우 긍정적으로 치우친 변수가 있다고 가정하여 정규 분포의 비대칭 범위 내에 로그를 가져 오기에 충분하지 않습니다. 이 시점에서 내 옵션은 무엇입니까? 변수를 정규 분포로 변환하려면 어떻게해야합니까?

13 data-transformation skewness

3

왜도 및 첨도를 포함한 분포 함수에 대한 닫힌 양식 수식?

그런 공식이 있습니까? 평균, 분산, 왜도 및 첨도를 알고 있거나 측정 할 수있는 일련의 데이터가 주어지면 위에서 언급 한 데이터에서 나온 것으로 추정되는 값의 확률 밀도를 계산하는 데 사용할 수있는 단일 공식이 있습니까?

13 distributions pdf kurtosis skewness

11

정규 분포이지만 치우친 분포가 가우시안으로 간주됩니까?

이 질문이 있습니다. YouTube에서 하루에 소비 한 시간의 분포는 어떻게 생각하십니까? 내 대답은 아마도 정상적으로 분포되어 있고 매우 왼쪽으로 기울어 져 있다는 것입니다. 나는 대부분의 사용자가 평균 시간을 소비하고 일부 사용자가 압도적 인 고급 사용자이기 때문에 긴 꼬리를 보내는 하나의 모드가 있다고 생각합니다. 그게 정답입니까? 그 분포에 대해 더 나은 …

12 distributions normal-distribution skewness skew-normal

2

분산 분석의 정규성 가정에서 출발 : 첨도 또는 왜도가 더 중요합니까?

Kutner 등의 응용 선형 통계 모델. ANOVA 모델의 정규성 가정에서 벗어난 것과 관련하여 다음과 같이 설명 합니다. 오차 분포의 첨도 (정규 분포보다 많거나 적은 피크)는 추론에 미치는 영향 측면에서 분포의 왜도보다 중요합니다 . 나는이 진술에 약간 당황하고 책이나 온라인에서 관련 정보를 찾지 못했습니다. 또한 꼬리가 두꺼운 QQ- 플로트는 선형 회귀 …

12 anova normality-assumption skewness kurtosis

2

왼쪽으로 치우친 데이터에서 평균과 중앙값 사이의 관계는 무엇입니까?

나는 평균 평균 이라고 생각합니다 .≤≤\leq 이 경우입니까?

12 distributions self-study mean skewness median

2

어떤 시점에서 응답이 심하게 왜곡되고 일부는 반복 측정 연구에 있지 않은 경우 어떻게해야합니까?

일반적으로 종단 설계에서 연속적이지만 치우친 결과 측정치가 발생하는 경우 (예 : 개체 간 효과가 하나 인 경우) 일반적인 접근 방식은 결과를 정규성으로 변환하는 것입니다. 절단 된 관측과 같이 상황이 극단적 인 경우에는 환상적이게되고 Tobit 성장 곡선 모델 또는 일부를 사용할 수 있습니다. 그러나 특정 시점에 일반적으로 분배 된 결과가 다른 …

12 repeated-measures data-transformation skewness

1

왜 왼쪽으로 치우침이 음으로 치우쳐 져 있고 오른쪽으로 치우침이 양으로 치우쳐 져 있습니까?

명명법이 궁금합니다. 왜 왼쪽으로 치우친 것은 부정적으로 치우쳐지고 오른쪽으로 치우치는 것은 긍정적으로 치우쳐 지는가?

12 terminology skewness

3

정규 분포에 대한 왜도 및 첨도 값 범위

데이터가 정규 분포로 간주되는 왜도 및 첨도 값의 범위가 무엇인지 알고 싶습니다 . 나는 많은 논쟁을 읽었으며 대부분 혼란스러워했다. 첨도에 대한 왜도 및 는 정규 분포에 허용되는 범위입니다. 일부는 왜도가 허용되는 범위 라고 말합니다 . 여기서 자세한 논의를 찾았습니다 .이 문제와 관련된 데이터의 정상적인 분포에 대한 허용 가능한 왜도 및 …

11 normal-distribution skewness kurtosis

5

기울어 진 확률 밀도 함수의 "피크 니스"

몇 가지 왜곡 된 확률 밀도 함수의 "피크 니스"및 테일 "무거움"을 설명하고 싶습니다. 제가 설명하고자하는 기능은 "커토 시스"라고합니까? 대칭 분포에 "쿠 르토 시스"라는 단어 만 보았습니까?

11 pdf descriptive-statistics skewness kurtosis

«skewness» 태그된 질문