계통 발생 의존 변수 : ANOVA?


13

나는 계통 발생 데이터에서 공분산 행렬을 도출 하여 회귀를 만드는 두 변수 에 대해 을 만드는 것을 이해합니다. 그러나 이전에 계통 발생에 의존하는 것으로 보이는 연속 변수가 하나 있고 순서 변수가 하나 인 경우 어떻게됩니까? 후자는 서수이므로 이것을 계통 발생 의존성이 편향된 테스트 통계로 만드는 방식과 어떻게 관련이 있는지 잘 모르겠습니다.cov(X,Y)=0

연속 변수에 대한 Felsenstein의 Phylogenetic Independent Contrasts를 계산하고이를 분산 분석에 사용하는 것이 의미가 있습니까?

PIC 값은 다음과 같습니다.

Cij=(XiXj)dij

여기서 는 종 대해 는 종 대해 이며, 는 계통 발생 수 트리에서 종 와 사이의 쌍별 거리 입니다. X i , X j X j d i j i jXiXi,XjXjdijij


1
CrossValidated에는 통계 사이트로의 마이그레이션을 고려할만한 충분한 통계학자가 있습니다.
Daniel Standage

2
r-sig-phylo 메일 링리스트 ( stat.ethz.ch/mailman/listinfo/r-sig-phylo )를 추천합니다. 분석에 R을 사용하지 않더라도 질문에 대한 답을 얻을 수 있습니다.
kmm

답변:


1

내가 권장하는 첫 번째 단계는 각 서수 클래스에 대한 더미 변수를 도입하는 것입니다 ( https://www.google.com/url?sa=t&source=web&rct=j&ei=B9r5U67pH8vfsASwq4GADQ&url=http://www.uta의 주석 참조) .edu / faculty / kunovich / Soci5304_Handouts / Topic % 25208_Dummy % 2520Variables.doc & cd = 2 & ved = 0CCAQFjAB & usg = AFQjCNEX-TD7RjSYZ-ej32_5tgPTxVVdvQ & sig2 = 9hkDU6Y2mpKcGgGG 로부터의 각 분석 변수 및 cult ) 더미 변수 자체의 추세를 테스트 할 수도 있습니다. 또한 사전 분석 (현재 데이터를보기 위해)에 대한 정당성이있는 경우 후속 분석을 위해 더미 변수의 각각의 추정 된 크기에 따라 순서 변수 범주를 다시 정렬합니다.

이전 분석에 추세 효과가 증가하지 않고 (선형 일 필요는 없음) 서수 변수 자체에 지원 가능한 순서를 통합한다고 가정 할 수있는 정규성 문제를 해결하는 흥미로운 접근법은 모든 변수에 순위가 지정된 회귀 분석을 수행하는 것입니다. 서수 변수를 포함합니다. Spearman 's Rank Correlation Coefficient의 Wikipedia에서 인용 한이 광기의 이론적 근거 (link : http://en.m.wikipedia.org/wiki/Spearman 's_rank_correlation_coefficient) :

"Spearman의 계수는 상관 관계 계산과 마찬가지로 순서 변수를 포함하여 연속 변수와 이산 변수 모두에 적합합니다. [1] [2]"

Wikipedia는 테스트를 위해 계산 된 순위 상관의 표준 오차를 평가하는 예제와 몇 가지 방법을 제시합니다. 통계적으로 0과 다르지 않은 경우 순위를 기반으로 계산 된 회귀 분석에서와 같이 스케일링 된 버전도 비슷하지만 중요하지 않습니다.

나는 이러한 순위를 (관측 수로 나누어) 정규화하여 가능한 샘플 Quantile 해석을 제공 할 것입니다 (해당 데이터에 대한 경험적 분포를 구성하는 것이 가능할 것입니다). 또한 선택한 순위의 방향 (예 : 1 ~ 4 대 4 ~ 1)이 컨텍스트에서 직관적 인 의미를 갖는 순위 상관에 대한 부호를 생성하도록 y와 주어진 변환 된 서수 변수 사이에 간단한 상관 관계를 수행합니다. 당신의 연구.

[편집] ANOVA 모델은 적절한 설계 행렬을 사용하여 회귀 형식으로 제공 할 수 있으며, 어떤 표준 회귀 모델을 조사하든 중심 주제는 X가 주어진 Y의 평균 기반 분석입니다. 그러나 생태학과 같은 일부 분야에서는, 중앙값을 포함하여 다양한 분량으로 암시 된 회귀 관계에 대한 다른 초점은 유익한 것으로 판명되었습니다. 분명히 생태학에서 평균 효과는 작을 수 있지만 반드시 다른 Quantile에서는 그렇지 않을 수 있습니다. 이 필드를 Quantile Regression이라고합니다. 현재 분석을 보완하기 위해 사용하는 것이 좋습니다. 참고로 SAS Institute의 Colin (Lin) Chen이 작성한 논문 213-30, "Quantreg 회귀 소개 및 QUANTREG 절차"가 도움이 될 수 있습니다.

1979 년 11 월 4 일자 Technometrics, Vol 21, No. 4에 발표 된 Ronald L. Iman과 WJ Conover의 "회귀에서 순위 변환의 사용"에 대한 순위 변환 사용에 대한 소스도 있습니다. 순위 변환을 사용하면 단조로운 데이터에서 매우 잘 작동하는 것으로 보입니다. 온라인 잡지에 실린 신뢰성 전문가들도이 의견을 공유합니다. "순위 회귀 추정 방법은 선형화 할 수있는 함수에 매우 적합합니다." 출처 : "Reliability Hotwire, 2010 년 12 월 10 호.


익명의 사용자가 게시물을 상당히 광범위하게 (IMO) 수정하려고했습니다. 동의하지 않으면 "편집 된 __ 전"링크를 클릭하여 선호하는 마지막 버전을 찾아 "롤백"을 클릭하여 롤백 할 수 있습니다.
gung-복원 Monica Monica

0

계통 발생적 ANOVA 시험은 Garland et al. (1993) 및 패키지 의 phy.anova기능에서 구현 geiger됩니다. 이 방법은 계통 발생에 대한 진화를 시뮬레이션하여 널 분포를 생성함으로써 계통 발생적 비 독립성에 대해 보정 된 p- 값을 생성한다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.