Tukey Median Polish, 알고리즘은 마이크로 어레이 의 RMA 정규화에 사용됩니다 . 아시다시피, 마이크로 어레이 데이터는 노이즈가 심하므로 모든 프로브와 마이크로 어레이에 대한 관찰을 고려하여 프로브 강도를 추정하는보다 강력한 방법이 필요합니다. 어레이 전체에서 프로브 강도를 정규화하는 데 사용되는 일반적인 모델입니다.
와이나는 j=μ나는+α제이+ϵ나는 j
나는 = 1 , … , 나는j = 1 , … , J
어디 와이나는 j 입니다 L O g 에 대한 변환 된 PM 강도 나는t의 시간에 프로브 제이t의 시간 정렬. ϵ나는 j배경 잡음이며 정상적인 선형 회귀의 잡음에 해당하는 것으로 가정 할 수 있습니다. 그러나 다음에 대한 분산 가정ϵ 제한적일 수 있으므로 Tukey Median Polish를 사용하여 μ나는^ 과 α제이^. 이는 배열 효과에서 프로브로 인한 신호와 강도를 분리하려는 경우 배열 전체에서 표준화하는 강력한 방법입니다.α. 배열 효과를 정규화하여 신호를 얻을 수 있습니다α제이^모든 배열에 대해. 따라서 프로브 효과와 임의의 노이즈 만 남게됩니다.
내가 이전에 인용 한 링크는 Tukey median polish를 사용하여 프로브 효과로 순위를 매겨 차별적으로 발현 된 유전자 또는 "관심있는"유전자를 추정합니다. 그러나이 논문은 꽤 오래되었고, 아마도 사람들은 여전히 마이크로 어레이 데이터를 분석하는 방법을 알아 내려고 시도했을 것입니다. Efron의 비모수 적 경험적 베이지안 방법 종이는 2001 년에 나왔지만 아마도 널리 사용되지는 않았을 것입니다.
그러나 이제 우리는 (통계적으로) 마이크로 어레이에 대해 많은 것을 이해하고 통계 분석에 대해 확신합니다.
Microarray 데이터는 상당히 시끄럽고 RMA (Median Polish를 사용)는 가장 널리 사용되는 정규화 방법 중 하나입니다. 단순성 때문일 수 있습니다. 다른 인기 있고 정교한 방법은 GCRMA, VSN입니다. 관심은 배열 효과가 아닌 프로브 효과이므로 정규화하는 것이 중요합니다 .
예상 한대로 유전자 전체에서 정보를 차용하는 일부 방법을 통해 분석에 도움이 될 수 있습니다. 이들은 베이지안 또는 실험적인 베이지안 방법을 포함 할 수있다. 당신이 읽고있는 논문이 오래되어서이 기술들이 그때까지 나오지 않았을 수도 있습니다.
두 번째 요점과 관련하여 실험 데이터를 수정하고있을 것입니다. 그러나 나는이 수정이 더 나은 원인을위한 것이라고 생각합니다. 이유는
a) 마이크로 어레이 데이터는 시끄 럽습니다. 관심이 프로브 효과 인 경우, RMA, GCRMA, VSN 등으로 데이터를 정규화해야하며 데이터의 특수 구조를 활용하는 것이 좋습니다. 그러나 나는 두 번째 부분을하지 않을 것입니다. 우리가 사전에 구조를 알지 못하면 많은 가정을 부과하지 않는 것이 좋습니다.
b) 대부분의 마이크로 어레이 실험은 본질적으로 탐구 적이다. 즉, 연구자들은 추가 분석 또는 실험을 위해 몇 가지 "흥미로운"유전자로 좁히려 고 노력하고있다. 이들 유전자가 강한 신호를 갖는 경우, 정규화와 같은 변형이 최종 결과에 (실질적으로) 영향을 미치지 않아야합니다.
따라서 수정이 정당화 될 수 있습니다. 그러나 정규화를 과도하게 수행하면 잘못된 결과가 발생할 수 있습니다.