단백질 학의 힘?


9

보조금은 종종 제안 된 표본 크기를 지원하기 위해 전력 분석이 필요합니다. Proteomics (및 대부분의 omics)에서는 10의 표본에 대해 100에서 1000의 특징 / 변수가 측정됩니다 (아마도 100은 아니지만). 또한 이러한 측정 단위 (예 : 단백질의 스펙트럼 수)가 정규 분포를 따르지 않으므로 비모수 테스트를 사용하여 분석하는 것으로 알려져 있습니다. 단일 측정을 가정하고 t- 검정을 가정하여 표본 크기의 검정력을 결정했지만 이것이 완전히 맞지 않다고 생각합니다. 스펙트럼 수의 또 다른 문제점은 구체적으로 100의 기능 각각이 매우 다른 오차를 갖는 매우 다른 스케일에 있다는 것입니다 (더 큰 값은 에러가 적음). [이 문제는 제한 접기 변경 모델, Mutch et al., 2002에 잘 설명되어 있습니다 ]

FDR에 대한 몇 가지 가정과 수용 가능한 배수 변화가 주어지면 제안 된 표본 크기의 검정력을 결정하는 적절한 방법은 무엇입니까? 여기 도구를 사용하여 다음을 감안할 때 결정할 수있었습니다.

  • 300 개의 유전자
  • 3 오탐
  • 1.4 배 차이
  • 0.8 원하는 전력
  • 0.7 stdev

49 명 그룹당 표본 크기가 필요합니다.

이것은 50v50 디자인을 제안한 이후에 편리했으며 1.4 배 변화가 허용되고 1 % FDR이 양호하다는 것을 알고이 실험에서 300 개의 단백질을 측정 할 것입니다. 이 검정력 또는 표본 크기 계산 문제는 계속 발생하므로 참조 된 접근 방식을 사용하는 것이 좋습니다.

편집 : 동료가 우도 함수와 Wald 테스트를 사용하여 음 이항 분포에서 스펙트럼 수를 모델링하도록 제안한 곳을 읽었습니다. 기본적으로 예비 데이터를 사용하여 단백질 분산 추정치를 얻은 다음 각 Quantile에 대해 그룹 간 감지 가능한 접기 변화를 계산합니다. FDR (알파) 입력도 있습니다. 따라서> 80 %의 검정력과 표본 크기 설정을 통해 25 % 가장 낮은 분산, 50 % 더 작은 분산 및 25 % 가장 높은 분산에 대해 감지 가능한 접기 변화를 결정할 수 있습니다. 문제는 그들이 어떻게했는지 모르겠다는 것입니다. 이 접근 방식을 공유하면 가능한 대답을 가진 사람에게 도움이 될지 확실하지 않습니다.


이 주제에 관해 내가 찾은 다른 자료들 : Levin 2011 Dicker et al., 2010
Ben

1
그 MD 앤더슨 계산기는 나에게 너무 낙관적입니다. 몇 번의 비교가 이루어 집니까? (나는 microarrays에 너무 녹슨입니다 : 50v50 디자인의 300 유전자는 얼마나 많은 비교를 할 수 있음을 의미합니까 ??) 3은 null에서 오 탐지가 예상됩니까? 60 개 이상의 비교에는 너무 엄격합니다.
AdamO

1
이것이 R에서 어떻게 수행되는지 보여줄 수 있지만 생물학에 대한 배경 지식이 필요합니다.
AdamO

답변:


1

응용 프로그램 (특히 전력 연구를 수행해야하는 윤리적 응용 프로그램)에서는 참조 [Wang and Chen 2004]를 사용하는 것이 좋습니다. 처리량이 많은 데이터 (실제 데이터가 무엇이든)에 대한 전력 계산의 개념을 잘 설명하고 있기 때문입니다. .

본질적으로 일반적인 매개 변수 (α, β, N, 효과 크기) 외에도 두 개의 추가 매개 변수 인 λ 및 η을 사용합니다. 후자 인 η는 실제로 변경된 유전자의 수로 가정되며, λ는 감지 할 수있는 실제로 변경된 유전자의 일부입니다. 이 방법을 사용하면 알려진 전력 계산을 고 처리량 데이터로 확장하는 것이 매우 간단합니다.

Wang, Sue-Jane 및 James J. Chen. "마이크로 어레이 실험에서 차별적으로 발현 된 유전자를 식별하기위한 샘플 크기." 전산 생물학 연구 11.4 (2004) : 714-726.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.