DoE에 대한 Fisher의 인용문을 실제로 보여주기


13

우리 팀과 저는 실험 설계의 유용성에 대해 회사의 비 통계 학자에게 프리젠 테이션을하고 싶습니다. 이러한 비 통계학 자도 고객이며 데이터를 수집하기 전에 Google에 문의하지 않습니다. 피셔의 유명한 인용문을 잘 설명 할 수있는 실제 사례를 알고 있습니까? "실험이 끝난 후 통계 학자에게 전화하는 것은 사후 검사를 요구하는 것 이상일 수 있습니다. 의." ? 바람직하게는 산업 / 제약 / 생물학적 맥락에서 예를 찾고있다. 우리는 사전에 잘 설계되었지만 성공했을 수있는 결정적이지 않은 통계 분석의 예를 생각할 수 있지만 다른 가능한 예가있을 수 있습니다.



감사. 우리 팀의 전 상사는 아마도이 책을 가지고있을 것입니다.
Stéphane Laurent

@onestop 나는 내 손에 책이 있습니다. 당신이 말하는 장은 무엇입니까? 나는이 책의 두 번째 판을 가지고 있고 p47에는 아무것도 없다.
Stéphane Laurent

흠, 위의 Google 도서 링크에서 4 판을보고있는 것 같습니다. 3 장, '데이터 수집'에 '실험 디자인'이라는 제목의 섹션이 있습니다.
onestop

답변:


12

실험자가 실험 대상 효과 사이에서 테스트하고 싶었지만 디자인이 대상 효과 내에 더 적합한 디자인을 사용했습니다.

예를 들어, 한 실험은 8 마리의 쥐,식이 A에 4 마리,식이 B에 4 마리로 이루어졌으며, 쥐의 무게는 4 주 동안 매일 측정되었습니다. 그들이 각 다이어트의 시간 효과에 관심이 있다면 괜찮 았지만 목표는 다이어트의 차이를 조사하는 것이 었습니다.

그들은 많은 양의 데이터를 가지고있는 28 배씩 각각의 쥐를 측정함으로써 생각했지만,식이 효과에 대한 실험 단위는 쥐였으며, 각 치료에 대해 4 마리 만 가지고있었습니다. 그들은 쥐를 하루에 10 번씩 측정 할 수 있었지만 아무런 차이가 없었지만 결국 더 많은 쥐가 필요했습니다.


5
(+1) 나는 더 많은 쥐를 가질 필요와 욕구와 관련하여 인간의 노력에서 의학 연구가 거의 홀로 남아 있다고 생각합니다.
추기경

1
Lankenau에서 많은 실험실 실험에 참여하고 샘플 크기는 항상 작으며 마우스 또는 쥐가 포함됩니다.
Michael R. Chernick

실험실 실험을 할 때 동물은 종종 희생되므로 동물의 수를 가능한 한 작게 유지하려고 시도하는 이유 중 하나라고 생각합니다. 그러나 그러한 상황에서는 의미있는 결론을 도출하기에 충분해야합니다.
Michael R. Chernick

7

저는 Celiac Awareness에 대한 National Foundation이라는 조직에서 일을했습니다. 이 조직은 Celiac Disease에 대한 대중의 인식을 장려하고 글루텐 함유 식품에 대한 편협과 관련된 질병 증상에 대한 점검표를 제공합니다. 그들은 참여하고 싶은 사람에게 인터넷을 열어서 인터넷에서 설문 조사를 실시했습니다. 수년 동안 그들은 대중으로부터 수천 건의 응답을 수집했습니다. 그러나 그들은 설문 조사 결과를 바탕으로 일반 대중에 대한 결론을 내리기를 희망했습니다. 나는 응답자들이 무작위가 아니라 자기 선택을 받았다는 것을 말해야했다. 편향의 정도를 알 수 없으므로 대량의 데이터에도 불구하고 추론을 수행 할 수 없습니다.

이제 응답자들은 독특한 그룹으로 보였습니다. 많은 사람들이 매우 심각하며 자신이나 친척이 질병에 걸릴 수 있다는 우려를 표명했습니다. 그러나 현명한 방식으로 응답하는 별개의 수의 사람들도있었습니다. 허위 이름, 이상한 이메일 주소 및 우편 주소에서 답변을 제공 한 것이 분명합니다.

나는 자료가 탐색 적 의미에서만 유용하다고 생각했고 반응의 빈도는 계획된 미래의 조사에서 시험 될 수있는 가설을 세우는데 유용 할 수 있다고 생각했다. 그러나 지금까지 나의 충고는주의를 기울이지 않았으며 그들은 인터넷에서 스스로 선택하기 쉬운 설문 조사 중 하나를 실행하고 있습니다.


(+1) 좋은 예입니다. 때로는 고객이 매우 구체적인 샘플을 수집하지만 전체 모집단에 대해 결론을 내릴 수 있습니다.

이 흥미로운 예에 감사드립니다 (그러나 비 통계 학자에게는 적합하지 않습니다)
Stéphane Laurent

@ StéphaneLaurent 그렇지 않습니까? 의학적 연구를위한 열악한 디자인과 관련이 있습니다.
Michael R. Chernick

네 마이클이지만 내 고객은 절대 설문 조사를하지 않습니다.
Stéphane Laurent

@ StéphaneLaurent 아이디어는 무작위 화가 없기 때문에 편향의 원리입니다. 실험과 설문 조사에도 거의 같은 방식으로 적용됩니다.
Michael R. Chernick

6

얼마 전에 저는 태양 광 태양열 어레이의 야간 저장 위치가 토양에 쌓인 토양의 속도에 어떤 영향을 미치는지에 대한 실험 결과를 분석하라는 요청을 받았습니다. (이 큰 집중 형 태양 광 어레이는 하루 종일 태양을 추적하지만 밤에는 추적기의 최소 응력 위치이기 때문에 일반적으로 똑바로 향하게 저장됩니다.) 오염은 에너지 생산과 청소를 크게 감소시키기 때문에 큰 문제입니다. 싸지 않다. 이 실험은 약 120 개의 트래커로 진행되었습니다. 서쪽 절반은 수직으로, 동쪽 절반은 수평으로 적재되었습니다 (이것은 두 개의 인버터에 대한 트래커 연결부와 정렬되어 있습니다. 이는 중대한 영향이 있고 특별한 오염 패턴이없는 경우 실험 중 에너지 생산에 유리합니다. 아니에요

불행히도, 남서쪽에서 사막을 가로 질러 강한 우세한 바람 패턴이 있으며, 밭의 서쪽 부분 남쪽에 큰 건물이 있습니다. . 또한, 추적기는 바람으로부터 어느 정도 서로를 "차양"합니다. 결과적으로 토양이 축적되는 메커니즘 (예 : 바람에 날리는 또는 침전)은 들판에 걸쳐 상대적인 크기가 다양합니다. 이것은 배열이 위치에 따라 다른 속도로 토양을 축적한다는 것을 의미한다. 이것은 작은 효과가 아닙니다.

분석의 최종 결과는 본질적으로 저장 위치에 차이가 생겼다는 것은 믿기 어려울 수 없었지만, 그 효과가 사소한 것일 가능성을 배제 할 수 없었으며, 어떠한 확신을 가지고 결정할 수도 없었습니다. 데이터) 효과의 부호. 그런 다음 추적 위치 실험을 설계하여 두 저장 위치 모두에 대해 들판을 가로 질러 더러워진 "응답 표면"을 추정 할 수 있도록 배열 위치를 기준으로 저장 위치를 ​​할당하고 "침착"대 "바람 날린"오염 속도를 추정하고 물론 두 가지 모두에 저장 각도의 영향. 이 실험은 매우 성공적이었으며 우리는 불과 두 달 후에 수직 적재의 이점을 명확하게 파악할 수있었습니다.


6

나는 동료에 의해 특정 유형의 날씨 사건과 일반적으로 단순한 마모로 인한 인프라 유형의 실패 사이의 상관 관계를 조사한 연구에서 '통계를 수행'하라는 요청을 받았습니다. 동료는 날씨 이벤트가 실제로 실패에 기여하는지 여부를 확인하려고했습니다. 한 팀의 사람들은 이미 방대한 양의 데이터를 수집하는 데 많은 시간과 노력을 들였으며 연구 논문은 거의 완성되었습니다. 그들은 통계를 수행하고 결과 섹션의 마지막 부분을 채울 누군가가 필요했습니다.

문제는 데이터 세트에 문제가되는 날씨 이벤트가 발생한 '흥미로운'기간 만 포함되도록 노력했다는 것입니다. 이는 이벤트 중 실패 비율과 이벤트가 아닌 시간을 비교할 방법이 없다는 것을 의미했습니다. 나는 문제를 설명하기 위해 반복적으로 시도했지만, 실제로 데이터 를 얻을 수있는 많은 양의 데이터 가 있었기 때문에 결코 확신하지 못했습니다 .

운 좋게도 날씨 사건의 심각성 범위는 여전히 높았으며 심각도와 실패율 사이에는 약한 대응 관계가 있었기 때문에 적어도 그로부터 무언가를 구제했지만 결과는 그들이 어떻게 해야할지에 대해 훨씬 더 결정적이었을 것입니다 데이터 수집 실습을 시작하기 전에 '통계를 수행하십시오'.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.