Tukey의 탐색 적 데이터 분석의 현대 후계자?


52

Tukey의 저서 "탐색 데이터 분석"을 읽었습니다. 1977 년에 쓰여진이 책은 종이 / 연필 방법을 강조합니다. 이제 대규모 데이터 세트를 즉시 플롯 할 수 있다는 점을 고려한 '현대적인'후계자가 있습니까?


커뮤니티 위키 여야합니까?
richiemorrisroe

이것이 CW인지 여부는 분명하지 않습니다. 좋은 답변이 없을 수도 있습니다. 하나의 명백한 미해결 답변이있을 수 있습니다. 효과적인 답변의 긴 목록을 생성 할 수 있습니다. 어떻게되는지 보자.
whuber

4
좋은 질문입니다, 바이오 냉동고. 방금 다른 작업 방법과 유사하다고 말하고 싶었습니다. 내가 가장 좋아하는 것은 손 도구가 현대 목공이므로 펜 및 종이 EDA는 현대 통계입니다. ( "현대"목공은 초보 사용자도 훨씬 적은 시간 내에 수용 가능한 결과를 도출 할 수 있도록하는 테이블 톱 및 라우터와 같은 많은 전동 공구를 사용하지만이 도구는 매년 수천 개의 누락 된 자릿수와 팔다리를 처리합니다. 일반적으로 전동 공구를 사용하는 경우에도보다 효율적이고 효율적으로 작업하는 방법을 배웁니다.)
whuber

4
예, 목공은 훌륭한 비유입니다 (부족 숫자, 누락 숫자). software-carpentry.org 도 참조하십시오 .
데니스

답변:






4

Ronald Pearson의 공학, 과학 및 의학에 관한 자료 탐색 은 여기서 언급 할 가치가 있습니다. 그것의 주요 목표 독자는 더 많은 통계를 알고 싶어하는 작은 수학을 두려워하지 않는 과학자 인 것 같습니다. 그것은 꽤 큰 그룹이며 여기에 잘 표현 된 그룹입니다. 약간 기발하고 엉뚱하지만 많은 근거를 다루고 많은 현명한 조언을 포함합니다. Tukey는 많은 새로운 아이디어를 제공한다는 점에서 재검토되지는 않았지만 조금 잘못되었다고 생각하더라도 연구에 대한 보상이 될 수 있습니다.

이 책은 매우 비싸고, 아마도 비싸고, 강의 텍스트로는 적합하지 않고, 하드백에서만 사용할 수 있기 때문에 거의 주목을받지 못한 것 같습니다. 그러나 그것은 지능적이고 읽기 쉽고 현대 입문 교과서의 쓰레기 (초등 운동의 페이지와 페이지, 바보 같은 아이콘, 행복한 젊은이의 사진, 상자가있는 까다로운 레이아웃 등)가 없습니다.



0

읽을만한 또 다른 좋은 책은 아름다운 시각화 와 아름다운 데이터입니다. 이것들은 편집 된 책 들이며, 음모로 데이터를 탐색하는 놀랍도록 좋은 예가 있습니다.

ggplot2를 사용하는 좋은 예가있는 다른 책은 Winston Chang 의 새로운 책입니다


1
미묘한 오타가 발생하는 경우를 대비하여 Di를 다시 확인하고 싶습니다. "appalling"대신 "appealing"이라고 쓰셨습니까? 이 맥락에서 두 가지 모두 의미가 있지만 더 이상 설명하지 않고 후자의 모습은 다소 놀랍습니다!
whuber

2
끔찍한 말이 맞았습니다-그것은 혼합 가방입니다-편집 량은 종종 있습니다
Dianne Cook

나는 이러한 권고에 놀랐습니다. 나는 두 책이 대부분 실망 스럽다는 것을 발견했다. 불행히도 내가 유닉스 책을 처음 출판 한 오 레일리 (O'Reilly)는 원격 통계조차도 책에 대해 품질이 고르지 않은 것으로 보인다.
Nick Cox

나는 두 권의 책을 모두 좋아하고 실제로 큰 기여를하고 있다고 생각합니다. Winston Chang 's에는 ggplot2를 사용한 플로팅에 대한 기본 정보가 많이 있습니다. 초보자에게 좋은 참고 자료입니다. 왜 당신이 이러한 음모를 꾸밀 것인지에 대해 많이 말하지는 않지만, 내가 읽은 조각들로부터 목적에 가장 적합합니다. 아름다운 시각화에는 위키 백과, 대량의 데이터, 많은 복잡성 시각화와 같은 어려운 문제를 다루는 매우 인상적인 챕터가 있습니다.
Dianne Cook

내 의견이 모호한 경우를 대비하여 : "아름다운"책을 언급하고있었습니다. Winston Chang의 책은 훌륭하고 도움이됩니다.
Nick Cox

0

저는 EDA의 기술적 후속 조치로서 데이터 테이블 및 형태 탐색에 대한 동반자 인 Hoaglin, Mosteller 및 Tukey의 강력하고 탐구적인 분석을 이해한다고 생각합니다. 또한 EDA에 대한 후속 조치로 Mosteller와 Tukey의 통계에서 두 번째 과정 인 데이터 분석 및 회귀를 봅니다. 위에서 언급 한 다양한 클리블랜드 서적은 보물입니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.