통계 그래픽을위한“hello, world”가 있습니까?


25

컴퓨터 프로그래밍에는 "hello, world"라고하는 새로운 언어 나 시스템을 배우고 가르치는 고전적인 최초의 프로그램이 있습니다. http://en.wikipedia.org/wiki/Hello_world_program

그래프 패키지를 사용하기위한 최초의 최초 데이터 시각화가 있습니까? 그렇다면 무엇입니까? 그렇지 않다면 좋은 후보는 무엇입니까?


3
우리 사이트에 오신 것을 환영합니다! 우리의 자주 묻는 질문 은 "실제로 직면하고있는 실제 문제에 기초하여 실용적이고 응답 가능한 질문을해야합니다."라고 묻습니다. 실제 문제가 무엇인지 자세히 설명해 주시겠습니까?
whuber

3
통계 그래픽 (있는 경우)에서 개발중인 교육 자료에 포함 할 "표준 테스트 항목"을 식별하고 싶습니다.
Abraham D Flaxman

2
그래픽 응용 프로그램은 매우 다양하기 때문에 일부 표준 또는 범용 그래픽을 생각하기가 어렵습니다. 역사적으로 유명한 토끼 및 3D 그래픽 용 찻 주전자와 같은 특정 유형의 그래프 패키지 에는 몇 가지 표준 이 있습니다 . 그렇다면 귀하의 질문에 대한 답을 얻으려면, 훈련 자료가 어떤 패키지 (들)에 포함되어야하는지보다 구체적으로 설명하는 것이 도움이 될 것입니다.
whuber

1
좋은 지적입니다. 감사합니다. 최소한 R, STATA, Python 및 Javascript의 통계 그래픽에 대해 설명하겠습니다.
Abraham D Flaxman

@AbrahamDFlaxman이 "훈련 자료"와 그 대상 및 대상이 궁금합니다. 더 말할 수 있습니까?
Peter Flom-Monica Monica 복원

답변:


9

두 가지 생각 :

A. "Hello World"의 본질을 얻으려고 할 때 최소한 한 줄의 텍스트를 인쇄하는 유효한 프로그램을 생성하려면 프로그래밍 언어로 수행해야하는 최소값입니다. "Hello World"는 통계 또는 그래픽 프로그램에 연결할 수있는 가장 기본적인 일 변량 데이터 세트 여야합니다.

B. 나는 "Hello World"라는 그래프를 모른다. 내가 올 수있는 가장 가까운 것은 R의 AirPassengers와 같은 다양한 통계 패키지에 포함 된 일반적인 데이터 세트입니다. R에서 Hello World 그래프 표현은 다음과 같습니다.

plot (AirPassengers)  # Base graphics, prints line graph

또는

qplot (AirPassengers) # ggplot2, prints a bar chart

또는

xyplot (AirPassengers) # lattice, which doesn't have a generic plot

개인적으로 가장 간단한 그래프는 Y의 N 항목과 1 : N의 X 범위를 가진 선 그래프라고 생각합니다. 그러나 그것은 표준이 아닙니다.


1
이 답변과 다른 답변의 합의는 현재 통계 그래픽의 "hello, world"가 없다는 것입니다. Y 및 X의 N 항목이 1 : N 범위 인 단 변량 데이터 세트에 대한 제안이 강력하다고 생각합니다. "hello, world"와 더 유사하게, 작은 N과 기억하기 쉬운 Y를 갖는 것이 좋을 것입니다. N = 5 및 Y = (3,1,4,1,5,9)에 대해 어떻게 생각하십니까? 파이 자리))? 어쩌면 그것은 너무 수학적인 것입니다.
Abraham D Flaxman

1
@ AbrahamDFlaxman : 나는 그것이 mathy라고 생각하지 않습니다, 나는 그것이 훌륭하다고 생각합니다. 기억하기 쉽고 짧으며 그래프는 단순한 직선이 아닙니다. 데이터는 잘 알려져 있으며 특정 프로그램과 관련이 없으며 더 많은 포인트를 원하는 사람이라면 임의로 확장 할 수 있습니다. 나는 그것에 투표한다!
Wayne

24

나는 아마도 산점도로 시작 해서 네 가지 추악한 상관 관계를 보여줄 것이다 .


2
+1. 그러나 어떤 형태의 선 그림과 같이 좀 더 일반적인 것을 고려할 수도 있습니다. 결국 선 세그먼트를 그릴 수있는 즉시 아무 것도 그릴 있습니다. 이것은 "Hello, world!"의 개념을 반영합니다. 일단 프로그램에서 읽을 수있는 출력을 얻으면 컴퓨터와 통신 할 수 있고 나머지는 단지 세부 사항입니다 :-). (자세한 내용은 어려울 수 있습니다 . IBM 360 메인 프레임에 대한 어셈블리 코드 작성을 학습 할 때 출력을 얻는 가장 간단한 방법은 RAM에 저장하고 실행이 끝날 때 오류를 발생시켜 시스템이 16 진 코어 덤프를 인쇄하도록하는 것입니다. !)
whuber

나는 Anscombe의 중주 생각 총이 너무 많은 통계 그래픽의 'Hello, World'로 사용할 수 포함되어 있지만 자신의 논문에서 그림 1은 좋은 후보가 될 수있다. 그러나 다른 답변은 단 변량 데이터 세트에 대한 사례를 만들었습니다.
Abraham D Flaxman

7

정규 분포 랜덤 변수 샘플의 히스토그램입니다.


나는 이것이 보이는 방식을 좋아하지만, 히스토그램은 산란보다 더 많은 데이터 처리를 요구할 수 있으며 정규 분포에서 표본을 추출하면 산만해질 수 있습니다.
Abraham D Flaxman

방금 이것이 Matplotlib 웹 페이지의 첫 번째 예라는 것을 알았습니다. matplotlib.org
Abraham D Flaxman

5

대답은 "아니오"라고 생각합니다. 즉, 귀하의 질문에 대한 일반적으로 합의 된 답변이 없습니다.

@StasK는 산점도를 가리 킵니다.

그러나 나는 무엇을하는지 고려할 것 plot입니다 R: 그것은 데이터에 달려 있습니다!

일 변량 통계가 이변 량 통계보다 단순하다고 주장 할 수 있습니다. 아마도 ... 아마도 가장 기본적인 것은 히스토그램 일 것입니다. 또는 아마도 막대 음모; 아마도 밀도도.

"Hello, World!"의 요점이라면 컴퓨터가 무언가 를 할 수 있다는 것을 보여 주면 어떤 음모 라도 할 수 있습니다.


1
아마도 표준 테스트 항목이 없다는 것은 당신이 맞다는 것을 나타내며, 시연되는 시스템에서 가장 간단한 플롯을 사용하는 것이 더 적합합니다. 그러나 비교하기가 어렵습니다.
Abraham D Flaxman 2016 년

5

그것이 실제로 hello world로 자격이되는지 확실하지 않지만 R에는 많은 패키지에 데모가 내장되어 있습니다. 예 :

library(graphics)
demo(graphics)

패키지에서 사용 가능한 몇 가지 기본 그래픽을 안내합니다. 각 이미지를 마우스로 클릭하기 만하면 기본 그래픽 일러스트레이션을 단계별로 볼 수 있습니다. 두 줄만 사용하면 통계를 위해 R 그래픽의 고무적인 기능 중 일부를 사용자에게 소개 할 수 있습니다.

그래픽을 생성하는 해당 코드가 R 콘솔에 표시됩니다.

여기에 이미지 설명을 입력하십시오


2

데이터 시각화를위한 두 가지 "Hello World"유형 프로그램이 있다고합니다.

Print ( "Hello World") : 정규 분포 변수의 히스토그램 또는 간단한 X, Y 산점도와 같은 것입니다.

Hello World의 원칙을 취하고 사용자 입력, 이스케이프 문자 등으로 재생을 시작하는 섹션과 같이 약간 더 복잡한 부분에 대해서는 Iris 데이터 세트로 재생되는 것이라고 말하고 싶습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.