@Ondrej와 @Michelle은 여기에 좋은 정보를 제공했습니다. 다른 곳에서는 언급하지 않은 몇 가지 요점을 해결하여 기여할 수 있는지 궁금합니다. 테이블 형식의 데이터에서 많은 것을 얻을 수 없다는 것에 대해 스스로를 깨우지 않을 것입니다. 테이블은 일반적으로 정보를 제시하는 좋은 방법이 아닙니다 (참조 : Gelman et al., Turning Tables to Graphs ). 반면, 새로운 데이터 세트를 탐색하는 데 도움이되는 모든 올바른 그래프를 자동으로 생성하는 도구를 요구하는 것은 귀하를 대신하여 생각할 도구를 요구하는 것과 거의 같습니다. (잘못하지 마십시오, 당신의 질문은 당신이 그렇게 멀리 가지 않는다는 것을 분명히 인식합니다. 나는 실제로 그런 도구가 결코 없을 것임을 의미합니다.) 이것과 관련된 좋은 토론을 찾을 수 있습니다. 여기 .
이 말은 데이터를 탐색하는 데 사용할 수있는 종류의 플롯에 대해 조금 이야기하고 싶었습니다. 질문에 나열된 줄거리는 좋은 출발이지만, 우리는 조금 최적화 할 수 있습니다. 우선, 변수 쌍을 상관시키는 "많은 수의 플롯"을 만드는 것은 이상적이지 않을 수 있습니다. 산점도에는 두 변수 간의 한계 관계 만 표시됩니다 . 여러 변수를 조합하여 중요한 관계를 숨길 수 있습니다. 이 접근법을 강화하는 첫 번째 방법은 산점도 행렬 을 만드는 것입니다모든 페어 별 산점도를 동시에 표시합니다. 산점도 행렬은 다양한 방법으로 향상 될 수 있습니다. scatterplot.matrix
R의 자동차 패키지 의 기능은 이러한 모든 작업을 훌륭하게 수행 할 수 있습니다 (예를 들어 위에 링크 된 페이지의 절반 아래에서 볼 수 있음).
그러나 산점도 행렬은 좋은 시작이지만 여전히 한계 투영 만 표시합니다. 이것을 넘어서려고 시도하는 몇 가지 방법이 있습니다. 하나는 R 에서 rgl 패키지를 사용하여 3 차원 도표를 탐색하는 것 입니다. 또 다른 방법은 조건부 도표를 사용하는 것입니다. 코 플롯 은 3 개 또는 4 개의 변수 사이의 관계를 동시에 도울 수 있습니다. 특히 유용한 접근 방식은 산점도 행렬을 대화식 으로 사용하는 것입니다(예를 들어, '브러싱'등) 더 배우려면 더 많은 노력이 필요합니다. 브러싱을 사용하면 매트릭스의 한 프레임에서 하나 이상의 점을 강조 표시 할 수 있으며 해당 점은 다른 모든 프레임에서 동시에 강조 표시됩니다. 브러시를 움직여서 모든 변수가 어떻게 변하는 지 확인할 수 있습니다. 업데이트 : 내가 언급하지 않은 또 다른 가능성은 평행 좌표 플롯 을 사용하는 것 입니다. 이는 응답 변수를 구별하지 않는 단점이 있지만, 예를 들어 X 변수 간의 상관 관계를 검사하는 데 유용 할 수 있습니다.
또한 수집 된 날짜별로 정렬 된 데이터를 검토해 주셔서 감사합니다. 데이터는 항상 시간이 지남에 따라 수집되지만 사람들이 항상 그렇게하는 것은 아닙니다. 선 그래프를 그리는 것은 좋지만 자기 상관 및 부분 자기 상관 그래프로 보완하는 것이 좋습니다 . R에서, 이들에 대한 기능은 각각 acf
및 pacf
각각이다.
나는이 모든 것이 자동으로 모든 플롯을 만들 수있는 도구를 제공한다는 의미에서 귀하의 질문에 대답하지는 못하지만 한 가지 의미는 실제로 당신이 두려워하는만큼 많은 플롯을 만들 필요가 없다는 것입니다 예를 들어, 산점도 행렬은 한 줄의 코드 일뿐 입니다. 또한 R에서는 일부를 자동화 하는 함수 / 재사용 가능한 코드를 작성할 수 있어야합니다 (예 : 변수 목록과 날짜 순서를 취하는 함수를 상상할 수 있습니다) , line, acf 및 pacf 플롯이있는 각각에 대해 새 창을 표시합니다.