별도의 Pandas DataFrame을 서브 플롯으로 플로팅하려면 어떻게해야합니까?


129

동일한 값 척도를 공유하지만 열과 인덱스가 다른 Pandas DataFrame이 몇 개 있습니다. 을 호출 할 때 df.plot()별도의 플롯 이미지를 얻습니다. 내가 정말로 원하는 것은 그것들을 모두 서브 플롯과 같은 플롯에 두는 것이지만, 불행히도 나는 어떻게 도움을 줄 수 있는지에 대한 해결책을 찾지 못하고 있습니다.

답변:


252

matplotlib를 사용하여 수동으로 서브 플롯을 생성 한 다음 ax키워드를 사용하여 특정 서브 플롯에 데이터 프레임을 플로팅 할 수 있습니다 . 예를 들어 4 개의 서브 플롯 (2x2)의 경우 :

import matplotlib.pyplot as plt

fig, axes = plt.subplots(nrows=2, ncols=2)

df1.plot(ax=axes[0,0])
df2.plot(ax=axes[0,1])
...

다음 axes은 서로 다른 서브 플롯 축을 보유하는 배열이며 인덱싱만으로 액세스 할 수 있습니다 axes.
당신이 공유 x 축을 원하는 경우에, 당신은 제공 할 수 있습니다 sharex=Trueplt.subplots.


33
성가 시게도 .subplots()생성하는 서브 플롯 배열의 차원에 따라 다른 좌표계를 반환합니다. 따라서, 예를 들어 서브 플롯을 반환하는 경우 nrows=2, ncols=1축을 axes[0]및 로 인덱싱해야합니다 axes[1]. 참조 stackoverflow.com/a/21967899/1569221
canary_in_the_data_mine

3
감사합니다 @canary_in_the_data_mine, 정말 짜증나입니다 ... 당신의 코멘트를 내가지고 이유를 나에게 알아낼 수있는 시간을 : 저장IndexError: too many indices for array
SND

9
@canary_in_the_data_mine 기본 인수 .subplot()가 사용되는 경우에만 성가신 일 입니다. 행과 열의 경우 항상를 반환 squeeze=False하도록 강제 설정 합니다 . .subplot()ndarray
Martin

73

e.gs를 볼 수 있습니다. joris 답변을 보여주는 문서 에서 . 또한 문서에서, 당신은 또한 설정할 수 subplots=Truelayout=(,)팬더의 내부 plot기능 :

df.plot(subplots=True, layout=(1,2))

여기fig.add_subplot() 게시물에 설명 된대로 221, 222, 223, 224 등과 같은 서브 플롯 그리드 매개 변수를 사용 하는 것도 사용할 수 있습니다 . 서브 플롯을 포함하여 팬더 데이터 프레임에 대한 플롯의 좋은 예는 이 ipython 노트북 에서 볼 수 있습니다 .


2
joris의 대답은 일반적인 matplotlib 사용에 적합하지만 빠른 데이터 시각화를 위해 pandas를 사용하려는 모든 사람에게 탁월합니다. 또한 질문에 좀 더 잘 맞습니다.
Little Bobby Tables

것을 명심 subplots하고 layoutkwargs로는 단일 dataframe에 대해 여러 플롯을 생성합니다. 이것은 여러 데이터 프레임을 단일 플롯으로 플로팅하는 OP의 질문과 관련이 있지만 솔루션이 아닙니다.
Austin A

1
이것은 순수한 Pandas 사용에 대한 더 나은 대답입니다. 이것은 matplotlib를 직접 가져올 필요가 없으며 (일반적으로 그래야하지만) 임의의 모양에 대해 반복 할 필요가 없습니다 ( layout=(df.shape[1], 1)예 :를 사용할 수 있음 ).
Anatoly Makarevich

20

당신은 전화 익숙한하기 matplotlib 스타일을 사용 figure하고 subplot있지만, 당신은 단순히 사용하여 현재 축을 지정해야합니다 plt.gca(). 예 :

plt.figure(1)
plt.subplot(2,2,1)
df.A.plot() #no need to specify for first axis
plt.subplot(2,2,2)
df.B.plot(ax=plt.gca())
plt.subplot(2,2,3)
df.C.plot(ax=plt.gca())

기타...


7

모든 데이터 프레임의 목록을 만드는 간단한 트릭과 함께 matplotlib를 사용하여 여러 팬더 데이터 프레임의 여러 서브 플롯을 플로팅 할 수 있습니다. 그런 다음 for 루프를 사용하여 서브 플롯을 플로팅합니다.

작동 코드 :

import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
# dataframe sample data
df1 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
df2 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
df3 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
df4 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
df5 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
df6 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
#define number of rows and columns for subplots
nrow=3
ncol=2
# make a list of all dataframes 
df_list = [df1 ,df2, df3, df4, df5, df6]
fig, axes = plt.subplots(nrow, ncol)
# plot counter
count=0
for r in range(nrow):
    for c in range(ncol):
        df_list[count].plot(ax=axes[r,c])
        count=+1

여기에 이미지 설명 입력

이 코드를 사용하면 모든 구성에서 서브 플롯을 그릴 수 있습니다. 행 nrow수와 열 수를 정의하기 만하면 ncol됩니다. 또한 df_list플로팅하려는 데이터 프레임의 목록을 만들어야합니다 .


2
그렇지 않은 : 마지막 행의 오타에주의를 기울여야 count =+1하지만count +=1
PEBKAC

4

이것을 사용할 수 있습니다 :

fig = plt.figure()
ax = fig.add_subplot(221)
plt.plot(x,y)

ax = fig.add_subplot(222)
plt.plot(x,z)
...

plt.show()

3

Pandas를 전혀 사용할 필요가 없을 수도 있습니다. 다음은 고양이 주파수의 matplotlib 플롯입니다.

여기에 이미지 설명 입력

x = np.linspace(0, 2*np.pi, 400)
y = np.sin(x**2)

f, axes = plt.subplots(2, 1)
for c, i in enumerate(axes):
  axes[c].plot(x, y)
  axes[c].set_title('cats')
plt.tight_layout()

1

위의 @joris 응답을 기반으로하여 서브 플롯에 대한 참조를 이미 설정 한 경우 참조도 사용할 수 있습니다. 예를 들면

ax1 = plt.subplot2grid((50,100), (0, 0), colspan=20, rowspan=10)
...

df.plot.barh(ax=ax1, stacked=True)

0

긴 (정리) 데이터가있는 데이터 프레임 사전에서 여러 플롯을 만드는 방법

  • 가정

    • 깔끔한 데이터의 여러 데이터 프레임 사전이 있습니다.
      • 파일에서 읽어서 생성
      • 단일 데이터 프레임을 여러 데이터 프레임으로 분리하여 생성
    • 카테고리 cat는 겹칠 수 있지만 모든 데이터 프레임에cat
    • hue='cat'
  • 데이터 프레임이 반복되기 때문에 각 플롯에 대해 색상이 동일하게 매핑된다는 보장은 없습니다.

    • 'cat'모든 데이터 프레임 의 고유 한 값 에서 사용자 지정 색상 맵을 만들어야합니다.
    • 색상이 동일하므로 모든 플롯의 범례 대신 하나의 범례를 플롯 측면에 배치하십시오.

가져 오기 및 합성 데이터

import pandas as pd
import numpy as np  # used for random data
import random  # used for random data
import matplotlib.pyplot as plt
from matplotlib.patches import Patch  # for custom legend
import seaborn as sns
import math import ceil  # determine correct number of subplot


# synthetic data
df_dict = dict()
for i in range(1, 7):
    np.random.seed(i)
    random.seed(i)
    data_length = 100
    data = {'cat': [random.choice(['A', 'B', 'C']) for _ in range(data_length)],
            'x': np.random.rand(data_length),
            'y': np.random.rand(data_length)}
    df_dict[i] = pd.DataFrame(data)


# display(df_dict[1].head())

  cat         x         y
0   A  0.417022  0.326645
1   C  0.720324  0.527058
2   A  0.000114  0.885942
3   B  0.302333  0.357270
4   A  0.146756  0.908535

색상 매핑 및 플롯 생성

# create color mapping based on all unique values of cat
unique_cat = {cat for v in df_dict.values() for cat in v.cat.unique()}  # get unique cats
colors = sns.color_palette('husl', n_colors=len(unique_cat))  # get a number of colors
cmap = dict(zip(unique_cat, colors))  # zip values to colors

# iterate through dictionary and plot
col_nums = 3  # how many plots per row
row_nums = math.ceil(len(df_dict) / col_nums)  # how many rows of plots
plt.figure(figsize=(10, 5))  # change the figure size as needed
for i, (k, v) in enumerate(df_dict.items(), 1):
    plt.subplot(row_nums, col_nums, i)  # create subplots
    p = sns.scatterplot(data=v, x='x', y='y', hue='cat', palette=cmap)
    p.legend_.remove()  # remove the individual plot legends
    plt.title(f'DataFrame: {k}')

plt.tight_layout()
# create legend from cmap
patches = [Patch(color=v, label=k) for k, v in cmap.items()]
# place legend outside of plot; change the right bbox value to move the legend up or down
plt.legend(handles=patches, bbox_to_anchor=(1.06, 1.2), loc='center left', borderaxespad=0)
plt.show()

여기에 이미지 설명 입력

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.