팬더 데이터 프레임의 인덱스를 열로 변환하는 방법은 무엇입니까?


456

이것은 다소 분명해 보이지만 데이터 프레임의 인덱스를 열로 변환하는 방법을 알 수없는 것 같습니다.

예를 들면 다음과 같습니다.

df=
        gi       ptt_loc
 0  384444683      593  
 1  384444684      594 
 2  384444686      596  

에,

df=
    index1    gi       ptt_loc
 0  0     384444683      593  
 1  1     384444684      594 
 2  2     384444686      596  

답변:


764

어느 한 쪽:

df['index1'] = df.index

또는 .reset_index:

df.reset_index(level=0, inplace=True)

따라서 다음과 같이 3 단계의 색인이있는 다중 색인 프레임이있는 경우

>>> df
                       val
tick       tag obs        
2016-02-26 C   2    0.0139
2016-02-27 A   2    0.5577
2016-02-28 C   6    0.0303

색인 의 첫 번째 ( tick) 및 세 번째 ( obs) 수준을 열로 변환하려면 다음을 수행하십시오.

>>> df.reset_index(level=['tick', 'obs'])
          tick  obs     val
tag                        
C   2016-02-26    2  0.0139
A   2016-02-27    2  0.5577
C   2016-02-28    6  0.0303

4
가지고있는 모든 인덱스에 대해이 n 번을 수행해야합니다 (예 : 두 개의 인덱스가있는 경우 두 번 수행해야 함)
dval

34
df.reset_index(level=df.index.names, inplace=True)하나의 컬럼에 주어진 전체 multiindex 변환 할 수 있습니다
벤티

2
데이터 프레임에 방금 추가 한 열에 대한 인덱스를 가질 수 있으므로 실제 열과 인덱스가 있습니까?
bretcj7

2
전체 다중 df.reset_index()인덱스를 변환하려면을 사용하면 인덱스 전체를 열 (레벨 당 하나의 열)로 이동하고 0에서 len (df) -1로 int 인덱스를 만듭니다.
BallpointBen

2
열에 할당, 예를 들어 df['index1'] = df.index"DataFrame에서 슬라이스 복사본에 값을 설정하려고합니다."라는 경고가 반환됩니다. 아래와 같이 df.assign () 함수를 대신 사용하십시오.
John Mark

36

MultiIndex의 경우 다음을 사용하여 하위 색인을 추출 할 수 있습니다

df['si_name'] = R.index.get_level_values('si_name') 

여기서 si_name하위 색인의 이름입니다.


26

좀 더 명확하게하기 위해 인덱스에 두 개의 레벨 (MultiIndex)이있는 DataFrame을 살펴 보겠습니다.

index = pd.MultiIndex.from_product([['TX', 'FL', 'CA'], 
                                    ['North', 'South']], 
                                   names=['State', 'Direction'])

df = pd.DataFrame(index=index, 
                  data=np.random.randint(0, 10, (6,4)), 
                  columns=list('abcd'))

여기에 이미지 설명을 입력하십시오

reset_index기본 매개 변수와 함께 호출 된 이 메소드는 모든 색인 레벨을 열로 변환하고 단순 RangeIndex을 새 색인으로 사용합니다 .

df.reset_index()

여기에 이미지 설명을 입력하십시오

level매개 변수를 사용하여 열로 변환 할 인덱스 레벨을 제어 하십시오 . 가능하면 레벨 이름을 사용하십시오. 레벨 이름이 없으면 외부에서 0부터 시작하는 정수 위치로 각 레벨을 참조 할 수 있습니다. 여기에 스칼라 값을 사용하거나 재설정하려는 모든 인덱스 목록을 사용할 수 있습니다.

df.reset_index(level='State') # same as df.reset_index(level=0)

여기에 이미지 설명을 입력하십시오

드문 경우지만 인덱스를 유지하고 인덱스를 열로 바꾸려는 경우 다음을 수행 할 수 있습니다.

# for a single level
df.assign(State=df.index.get_level_values('State'))

# for all levels
df.assign(**df.index.to_frame())

15

rename_axis + reset_index

먼저 색인 이름을 원하는 레이블로 바꾼 다음 시리즈 승격 할 수 있습니다.

df = df.rename_axis('index1').reset_index()

print(df)

   index1         gi  ptt_loc
0       0  384444683      593
1       1  384444684      594
2       2  384444686      596

이것은 MultiIndex데이터 프레임 에도 적용됩니다 .

print(df)
#                        val
# tick       tag obs        
# 2016-02-26 C   2    0.0139
# 2016-02-27 A   2    0.5577
# 2016-02-28 C   6    0.0303

df = df.rename_axis(['index1', 'index2', 'index3']).reset_index()

print(df)

       index1 index2  index3     val
0  2016-02-26      C       2  0.0139
1  2016-02-27      A       2  0.5577
2  2016-02-28      C       6  0.0303

4

reset_index방법 을 사용하고 기존 색인을 유지하려면 다음을 사용해야합니다.

df.reset_index().set_index('index', drop=False)

또는 그것을 바꾸려면 :

df.reset_index(inplace=True)
df.set_index('index', drop=False, inplace=True)

예를 들면 다음과 같습니다.

print(df)
          gi  ptt_loc
0  384444683      593
4  384444684      594
9  384444686      596

print(df.reset_index())
   index         gi  ptt_loc
0      0  384444683      593
1      4  384444684      594
2      9  384444686      596

print(df.reset_index().set_index('index', drop=False))
       index         gi  ptt_loc
index
0          0  384444683      593
4          4  384444684      594
9          9  384444686      596

색인 레이블을 제거하려면 다음을 수행하십시오.

df2 = df.reset_index().set_index('index', drop=False)
df2.index.name = None
print(df2)
   index         gi  ptt_loc
0      0  384444683      593
4      4  384444684      594
9      9  384444686      596

2
df1 = pd.DataFrame({"gi":[232,66,34,43],"ptt":[342,56,662,123]})
p = df1.index.values
df1.insert( 0, column="new",value = p)
df1

    new     gi     ptt
0    0      232    342
1    1      66     56 
2    2      34     662
3    3      43     123

5
이 답변이 기존 답변보다 낫다고 생각하는 이유에 대한 토론을 추가해
보시기 바랍니다

0

이를 수행하는 매우 간단한 방법은 reset_index () 메소드를 사용하는 것입니다. 데이터 프레임 df의 경우 아래 코드를 사용하십시오.

df.reset_index(inplace=True)

이렇게하면 인덱스가 열이되고 Inplace를 True로 사용하면 영구적으로 변경됩니다.


1
이 답변은 이미 받아 들여진 답변과 어떻게 다릅니 까?
Annosz
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.