사전 목록에 대한 Pandas DataFrame


165

다음과 같은 DataFrame이 있습니다.

고객 항목 1 항목 2 항목 3
사과 우유 토마토 1 개
2 물 오렌지 감자
주스 망고 칩 3 개

행당 사전 목록으로 변환하고 싶습니다.

rows = [{'customer': 1, 'item1': 'apple', 'item2': 'milk', 'item3': 'tomato'},
    {'customer': 2, 'item1': 'water', 'item2': 'orange', 'item3': 'potato'},
    {'customer': 3, 'item1': 'juice', 'item2': 'mango', 'item3': 'chips'}]

2
스택 오버플로에 오신 것을 환영합니다! 코드 샘플을 4 칸 들여 쓰기하여 올바르게 렌더링합니다. 형식에 대한 자세한 내용은 편집 도움말을 참조하십시오.
ByteHamster

답변:


189

편집하다

John Galt이 그의 답변 에서 언급했듯이 , 아마도 대신 사용해야 df.to_dict('records')합니다. 수동으로 바꾸는 것보다 빠릅니다.

In [20]: timeit df.T.to_dict().values()
1000 loops, best of 3: 395 µs per loop

In [21]: timeit df.to_dict('records')
10000 loops, best of 3: 53 µs per loop

원래 답변

df.T.to_dict().values()아래와 같이를 사용하십시오 .

In [1]: df
Out[1]:
   customer  item1   item2   item3
0         1  apple    milk  tomato
1         2  water  orange  potato
2         3  juice   mango   chips

In [2]: df.T.to_dict().values()
Out[2]:
[{'customer': 1.0, 'item1': 'apple', 'item2': 'milk', 'item3': 'tomato'},
 {'customer': 2.0, 'item1': 'water', 'item2': 'orange', 'item3': 'potato'},
 {'customer': 3.0, 'item1': 'juice', 'item2': 'mango', 'item3': 'chips'}]

2
각 고객에 대해 많은 행을 포함하는 데이터 프레임의 경우 솔루션은 무엇입니까?
Aziz

2
내가 사용할 때 df.T.to_dict().values(), 나는 또한 정렬 순서를 느슨하게
Hussain

dicts 목록으로 csv 파일을 열 때, 나는 두 배의 속도를 unicodecsv.DictReader

220

사용 df.to_dict('records')-외부에서 조옮김없이 출력을 제공합니다.

In [2]: df.to_dict('records')
Out[2]:
[{'customer': 1L, 'item1': 'apple', 'item2': 'milk', 'item3': 'tomato'},
 {'customer': 2L, 'item1': 'water', 'item2': 'orange', 'item3': 'potato'},
 {'customer': 3L, 'item1': 'juice', 'item2': 'mango', 'item3': 'chips'}]

2
결과 목록의 각 항목에 색인 값을 포함 시키려면 어떻게 변경합니까?
Gabriel L. Oliveira

5
@ GabrielL.Oliveira 당신은 df.reset_index (). to_dict ( 'records')
Wei Ma

각 경우에 열의 순서가 예약되어 있습니까? 즉 결과 목록의 n 번째 항목이 항상 n 번째 열입니까?
Cleb

@Cleb는 i.e. is the nth entry in the resulting list always also the nth column?n 번째 열입니까 n 번째 행입니까?
Nauman Naeem

14

John Galt의 답변을 확장 한 것으로 -

다음 DataFrame의 경우

   customer  item1   item2   item3
0         1  apple    milk  tomato
1         2  water  orange  potato
2         3  juice   mango   chips

인덱스 값을 포함한 사전 목록을 얻으려면 다음과 같이 할 수 있습니다.

df.to_dict('index')

부모 사전의 키가 색인 값인 사전 사전을 출력합니다. 이 특별한 경우에는

{0: {'customer': 1, 'item1': 'apple', 'item2': 'milk', 'item3': 'tomato'},
 1: {'customer': 2, 'item1': 'water', 'item2': 'orange', 'item3': 'potato'},
 2: {'customer': 3, 'item1': 'juice', 'item2': 'mango', 'item3': 'chips'}}

1

하나의 열만 선택하려는 경우 작동합니다.

df[["item1"]].to_dict("records")

아래는 작동 하지 않으며 TypeError : unsupported type :을 생성합니다. 나는 이것이 데이터 프레임이 아닌 dict로 시리즈를 dict로 변환하려고하기 때문이라고 생각합니다.

df["item1"].to_dict("records")

하나의 열만 선택하고 열 이름을 키로 사용하는 dicts 목록으로 변환해야한다는 요구 사항이 있었으며 공유 할 것으로 생각했습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.