«pandas» 태그된 질문

Pandas는 데이터 조작 및 분석을위한 Python 라이브러리입니다. 예를 들어 통계, 실험 과학 결과, 계량 경제학 또는 재무에서 일반적으로 사용되는 데이터 프레임, 다차원 시계열 및 단면 데이터 세트입니다. Pandas는 Python의 주요 데이터 과학 라이브러리 중 하나입니다.

6
csv import pandas 중 행 건너 뛰기
을 사용하여 .csv 파일 pandas.read_csv()을 가져 오려고하는데 데이터 파일의 두 번째 행 (0- 인덱싱의 경우 인덱스 = 1 인 행)을 가져오고 싶지 않습니다. 명령에 사용 된 인수가 모호해 보이기 때문에 가져 오지 않는 방법을 알 수 없습니다. pandas 웹 사이트에서 : skiprows : 목록 유사 또는 정수 건너 뛸 행 …
98 python  csv  pandas 

2
Pandas에서 특정 조건이 충족되는 행 값 업데이트
다음 데이터 프레임이 있다고 가정합니다. 컬럼의 값 업데이트 할 수있는 가장 효율적인 방법은 무엇입니까 위업 과 another_feat 스트림 번호 (2)는 ? 이거예요? for index, row in df.iterrows(): if df1.loc[index,'stream'] == 2: # do something 업데이트 : 열이 100 개 이상이면 어떻게해야합니까? 업데이트 할 열의 이름을 명시 적으로 지정하고 싶지 않습니다. …

13
python-pandas 및 mysql과 같은 데이터베이스
Pandas 문서에는 다양한 형식으로 저장된 데이터 작업에 대한 모범 사례의 수많은 예가 있습니다. 그러나 예를 들어 MySQL과 같은 데이터베이스 작업에 대한 좋은 예를 찾을 수 없습니다. 누구든지 링크를 가리 키거나 mysql-python 을 사용하여 쿼리 결과를 Pandas의 데이터 프레임으로 효율적 으로 변환하는 방법에 대한 코드 스 니펫을 제공 할 수 있습니까?
97 python  pandas 

12
mongodb에서 pandas로 데이터를 가져 오는 방법은 무엇입니까?
mongodb의 컬렉션에 분석해야 할 많은 양의 데이터가 있습니다. 해당 데이터를 Pandas로 어떻게 가져 옵니까? 나는 pandas와 numpy를 처음 사용합니다. 편집 : mongodb 컬렉션에는 날짜 및 시간 태그가 지정된 센서 값이 포함되어 있습니다. 센서 값은 float 데이터 유형입니다. 샘플 데이터 : { "_cls" : "SensorReport", "_id" : ObjectId("515a963b78f6a035d9fa531b"), "_types" : [ …

4
단일 변수에 대한 빈도 표
오늘의 마지막 초보자 팬더 질문 : 단일 시리즈에 대한 테이블을 어떻게 생성합니까? 예를 들면 : my_series = pandas.Series([1,2,2,3,3,3]) pandas.magical_frequency_function( my_series ) >> { 1 : 1, 2 : 2, 3 : 3 } 많은 인터넷 검색이 나를 Series.describe () 및 pandas.crosstabs로 이끌었지만 둘 중 어느 것도 내가 필요한 것을 수행하지 …

4
포인트를 사용하여 팬더 데이터 프레임의 두 열을 그리는 방법은 무엇입니까?
팬더 데이터 프레임이 있고 한 열의 값과 다른 열의 값을 플로팅하고 싶습니다. 다행히도 plot필요한 작업을 수행하는 것처럼 보이는 데이터 프레임과 관련된 방법이 있습니다. df.plot(x='col_name_1', y='col_name_2') 불행히도, (열거 된 플롯 스타일 중에서처럼 보이는 여기에 애프터 kind지점이없는 매개 변수). 선이나 막대 또는 밀도를 사용할 수 있지만 점은 사용할 수 없습니다. 이 문제를 …

7
라벨로 선택하는 Pandas는 때때로 Series를 반환하고 때로는 DataFrame을 반환합니다.
Pandas에서 인덱스에 항목이 하나만있는 레이블을 선택하면 Series가 반환되지만 항목이 하나 이상있는 항목을 선택하면 데이터 프레임이 반환됩니다. 왜 그런 겁니까? 항상 데이터 프레임을 되 찾을 수있는 방법이 있습니까? In [1]: import pandas as pd In [2]: df = pd.DataFrame(data=range(5), index=[1, 2, 3, 3, 3]) In [3]: type(df.loc[3]) Out[3]: pandas.core.frame.DataFrame In [4]: …

5
NaN과 None의 차이점은 무엇입니까?
팬더를 사용하여 csv 파일의 두 열을 읽은 readcsv()다음 값을 사전에 할당합니다. 열에는 숫자와 문자의 문자열이 포함됩니다. 때때로 셀이 비어있는 경우가 있습니다. 제 생각에는 해당 사전 항목에 읽은 값이 있어야 None하지만 대신 nan할당됩니다. 확실히 None이 널 값이 같은 반면, 빈 셀의 더 자세한 설명입니다 nan단지는 값 읽기 수없는 것을 말한다. 내 …
97 python  numpy  pandas  nan 

2
"not in"조건에 따라 데이터 프레임에서 행 삭제 [중복]
이 질문에는 이미 답변이 있습니다 . SQL에서와 같이 'in'과 'not in'을 사용하여 Pandas 데이터 프레임을 필터링하는 방법 (9 답변) 휴일 3 개월 전 . 날짜 열의 값이 날짜 목록에있을 때 팬더 데이터 프레임에서 행을 삭제하고 싶습니다. 다음 코드는 작동하지 않습니다. a=['2015-01-01' , '2015-02-01'] df=df[df.datecolumn not in a] 다음과 같은 오류가 …
97 python  pandas 

4
DataFrame의 문자열이지만 dtype은 객체입니다.
왜 Pandas는 내가 객체를 가지고 있다고 말하는데, 선택된 열의 모든 항목은 명시 적 변환 후에도 문자열입니다. 이것은 내 DataFrame입니다. <class 'pandas.core.frame.DataFrame'> Int64Index: 56992 entries, 0 to 56991 Data columns (total 7 columns): id 56992 non-null values attr1 56992 non-null values attr2 56992 non-null values attr3 56992 non-null values attr4 56992 …
96 python  pandas  numpy  types  series 

5
Pandas 데이터 프레임 열 헤더를 모두 소문자로 만들려면 어떻게해야합니까?
팬더 데이터 프레임의 모든 열 머리글을 소문자로 만들고 싶습니다. 예 만약 내가 가지고 있다면: data = country country isocode year XRAT tcgdp 0 Canada CAN 2001 1.54876 924909.44207 1 Canada CAN 2002 1.56932 957299.91586 2 Canada CAN 2003 1.40105 1016902.00180 .... 다음과 같은 작업을 수행하여 XRAT를 xrat로 변경하고 싶습니다. data.headers.lowercase() …

12
Jupyter 노트북은 두 개의 판다 테이블을 나란히 표시합니다.
두 개의 pandas 데이터 프레임이 있으며 Jupyter 노트북에 표시하고 싶습니다. 다음과 같이합니다. display(df1) display(df2) 아래에 하나씩 표시합니다. 첫 번째 데이터 프레임의 오른쪽에 두 번째 데이터 프레임을 갖고 싶습니다. 이 비슷한 질문이 있지만, 사람이 그들 사이의 차이를 보여주는 하나의 dataframe에서 그들을 병합하여 하나 만족이 것 같습니다. 이것은 나를 위해 작동하지 않습니다. …

3
Pandas DataFrame 헤더에서 공백을 제거하려면 어떻게해야합니까?
일부 열 머리글에 추가 공백이있는 Excel 파일의 데이터를 구문 분석하고 있습니다. 를 사용하여 결과 데이터 프레임의 열을 확인하면 df.columns다음을 볼 수 있습니다. Index(['Year', 'Month ', 'Value']) ^ # Note the unwanted trailing space on 'Month ' 결과적으로 다음을 수행 할 수 없습니다. df["Month"] "Month"가 아니라 "Month"를 요청했듯이 열을 찾을 수 …

6
Pandas 반복에 성능 문제가 있습니까?
pandas에서 반복을 사용할 때 성능이 매우 떨어지는 것을 발견했습니다. 이것은 다른 사람들이 경험하는 것입니까? 반복에만 해당되며 특정 크기의 데이터에 대해이 함수를 사용하지 않아야합니까 (2 ~ 3 백만 행으로 작업하고 있음)? GitHub에 대한이 토론 은 데이터 프레임에서 dtype을 혼합 할 때 발생한다고 믿게 만들었지 만, 아래의 간단한 예제는 하나의 dtype (float64)을 …

3
판다 집계 수 구별
사용자 활동에 대한 로그가 있고 총 기간 및 일일 순 사용자 수에 대한 보고서를 생성하려고한다고 가정 해 보겠습니다. import numpy as np import pandas as pd df = pd.DataFrame({'date': ['2013-04-01','2013-04-01','2013-04-01','2013-04-02', '2013-04-02'], 'user_id': ['0001', '0001', '0002', '0002', '0002'], 'duration': [30, 15, 20, 15, 30]}) 기간 집계는 매우 간단합니다. group = df.groupby('date') …
96 python  pandas 

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.