«pandas» 태그된 질문

Pandas는 데이터 조작 및 분석을위한 Python 라이브러리입니다. 예를 들어 통계, 실험 과학 결과, 계량 경제학 또는 재무에서 일반적으로 사용되는 데이터 프레임, 다차원 시계열 및 단면 데이터 세트입니다. Pandas는 Python의 주요 데이터 과학 라이브러리 중 하나입니다.

6
iPython에서 Pandas Library를 사용하여 .xlsx 파일을 읽는 방법은 무엇입니까?
Python의 Pandas Library를 사용하여 .xlsx 파일을 읽고 데이터를 postgreSQL 테이블로 이식하고 싶습니다. 지금까지 할 수있는 일은 다음과 같습니다. import pandas as pd data = pd.ExcelFile("*File Name*") 이제 단계가 성공적으로 실행되었음을 알고 있지만 Excel의 데이터가 변수 데이터의 데이터에 어떻게 매핑되는지 이해할 수 있도록 읽은 ​​Excel 파일을 구문 분석 할 수있는 방법을 …



8
Pandas 데이터 프레임의 범주 형 데이터 변환
이 유형의 데이터 (너무 많은 열)가있는 데이터 프레임이 있습니다. col1 int64 col2 int64 col3 category col4 category col5 category 열은 다음과 같이 보입니다. Name: col3, dtype: category Categories (8, object): [B, C, E, G, H, N, S, W] 다음과 같이 열의 모든 값을 정수로 변환하고 싶습니다. [1, 2, 3, 4, …
103 python  pandas 

9
팬더에서 여러 열을 반환 apply ()
나는 DataFrame 팬더 있습니다 df_test. 크기를 바이트 단위로 나타내는 'size'열을 포함합니다. 다음 코드를 사용하여 KB, MB 및 GB를 계산했습니다. df_test = pd.DataFrame([ {'dir': '/Users/uname1', 'size': 994933}, {'dir': '/Users/uname2', 'size': 109338711}, ]) df_test['size_kb'] = df_test['size'].astype(int).apply(lambda x: locale.format("%.1f", x / 1024.0, grouping=True) + ' KB') df_test['size_mb'] = df_test['size'].astype(int).apply(lambda x: locale.format("%.1f", x / …





7
matplotlib를 사용하여 다양한 범주 수준에 대해 다른 색을 플로팅합니다.
나는 diamonds같은 변수로 구성된 이 데이터 프레임 을 가지고 있으며 각 에 대한 (carat, price, color)산점도를 그리려고합니다. 즉 , 플롯에서 다른 색상 이 있음을 의미 합니다.pricecaratcolorcolor 이것은 다음 R과 ggplot같이 쉽습니다 . ggplot(aes(x=carat, y=price, color=color), #by setting color=color, ggplot automatically draw in different colors data=diamonds) + geom_point(stat='summary', fun.y=median) 나는 이것을 …

3
Pandas 데이터 프레임 열을 정수가 아닌 문자열로 가져 오기
다음 csv를 int64가 아닌 문자열로 가져오고 싶습니다. Pandas read_csv는 자동으로 int64로 변환하지만이 열은 문자열로 필요합니다. ID 00013007854817840016671868 00013007854817840016749251 00013007854817840016754630 00013007854817840016781876 00013007854817840017028824 00013007854817840017963235 00013007854817840018860166 df = read_csv('sample.csv') df.ID >> 0 -9223372036854775808 1 -9223372036854775808 2 -9223372036854775808 3 -9223372036854775808 4 -9223372036854775808 5 -9223372036854775808 6 -9223372036854775808 Name: ID 불행히도 변환기를 사용하면 동일한 결과를 얻을 …
102 python  pandas 

7
Python Pandas에서 두 값 사이의 DataFrame에서 행을 선택하는 방법은 무엇입니까?
df열의 값 closing_price이 99에서 101 사이 인 행만 포함 하도록 DataFrame을 수정하고 아래 코드로이를 수행하려고합니다. 그러나 오류가 발생합니다. ValueError : 시리즈의 진실 값이 모호합니다. a.empty, a.bool (), a.item (), a.any () 또는 a.all () 사용 루프를 사용하지 않고 이렇게 할 수있는 방법이 있는지 궁금합니다. df = df[(99 <= df['closing_price'] <= …
102 python  pandas 

4
Pandas 데이터 프레임에 상수 값이있는 열 추가 [중복]
이 질문에는 이미 답변이 있습니다 . 상수 값으로 데이터 프레임에 열 추가 (4 답변) 휴일 3 개월 전 . DataFrame이 주어지면 : np.random.seed(0) df = pd.DataFrame(np.random.randn(3, 3), columns=list('ABC'), index=[1, 2, 3]) df A B C 1 1.764052 0.400157 0.978738 2 2.240893 1.867558 -0.977278 3 0.950088 -0.151357 -0.103219 상수 값 (예 …
102 python  pandas 


2
Python / numpy / pandas에서 임의의 객체가 NaN인지 효율적으로 확인합니까?
내 numpy 배열은 np.nan누락 된 값을 지정 하는 데 사용 합니다. 데이터 세트를 반복하면서 이러한 누락 된 값을 감지하고 특수한 방식으로 처리해야합니다. 에서 지원하는 유형의 하위 집합이 아닌 numpy.isnan(val)한 잘 작동 val하는 numpy.isnan(). 예를 들어 문자열 필드에서 누락 된 데이터가 발생할 수 있으며이 경우 다음과 같은 결과가 발생합니다. >>> np.isnan('some_string') …
101 python  numpy  pandas 

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.