«pandas» 태그된 질문

Pandas는 데이터 조작 및 분석을위한 Python 라이브러리입니다. 예를 들어 통계, 실험 과학 결과, 계량 경제학 또는 재무에서 일반적으로 사용되는 데이터 프레임, 다차원 시계열 및 단면 데이터 세트입니다. Pandas는 Python의 주요 데이터 과학 라이브러리 중 하나입니다.

6
팬더 데이터 프레임 인덱스에 값이 있는지 확인하십시오.
나는 이것을 할 수있는 확실한 방법이 있다고 확신하지만 지금은 매끄러운 것을 생각할 수 없습니다. 기본적으로 대신 예외를 발생의 나는 좀하고 싶습니다 True또는 False값이 팬더에 존재하는지 df인덱스입니다. import pandas as pd df = pd.DataFrame({'test':[1,2,3,4]}, index=['a','b','c','d']) df.loc['g'] # (should give False) 내가 지금 일하고있는 것은 다음과 같습니다 sum(df.index == 'g')
139 python  pandas  ipython 

6
URL에서 팬더 read_csv
IPython과 함께 Python 3.4를 사용하고 있으며 다음 코드가 있습니다. 주어진 URL에서 csv 파일을 읽을 수 없습니다 : import pandas as pd import requests url="https://github.com/cs109/2014_data/blob/master/countries.csv" s=requests.get(url).content c=pd.read_csv(s) 다음과 같은 오류가 있습니다 "예상 된 파일 경로 이름 또는 파일과 유사한 객체, 유형이 있음" 이 문제를 어떻게 해결할 수 있습니까?
138 python  csv  pandas  request 

6
팬더 : 설정 번호 최대 행 수
다음을 보는 데 문제가 있습니다 DataFrame. n = 100 foo = DataFrame(index=range(n)) foo['floats'] = np.random.randn(n) foo 문제는 ipython 노트북에서 기본값마다 모든 행을 인쇄하지는 않지만 결과 행을 보려면 슬라이스해야한다는 것입니다. 다음 옵션조차도 출력을 변경하지 않습니다. pd.set_option('display.max_rows', 500) 누구든지 전체 배열을 표시하는 방법을 알고 있습니까?

7
이름에 특정 문자열이 포함 된 열 찾기
열 이름이있는 데이터 프레임이 있는데 특정 문자열이 포함되어 있지만 정확히 일치하지 않는 데이터 프레임을 찾고 싶습니다. 내가 찾고 있어요 'spike'열 이름이 좋아에 'spike-2', 'hey spike', 'spiked-in'합니다 ( 'spike'일부는 항상 연속). 열 이름이 문자열 또는 변수로 반환되기를 원하므로 나중에 df['name']또는 df[name]정상적으로 열에 액세스합니다 . 나는 이것을 할 수있는 방법을 찾으려고 노력했다. …

5
팬더 데이터 프레임은 각 그룹의 첫 번째 행을 얻습니다.
DataFrame다음과 같은 팬더가 있습니다 . df = pd.DataFrame({'id' : [1,1,1,2,2,3,3,3,3,4,4,5,6,6,6,7,7], 'value' : ["first","second","second","first", "second","first","third","fourth", "fifth","second","fifth","first", "first","second","third","fourth","fifth"]}) 이것을 ""id ","value "]로 그룹화하고 각 그룹의 첫 번째 행을 가져오고 싶습니다. id value 0 1 first 1 1 second 2 1 second 3 2 first 4 2 second 5 3 first 6 3 …
137 python  pandas  dataframe 

6
sklearn으로 확장 가능한 팬더 데이터 프레임 열
혼합 유형 열이있는 팬더 데이터 프레임이 있으며 일부 열에 sklearn의 min_max_scaler를 적용하고 싶습니다. 이상적으로는 이러한 변형을 제자리에서 수행하고 싶지만 아직 그렇게 할 방법을 찾지 못했습니다. 작동하는 다음 코드를 작성했습니다. import pandas as pd import numpy as np from sklearn import preprocessing scaler = preprocessing.MinMaxScaler() dfTest = pd.DataFrame({'A':[14.00,90.20,90.95,96.27,91.21],'B':[103.02,107.26,110.35,114.23,114.68], 'C':['big','small','big','small','small']}) min_max_scaler = …



6
tsv 파일을 Pandas DataFrame에로드하는 방법?
저는 파이썬과 팬더를 처음 사용합니다. tsv파일을 pandas에로드 하려고합니다 DataFrame. 이것은 내가 시도하고 있고 내가 얻는 오류입니다. >>> df1 = DataFrame(csv.reader(open('c:/~/trainSetRel3.txt'), delimiter='\t')) Traceback (most recent call last): File "<pyshell#28>", line 1, in <module> df1 = DataFrame(csv.reader(open('c:/~/trainSetRel3.txt'), delimiter='\t')) File "C:\Python27\lib\site-packages\pandas\core\frame.py", line 318, in __init__ raise PandasError('DataFrame constructor not properly called!') PandasError: DataFrame …
136 python  pandas  csv 

6
팬더 : 열의 텍스트를 여러 행으로 나누려면 어떻게합니까?
큰 csv 파일로 작업하고 있으며 마지막 열 옆에는 특정 구분 기호로 분할하려는 텍스트 문자열이 있습니다. 팬더 또는 파이썬을 사용 하여이 작업을 수행하는 간단한 방법이 있는지 궁금합니다. CustNum CustomerName ItemQty Item Seatblocks ItemExt 32363 McCartney, Paul 3 F04 2:218:10:4,6 60 31316 Lennon, John 25 F01 1:13:36:1,12 1:13:37:1,13 300 나는 공간으로 분할 …
135 python  pandas  dataframe 

8
Pandas는 목록 열을 여러 열로 분할합니다.
하나의 열이있는 pandas DataFrame이 있습니다. import pandas as pd df = pd.DataFrame( data={ "teams": [ ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ] } ) print(df) 산출: teams 0 [SF, NYG] 1 [SF, NYG] 2 [SF, NYG] 3 [SF, NYG] 4 [SF, NYG] …
135 python  pandas 

3
pandas : 데이터 프레임을 인덱싱하는 동안 여러 조건-예기치 않은 동작
두 열의 값으로 데이터 프레임의 행을 필터링하고 있습니다. 어떤 이유로 OR 연산자는 AND 연산자가 예상하는 것처럼 작동하며 그 반대의 경우도 마찬가지입니다. 내 테스트 코드 : import pandas as pd df = pd.DataFrame({'a': range(5), 'b': range(5) }) # let's insert some -1 values df['a'][1] = -1 df['b'][1] = -1 df['a'][3] = …

8
팬더 고유 값 여러 열
df = pd.DataFrame({'Col1': ['Bob', 'Joe', 'Bill', 'Mary', 'Joe'], 'Col2': ['Joe', 'Steve', 'Bob', 'Bob', 'Steve'], 'Col3': np.random.random(5)}) 'Col1'과 'Col2'의 고유 한 값을 반환하는 가장 좋은 방법은 무엇입니까? 원하는 출력은 'Bob', 'Joe', 'Bill', 'Mary', 'Steve'

9
ImportError : dateutil.parser라는 모듈이 없습니다.
프로그램 pandas에서 가져올 때 다음 오류가 발생 Python합니다 monas-mbp:book mona$ sudo pip install python-dateutil Requirement already satisfied (use --upgrade to upgrade): python-dateutil in /System/Library/Frameworks/Python.framework/Versions/2.7/Extras/lib/python Cleaning up... monas-mbp:book mona$ python t1.py No module named dateutil.parser Traceback (most recent call last): File "t1.py", line 4, in <module> import pandas as pd File …
134 python  pandas  pip 

4
파이썬 팬더 : 행 단위로 데이터 프레임 채우기
pandas.DataFrame객체에 행을 추가하는 간단한 작업은 달성하기 어려운 것 같습니다. 이와 관련하여 3 가지 스택 오버 플로우 질문이 있지만 그중 아무것도 작동하지 않습니다. 여기 내가하려는 일이 있습니다. 행과 열의 이름뿐만 아니라 모양을 이미 알고있는 DataFrame이 있습니다. >>> df = pandas.DataFrame(columns=['a','b','c','d'], index=['x','y','z']) >>> df a b c d x NaN NaN NaN …
133 python  dataframe  row  pandas 

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.