프로그램 작성 pandas

6

나는 이것을 할 수있는 확실한 방법이 있다고 확신하지만 지금은 매끄러운 것을 생각할 수 없습니다. 기본적으로 대신 예외를 발생의 나는 좀하고 싶습니다 True또는 False값이 팬더에 존재하는지 df인덱스입니다. import pandas as pd df = pd.DataFrame({'test':[1,2,3,4]}, index=['a','b','c','d']) df.loc['g'] # (should give False) 내가 지금 일하고있는 것은 다음과 같습니다 sum(df.index == 'g')

139 python pandas ipython

6

URL에서 팬더 read_csv

IPython과 함께 Python 3.4를 사용하고 있으며 다음 코드가 있습니다. 주어진 URL에서 csv 파일을 읽을 수 없습니다 : import pandas as pd import requests url="https://github.com/cs109/2014_data/blob/master/countries.csv" s=requests.get(url).content c=pd.read_csv(s) 다음과 같은 오류가 있습니다 "예상 된 파일 경로 이름 또는 파일과 유사한 객체, 유형이 있음" 이 문제를 어떻게 해결할 수 있습니까?

138 python csv pandas request

6

팬더 : 설정 번호 최대 행 수

다음을 보는 데 문제가 있습니다 DataFrame. n = 100 foo = DataFrame(index=range(n)) foo['floats'] = np.random.randn(n) foo 문제는 ipython 노트북에서 기본값마다 모든 행을 인쇄하지는 않지만 결과 행을 보려면 슬라이스해야한다는 것입니다. 다음 옵션조차도 출력을 변경하지 않습니다. pd.set_option('display.max_rows', 500) 누구든지 전체 배열을 표시하는 방법을 알고 있습니까?

138 python formatting pandas ipython-notebook

7

이름에 특정 문자열이 포함 된 열 찾기

열 이름이있는 데이터 프레임이 있는데 특정 문자열이 포함되어 있지만 정확히 일치하지 않는 데이터 프레임을 찾고 싶습니다. 내가 찾고 있어요 'spike'열 이름이 좋아에 'spike-2', 'hey spike', 'spiked-in'합니다 ( 'spike'일부는 항상 연속). 열 이름이 문자열 또는 변수로 반환되기를 원하므로 나중에 df['name']또는 df[name]정상적으로 열에 액세스합니다 . 나는 이것을 할 수있는 방법을 찾으려고 노력했다. …

137 python python-3.x string pandas dataframe

5

팬더 데이터 프레임은 각 그룹의 첫 번째 행을 얻습니다.

DataFrame다음과 같은 팬더가 있습니다 . df = pd.DataFrame({'id' : [1,1,1,2,2,3,3,3,3,4,4,5,6,6,6,7,7], 'value' : ["first","second","second","first", "second","first","third","fourth", "fifth","second","fifth","first", "first","second","third","fourth","fifth"]}) 이것을 ""id ","value "]로 그룹화하고 각 그룹의 첫 번째 행을 가져오고 싶습니다. id value 0 1 first 1 1 second 2 1 second 3 2 first 4 2 second 5 3 first 6 3 …

137 python pandas dataframe

6

sklearn으로 확장 가능한 팬더 데이터 프레임 열

혼합 유형 열이있는 팬더 데이터 프레임이 있으며 일부 열에 sklearn의 min_max_scaler를 적용하고 싶습니다. 이상적으로는 이러한 변형을 제자리에서 수행하고 싶지만 아직 그렇게 할 방법을 찾지 못했습니다. 작동하는 다음 코드를 작성했습니다. import pandas as pd import numpy as np from sklearn import preprocessing scaler = preprocessing.MinMaxScaler() dfTest = pd.DataFrame({'A':[14.00,90.20,90.95,96.27,91.21],'B':[103.02,107.26,110.35,114.23,114.68], 'C':['big','small','big','small','small']}) min_max_scaler = …

137 python pandas scikit-learn dataframe

4

두 팬더 데이터 프레임 열의 사전을 만드는 가장 효율적인 방법은 무엇입니까?

다음 팬더 데이터 프레임을 구성하는 가장 효율적인 방법은 무엇입니까? 데이터 = Position Letter 1 a 2 b 3 c 4 d 5 e 같은 사전에 alphabet[1 : 'a', 2 : 'b', 3 : 'c', 4 : 'd', 5 : 'e']?

136 python dictionary pandas dataframe

4

팬더 조인 문제 : 열이 겹치지 만 접미사가 지정되지 않았습니다.

다음과 같은 2 개의 데이터 프레임이 있습니다. df_a = mukey DI PI 0 100000 35 14 1 1000005 44 14 2 1000006 44 14 3 1000007 43 13 4 1000008 43 13 df_b = mukey niccdcd 0 190236 4 1 190237 6 2 190238 7 3 190239 4 4 190240 …

136 python join pandas

6

tsv 파일을 Pandas DataFrame에로드하는 방법?

저는 파이썬과 팬더를 처음 사용합니다. tsv파일을 pandas에로드 하려고합니다 DataFrame. 이것은 내가 시도하고 있고 내가 얻는 오류입니다. >>> df1 = DataFrame(csv.reader(open('c:/~/trainSetRel3.txt'), delimiter='\t')) Traceback (most recent call last): File "<pyshell#28>", line 1, in <module> df1 = DataFrame(csv.reader(open('c:/~/trainSetRel3.txt'), delimiter='\t')) File "C:\Python27\lib\site-packages\pandas\core\frame.py", line 318, in __init__ raise PandasError('DataFrame constructor not properly called!') PandasError: DataFrame …

136 python pandas csv

6

팬더 : 열의 텍스트를 여러 행으로 나누려면 어떻게합니까?

큰 csv 파일로 작업하고 있으며 마지막 열 옆에는 특정 구분 기호로 분할하려는 텍스트 문자열이 있습니다. 팬더 또는 파이썬을 사용 하여이 작업을 수행하는 간단한 방법이 있는지 궁금합니다. CustNum CustomerName ItemQty Item Seatblocks ItemExt 32363 McCartney, Paul 3 F04 2:218:10:4,6 60 31316 Lennon, John 25 F01 1:13:36:1,12 1:13:37:1,13 300 나는 공간으로 분할 …

135 python pandas dataframe

8

Pandas는 목록 열을 여러 열로 분할합니다.

하나의 열이있는 pandas DataFrame이 있습니다. import pandas as pd df = pd.DataFrame( data={ "teams": [ ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ] } ) print(df) 산출: teams 0 [SF, NYG] 1 [SF, NYG] 2 [SF, NYG] 3 [SF, NYG] 4 [SF, NYG] …

135 python pandas

3

pandas : 데이터 프레임을 인덱싱하는 동안 여러 조건-예기치 않은 동작

두 열의 값으로 데이터 프레임의 행을 필터링하고 있습니다. 어떤 이유로 OR 연산자는 AND 연산자가 예상하는 것처럼 작동하며 그 반대의 경우도 마찬가지입니다. 내 테스트 코드 : import pandas as pd df = pd.DataFrame({'a': range(5), 'b': range(5) }) # let's insert some -1 values df['a'][1] = -1 df['b'][1] = -1 df['a'][3] = …

135 python pandas boolean-logic

8

팬더 고유 값 여러 열

df = pd.DataFrame({'Col1': ['Bob', 'Joe', 'Bill', 'Mary', 'Joe'], 'Col2': ['Joe', 'Steve', 'Bob', 'Bob', 'Steve'], 'Col3': np.random.random(5)}) 'Col1'과 'Col2'의 고유 한 값을 반환하는 가장 좋은 방법은 무엇입니까? 원하는 출력은 'Bob', 'Joe', 'Bill', 'Mary', 'Steve'

134 python pandas dataframe unique

9

ImportError : dateutil.parser라는 모듈이 없습니다.

프로그램 pandas에서 가져올 때 다음 오류가 발생 Python합니다 monas-mbp:book mona$ sudo pip install python-dateutil Requirement already satisfied (use --upgrade to upgrade): python-dateutil in /System/Library/Frameworks/Python.framework/Versions/2.7/Extras/lib/python Cleaning up... monas-mbp:book mona$ python t1.py No module named dateutil.parser Traceback (most recent call last): File "t1.py", line 4, in <module> import pandas as pd File …

134 python pandas pip

4

파이썬 팬더 : 행 단위로 데이터 프레임 채우기

pandas.DataFrame객체에 행을 추가하는 간단한 작업은 달성하기 어려운 것 같습니다. 이와 관련하여 3 가지 스택 오버 플로우 질문이 있지만 그중 아무것도 작동하지 않습니다. 여기 내가하려는 일이 있습니다. 행과 열의 이름뿐만 아니라 모양을 이미 알고있는 DataFrame이 있습니다. >>> df = pandas.DataFrame(columns=['a','b','c','d'], index=['x','y','z']) >>> df a b c d x NaN NaN NaN …

133 python dataframe row pandas

«pandas» 태그된 질문