프로그램 작성 dataframe

5

키별로 groupby 객체의 해당 groupby 데이터 프레임에 어떻게 액세스합니까? 다음과 같은 그룹별로 : rand = np.random.RandomState(1) df = pd.DataFrame({'A': ['foo', 'bar'] * 3, 'B': rand.randn(6), 'C': rand.randint(0, 20, 6)}) gb = df.groupby(['A']) 키와 그룹을 얻기 위해 반복 할 수 있습니다. In [11]: for k, gp in gb: print 'key=' + …

154 python pandas dataframe group-by pandas-groupby

9

데이터 프레임 열의 데이터 유형 결정

R을 사용하고 있으며를 사용하여 데이터를 데이터 프레임에로드했습니다 read.csv(). 데이터 프레임에서 각 열의 데이터 유형을 어떻게 확인합니까?

153 r dataframe types

6

data.frame 열 형식을 문자에서 요소로 변환

data.frame 객체 ( mydf) 의 일부 열의 형식 (클래스 )을 charactor 에서 factor 로 변경하고 싶습니다 . read.table()함수로 텍스트 파일을 읽을 때이 작업을 수행하고 싶지 않습니다 . 도움을 주시면 감사하겠습니다.

153 r dataframe character r-faq

7

팬더 : 주어진 열에 대한 DataFrame 행 합계

다음과 같은 DataFrame이 있습니다. In [1]: import pandas as pd df = pd.DataFrame({'a': [1,2,3], 'b': [2,3,4], 'c':['dd','ee','ff'], 'd':[5,9,1]}) df Out [1]: a b c d 0 1 2 dd 5 1 2 3 ee 9 2 3 4 ff 1 나는 열을 추가 할 'e'컬럼의 합이다 'a', 'b'하고 'd'. 포럼을 …

153 python pandas dataframe sum

6

data.frame 또는 행렬을 사용해야합니까?

언제을 사용해야하고 언제을 사용하는 data.frame것이 더 낫 matrix습니까? 둘 다 데이터를 직사각형 형식으로 유지하기 때문에 때때로 불분명합니다. 언제 어떤 데이터 유형을 사용해야하는지에 대한 일반적인 규칙이 있습니까?

152 r matrix dataframe r-faq

5

pandas DataFrame에서 "Unnamed : 0"열을 제거하는 방법은 무엇입니까?

때때로 csv에서 읽을 때 df원하지 않는 인덱스와 같은 열을 얻는 상황이 있습니다 unnamed:0. file.csv ,A,B,C 0,1,2,3 1,4,5,6 2,7,8,9 CSV는 다음과 같이 읽습니다. pd.read_csv('file.csv') Unnamed: 0 A B C 0 0 1 2 3 1 1 4 5 6 2 2 7 8 9 이것은 매우 성가시다! 누구든지 이것을 제거하는 방법에 …

152 python pandas csv dataframe

3

Pandas의 부울 색인 생성을위한 논리 연산자

팬더에서 부울 인덱스로 작업하고 있습니다. 문제는 진술이 왜 : a[(a['some_column']==some_number) & (a['some_other_column']==some_other_number)] 반면 잘 작동합니다 a[(a['some_column']==some_number) and (a['some_other_column']==some_other_number)] 오류와 함께 종료 하시겠습니까? 예: a=pd.DataFrame({'x':[1,1],'y':[10,20]}) In: a[(a['x']==1)&(a['y']==10)] Out: x y 0 1 10 In: a[(a['x']==1) and (a['y']==10)] Out: ValueError: The truth value of an array with more than one element is …

152 python pandas dataframe boolean filtering

8

팬더가 자동으로 날짜를 인식 할 수 있습니까?

오늘 나는 데이터 파일 (예 : 팬더)에서 데이터를 읽는 동안 팬더가 값 유형을 인식 할 수 있다는 사실에 놀랐습니다. df = pandas.read_csv('test.dat', delimiter=r"\s+", names=['col1','col2','col3']) 예를 들어 다음과 같이 확인할 수 있습니다. for i, r in df.iterrows(): print type(r['col1']), type(r['col2']), type(r['col3']) 특히 정수, 부동 소수점 및 문자열이 올바르게 인식되었습니다. 그러나 다음 …

151 python date types dataframe pandas

3

팬더는 열 이름만으로 빈 DataFrame을 만듭니다.

동적으로 작동하는 동적 DataFrame이 있지만 DataFrame에 추가 할 데이터가 없으면 오류가 발생합니다. 따라서 열 이름만으로 빈 DataFrame을 만드는 솔루션이 필요합니다. 지금은 다음과 같은 것이 있습니다. df = pd.DataFrame(columns=COLUMN_NAMES) # Note that there are now row data inserted. 추신 : 열 이름이 여전히 DataFrame에 나타나는 것이 중요합니다. 그러나 이것을 이와 같이 …

151 python pandas dataframe

10

대용량 데이터에서 NA를 대체하는 가장 빠른 방법

~ 200k 행과 200 열에 흩어져있는 많은 결 측값 이있는 큰 data.table이 있습니다. 해당 NA 값을 가능한 효율적으로 0으로 다시 코딩하고 싶습니다. 두 가지 옵션이 있습니다 .1 : data.frame으로 변환하고 다음 과 같이 사용 하십시오 .2 : 멋진 데이터. 테이블 하위 설정 명령 타입 1의 상당히 효율적인 솔루션에 만족합니다. data.frame으로 …

150 r performance dataframe data.table

8

열에 지정된 횟수만큼 data.frame의 각 행을 반복합니다.

df <- data.frame(var1 = c('a', 'b', 'c'), var2 = c('d', 'e', 'f'), freq = 1:3) 각 행이 'freq'열에 지정된 횟수만큼 반복되도록 위의 data.frame의 처음 두 열을 각 행으로 확장하는 가장 간단한 방법은 무엇입니까? 다시 말해, 이것에서 가십시오 : df var1 var2 freq 1 a d 1 2 b e 2 …

150 r dataframe replicate

12

팬더에서 공백 값 (공백)을 NaN으로 바꾸기

공백 (임의의 양)을 포함하는 Pandas 데이터 프레임에서 모든 값을 찾고 해당 값을 NaN으로 바꾸고 싶습니다. 이것이 어떻게 개선 될 수있는 아이디어가 있습니까? 기본적으로 나는 이것을 돌리고 싶다 : A B C 2000-01-01 -0.532681 foo 0 2000-01-02 1.490752 bar 1 2000-01-03 -1.387326 foo 2 2000-01-04 0.814772 baz 2000-01-05 -0.222552 4 2000-01-06 …

150 python pandas dataframe

11

모든 값이 NA 인 데이터 프레임에서 열 제거

나는 데이터 프레임에 문제가 정말 그 문제를 자신을 확인할 수 없습니다 : dataframe은 임의의가 열 등의 속성을 하고 각 행은 하나 개를 나타냅니다 데이터 세트를 . 질문 : 어떻게하는 어디에서 열을 제거 ALL 행 값이 NA는 ?

149 r apply dataframe

7

행 이름을 첫 번째 열로 변환

다음과 같은 데이터 프레임이 있습니다. df VALUE ABS_CALL DETECTION P-VALUE 1007_s_at "957.729231881542" "P" "0.00486279317241156" 1053_at "320.632701283368" "P" "0.0313356324173416" 117_at "429.842323161046" "P" "0.0170004527476119" 121_at "2395.7364289242" "P" "0.0114473584876183" 1255_g_at "116.493632746934" "A" "0.39799368200131" 1294_at "739.927122116896" "A" "0.0668649772942343" 행 이름을 첫 번째 열로 변환하고 싶습니다. 현재 행 이름을 첫 번째 열로 만들기 위해 다음과 …

147 r dataframe col rowname

10

Pandas 열 내부의 사전 / 목록을 별도의 열로 분할

postgreSQL 데이터베이스에 저장된 데이터가 있습니다. Python2.7을 사용 하여이 데이터를 쿼리하고 Pandas DataFrame으로 변환합니다. 그러나이 데이터 프레임의 마지막 열에는 그 안에 값의 사전 (또는 목록?)이 있습니다. DataFrame은 다음과 같습니다. [1] df Station ID Pollutants 8809 {"a": "46", "b": "3", "c": "12"} 8810 {"a": "36", "b": "5", "c": "8"} 8811 {"b": "2", …

147 python pandas dictionary dataframe

«dataframe» 태그된 질문