«dataframe» 태그된 질문

데이터 프레임은 테이블 형식 데이터 구조입니다. 일반적으로 행은 관측치이고 열은 다양한 유형의 변수 인 데이터를 포함합니다. "data frame"또는 "dataframe"은 여러 언어 (R, Apache Spark, deedle, Maple, Python의 팬더 라이브러리 및 Julia의 DataFrames 라이브러리)에서이 개념에 사용되는 용어이지만 "table"은 MATLAB과 SQL.

5
키로 팬더 그룹별로 데이터 프레임에 액세스하는 방법
키별로 groupby 객체의 해당 groupby 데이터 프레임에 어떻게 액세스합니까? 다음과 같은 그룹별로 : rand = np.random.RandomState(1) df = pd.DataFrame({'A': ['foo', 'bar'] * 3, 'B': rand.randn(6), 'C': rand.randint(0, 20, 6)}) gb = df.groupby(['A']) 키와 그룹을 얻기 위해 반복 할 수 있습니다. In [11]: for k, gp in gb: print 'key=' + …



7
팬더 : 주어진 열에 대한 DataFrame 행 합계
다음과 같은 DataFrame이 있습니다. In [1]: import pandas as pd df = pd.DataFrame({'a': [1,2,3], 'b': [2,3,4], 'c':['dd','ee','ff'], 'd':[5,9,1]}) df Out [1]: a b c d 0 1 2 dd 5 1 2 3 ee 9 2 3 4 ff 1 나는 열을 추가 할 'e'컬럼의 합이다 'a', 'b'하고 'd'. 포럼을 …
153 python  pandas  dataframe  sum 

6
data.frame 또는 행렬을 사용해야합니까?
언제을 사용해야하고 언제을 사용하는 data.frame것이 더 낫 matrix습니까? 둘 다 데이터를 직사각형 형식으로 유지하기 때문에 때때로 불분명합니다. 언제 어떤 데이터 유형을 사용해야하는지에 대한 일반적인 규칙이 있습니까?
152 r  matrix  dataframe  r-faq 


3
Pandas의 부울 색인 생성을위한 논리 연산자
팬더에서 부울 인덱스로 작업하고 있습니다. 문제는 진술이 왜 : a[(a['some_column']==some_number) & (a['some_other_column']==some_other_number)] 반면 잘 작동합니다 a[(a['some_column']==some_number) and (a['some_other_column']==some_other_number)] 오류와 함께 종료 하시겠습니까? 예: a=pd.DataFrame({'x':[1,1],'y':[10,20]}) In: a[(a['x']==1)&(a['y']==10)] Out: x y 0 1 10 In: a[(a['x']==1) and (a['y']==10)] Out: ValueError: The truth value of an array with more than one element is …

8
팬더가 자동으로 날짜를 인식 할 수 있습니까?
오늘 나는 데이터 파일 (예 : 팬더)에서 데이터를 읽는 동안 팬더가 값 유형을 인식 할 수 있다는 사실에 놀랐습니다. df = pandas.read_csv('test.dat', delimiter=r"\s+", names=['col1','col2','col3']) 예를 들어 다음과 같이 확인할 수 있습니다. for i, r in df.iterrows(): print type(r['col1']), type(r['col2']), type(r['col3']) 특히 정수, 부동 소수점 및 문자열이 올바르게 인식되었습니다. 그러나 다음 …
151 python  date  types  dataframe  pandas 

3
팬더는 열 이름만으로 빈 DataFrame을 만듭니다.
동적으로 작동하는 동적 DataFrame이 있지만 DataFrame에 추가 할 데이터가 없으면 오류가 발생합니다. 따라서 열 이름만으로 빈 DataFrame을 만드는 솔루션이 필요합니다. 지금은 다음과 같은 것이 있습니다. df = pd.DataFrame(columns=COLUMN_NAMES) # Note that there are now row data inserted. 추신 : 열 이름이 여전히 DataFrame에 나타나는 것이 중요합니다. 그러나 이것을 이와 같이 …
151 python  pandas  dataframe 

10
대용량 데이터에서 NA를 대체하는 가장 빠른 방법
~ 200k 행과 200 열에 흩어져있는 많은 결 측값 이있는 큰 data.table이 있습니다. 해당 NA 값을 가능한 효율적으로 0으로 다시 코딩하고 싶습니다. 두 가지 옵션이 있습니다 .1 : data.frame으로 변환하고 다음 과 같이 사용 하십시오 .2 : 멋진 데이터. 테이블 하위 설정 명령 타입 1의 상당히 효율적인 솔루션에 만족합니다. data.frame으로 …


12
팬더에서 공백 값 (공백)을 NaN으로 바꾸기
공백 (임의의 양)을 포함하는 Pandas 데이터 프레임에서 모든 값을 찾고 해당 값을 NaN으로 바꾸고 싶습니다. 이것이 어떻게 개선 될 수있는 아이디어가 있습니까? 기본적으로 나는 이것을 돌리고 싶다 : A B C 2000-01-01 -0.532681 foo 0 2000-01-02 1.490752 bar 1 2000-01-03 -1.387326 foo 2 2000-01-04 0.814772 baz 2000-01-05 -0.222552 4 2000-01-06 …
150 python  pandas  dataframe 

11
모든 값이 NA 인 데이터 프레임에서 열 제거
나는 데이터 프레임에 문제가 정말 그 문제를 자신을 확인할 수 없습니다 : dataframe은 임의의가 열 등의 속성을 하고 각 행은 하나 개를 나타냅니다 데이터 세트를 . 질문 : 어떻게하는 어디에서 열을 제거 ALL 행 값이 NA는 ?
149 r  apply  dataframe 

7
행 이름을 첫 번째 열로 변환
다음과 같은 데이터 프레임이 있습니다. df VALUE ABS_CALL DETECTION P-VALUE 1007_s_at "957.729231881542" "P" "0.00486279317241156" 1053_at "320.632701283368" "P" "0.0313356324173416" 117_at "429.842323161046" "P" "0.0170004527476119" 121_at "2395.7364289242" "P" "0.0114473584876183" 1255_g_at "116.493632746934" "A" "0.39799368200131" 1294_at "739.927122116896" "A" "0.0668649772942343" 행 이름을 첫 번째 열로 변환하고 싶습니다. 현재 행 이름을 첫 번째 열로 만들기 위해 다음과 …
147 r  dataframe  col  rowname 

10
Pandas 열 내부의 사전 / 목록을 별도의 열로 분할
postgreSQL 데이터베이스에 저장된 데이터가 있습니다. Python2.7을 사용 하여이 데이터를 쿼리하고 Pandas DataFrame으로 변환합니다. 그러나이 데이터 프레임의 마지막 열에는 그 안에 값의 사전 (또는 목록?)이 있습니다. DataFrame은 다음과 같습니다. [1] df Station ID Pollutants 8809 {"a": "46", "b": "3", "c": "12"} 8810 {"a": "36", "b": "5", "c": "8"} 8811 {"b": "2", …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.