«dataframe» 태그된 질문

데이터 프레임은 테이블 형식 데이터 구조입니다. 일반적으로 행은 관측치이고 열은 다양한 유형의 변수 인 데이터를 포함합니다. "data frame"또는 "dataframe"은 여러 언어 (R, Apache Spark, deedle, Maple, Python의 팬더 라이브러리 및 Julia의 DataFrames 라이브러리)에서이 개념에 사용되는 용어이지만 "table"은 MATLAB과 SQL.

4
포인트를 사용하여 팬더 데이터 프레임의 두 열을 그리는 방법은 무엇입니까?
팬더 데이터 프레임이 있고 한 열의 값과 다른 열의 값을 플로팅하고 싶습니다. 다행히도 plot필요한 작업을 수행하는 것처럼 보이는 데이터 프레임과 관련된 방법이 있습니다. df.plot(x='col_name_1', y='col_name_2') 불행히도, (열거 된 플롯 스타일 중에서처럼 보이는 여기에 애프터 kind지점이없는 매개 변수). 선이나 막대 또는 밀도를 사용할 수 있지만 점은 사용할 수 없습니다. 이 문제를 …

7
라벨로 선택하는 Pandas는 때때로 Series를 반환하고 때로는 DataFrame을 반환합니다.
Pandas에서 인덱스에 항목이 하나만있는 레이블을 선택하면 Series가 반환되지만 항목이 하나 이상있는 항목을 선택하면 데이터 프레임이 반환됩니다. 왜 그런 겁니까? 항상 데이터 프레임을 되 찾을 수있는 방법이 있습니까? In [1]: import pandas as pd In [2]: df = pd.DataFrame(data=range(5), index=[1, 2, 3, 3, 3]) In [3]: type(df.loc[3]) Out[3]: pandas.core.frame.DataFrame In [4]: …

5
Pandas 데이터 프레임 열 헤더를 모두 소문자로 만들려면 어떻게해야합니까?
팬더 데이터 프레임의 모든 열 머리글을 소문자로 만들고 싶습니다. 예 만약 내가 가지고 있다면: data = country country isocode year XRAT tcgdp 0 Canada CAN 2001 1.54876 924909.44207 1 Canada CAN 2002 1.56932 957299.91586 2 Canada CAN 2003 1.40105 1016902.00180 .... 다음과 같은 작업을 수행하여 XRAT를 xrat로 변경하고 싶습니다. data.headers.lowercase() …

6
데이터 프레임의 선택한 열에서 NA (결측) 값을 포함하는 행의 하위 집합
CSV 파일의 데이터 프레임이 있습니다. 데이터 프레임 DF에는 관찰 된 값이 포함 된 열과 VaR2측정이 수행 된 날짜가 포함 된 열 ( )이 있습니다. 날짜가 기록되지 않은 경우 CSV 파일에는 NA누락 된 데이터에 대한 값이 포함 됩니다. Var1 Var2 10 2010/01/01 20 NA 30 2010/03/01 하위 집합 명령을 사용 하여 …
96 r  csv  dataframe  subset  na 

6
Pandas Dataframe / Numpy Array "축"정의의 모호성
파이썬 축이 어떻게 정의되는지, 그리고 이들이 DataFrame의 행이나 열을 참조하는지에 대해 매우 혼란 스러웠습니다. 아래 코드를 고려하십시오. >>> df = pd.DataFrame([[1, 1, 1, 1], [2, 2, 2, 2], [3, 3, 3, 3]], columns=["col1", "col2", "col3", "col4"]) >>> df col1 col2 col3 col4 0 1 1 1 1 1 2 2 …

9
CSV 파일을 Pandas DataFrame으로 가져 오기
CSV 파일에서 pandas DataFrame 으로 읽는 Python 방법은 무엇입니까 (그런 다음 통계 작업에 사용할 수 있고 다른 유형의 열 등을 가질 수 있음)? 내 CSV 파일 "value.txt"에는 다음 내용이 있습니다. Date,"price","factor_1","factor_2" 2012-06-11,1600.20,1.255,1.548 2012-06-12,1610.02,1.258,1.554 2012-06-13,1618.07,1.249,1.552 2012-06-14,1624.40,1.253,1.556 2012-06-15,1626.15,1.258,1.552 2012-06-16,1626.15,1.263,1.558 2012-06-17,1626.15,1.264,1.572 R에서는 다음을 사용하여이 파일을 읽습니다. price <- read.csv("value.txt") 그러면 R data.frame이 반환됩니다. …
95 python  pandas  csv  dataframe 


5
목록에서 데이터 프레임에 열 추가
다음과 같은 일부 열이있는 데이터 프레임이 있습니다. A B C 0 4 5 6 7 7 6 5 A의 값의 가능한 범위가 0 내지 7 만한다 . 또한 다음과 같은 8 개의 요소 목록이 있습니다. List=[2,5,6,8,12,16,26,32] //There are only 8 elements in this list A 열의 요소가 n 이면 List …

16
각 그룹에서 최대 값이있는 행을 선택하는 방법
각 주제에 대한 여러 관측치가있는 데이터 세트에서 각 레코드에 대한 최대 데이터 값만있는 하위 집합을 취하려고합니다. 예를 들어 다음 데이터 세트를 사용합니다. ID <- c(1,1,1,2,2,2,2,3,3) Value <- c(2,3,5,2,5,8,17,3,5) Event <- c(1,1,2,1,2,1,2,2,2) group <- data.frame(Subject=ID, pt=Value, Event=Event) 주제 1, 2 및 3은 각각 5, 17 및 5의 가장 큰 pt 값을 …
94 r  dataframe  r-faq 

6
적용에서 이전 값이 계산 될 때 Pandas에서 dataframe.apply의 이전 행 값을 사용하는 방법이 있습니까?
다음 데이터 프레임이 있습니다. Index_Date A B C D =============================== 2015-01-31 10 10 Nan 10 2015-02-01 2 3 Nan 22 2015-02-02 10 60 Nan 280 2015-02-03 10 100 Nan 250 요구 사항 : Index_Date A B C D =============================== 2015-01-31 10 10 10 10 2015-02-01 2 3 23 22 2015-02-02 …



6
Pandas 시리즈를 DataFrame으로 변환
팬더 시리즈 SF가 있습니다. email email1@email.com [1.0, 0.0, 0.0] email2@email.com [2.0, 0.0, 0.0] email3@email.com [1.0, 0.0, 0.0] email4@email.com [4.0, 0.0, 0.0] email5@email.com [1.0, 0.0, 3.0] email6@email.com [1.0, 5.0, 0.0] 그리고 그것을 다음 DataFrame으로 변환하고 싶습니다. index | email | list _____________________________________________ 0 | email1@email.com | [1.0, 0.0, 0.0] 1 | …


11
데이터 프레임을 여러 데이터 프레임으로 분할
실험 데이터 (응답자 60 명)가 포함 된 매우 큰 데이터 프레임 (약 1 백만 행)이 있습니다. 데이터 프레임을 60 개의 데이터 프레임 (각 참가자에 대한 데이터 프레임)으로 나누고 싶습니다. 데이터 프레임 data에는 'name'각 참가자의 고유 코드 인 라는 변수 가 있습니다. 다음을 시도했지만 아무 일도 일어나지 않습니다 (또는 실행이 한 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.