프로그램 작성 dataframe

4

포인트를 사용하여 팬더 데이터 프레임의 두 열을 그리는 방법은 무엇입니까?

팬더 데이터 프레임이 있고 한 열의 값과 다른 열의 값을 플로팅하고 싶습니다. 다행히도 plot필요한 작업을 수행하는 것처럼 보이는 데이터 프레임과 관련된 방법이 있습니다. df.plot(x='col_name_1', y='col_name_2') 불행히도, (열거 된 플롯 스타일 중에서처럼 보이는 여기에 애프터 kind지점이없는 매개 변수). 선이나 막대 또는 밀도를 사용할 수 있지만 점은 사용할 수 없습니다. 이 문제를 …

97 python matplotlib plot pandas dataframe

7

라벨로 선택하는 Pandas는 때때로 Series를 반환하고 때로는 DataFrame을 반환합니다.

Pandas에서 인덱스에 항목이 하나만있는 레이블을 선택하면 Series가 반환되지만 항목이 하나 이상있는 항목을 선택하면 데이터 프레임이 반환됩니다. 왜 그런 겁니까? 항상 데이터 프레임을 되 찾을 수있는 방법이 있습니까? In [1]: import pandas as pd In [2]: df = pd.DataFrame(data=range(5), index=[1, 2, 3, 3, 3]) In [3]: type(df.loc[3]) Out[3]: pandas.core.frame.DataFrame In [4]: …

97 python pandas dataframe slice series

5

Pandas 데이터 프레임 열 헤더를 모두 소문자로 만들려면 어떻게해야합니까?

팬더 데이터 프레임의 모든 열 머리글을 소문자로 만들고 싶습니다. 예 만약 내가 가지고 있다면: data = country country isocode year XRAT tcgdp 0 Canada CAN 2001 1.54876 924909.44207 1 Canada CAN 2002 1.56932 957299.91586 2 Canada CAN 2003 1.40105 1016902.00180 .... 다음과 같은 작업을 수행하여 XRAT를 xrat로 변경하고 싶습니다. data.headers.lowercase() …

96 python pandas dataframe

6

데이터 프레임의 선택한 열에서 NA (결측) 값을 포함하는 행의 하위 집합

CSV 파일의 데이터 프레임이 있습니다. 데이터 프레임 DF에는 관찰 된 값이 포함 된 열과 VaR2측정이 수행 된 날짜가 포함 된 열 ( )이 있습니다. 날짜가 기록되지 않은 경우 CSV 파일에는 NA누락 된 데이터에 대한 값이 포함 됩니다. Var1 Var2 10 2010/01/01 20 NA 30 2010/03/01 하위 집합 명령을 사용 하여 …

96 r csv dataframe subset na

6

Pandas Dataframe / Numpy Array "축"정의의 모호성

파이썬 축이 어떻게 정의되는지, 그리고 이들이 DataFrame의 행이나 열을 참조하는지에 대해 매우 혼란 스러웠습니다. 아래 코드를 고려하십시오. >>> df = pd.DataFrame([[1, 1, 1, 1], [2, 2, 2, 2], [3, 3, 3, 3]], columns=["col1", "col2", "col3", "col4"]) >>> df col1 col2 col3 col4 0 1 1 1 1 1 2 2 …

95 python arrays pandas numpy dataframe

9

CSV 파일을 Pandas DataFrame으로 가져 오기

CSV 파일에서 pandas DataFrame 으로 읽는 Python 방법은 무엇입니까 (그런 다음 통계 작업에 사용할 수 있고 다른 유형의 열 등을 가질 수 있음)? 내 CSV 파일 "value.txt"에는 다음 내용이 있습니다. Date,"price","factor_1","factor_2" 2012-06-11,1600.20,1.255,1.548 2012-06-12,1610.02,1.258,1.554 2012-06-13,1618.07,1.249,1.552 2012-06-14,1624.40,1.253,1.556 2012-06-15,1626.15,1.258,1.552 2012-06-16,1626.15,1.263,1.558 2012-06-17,1626.15,1.264,1.572 R에서는 다음을 사용하여이 파일을 읽습니다. price <- read.csv("value.txt") 그러면 R data.frame이 반환됩니다. …

95 python pandas csv dataframe

8

지정된 스키마로 빈 DataFrame을 만드는 방법은 무엇입니까?

DataFrameScala에서 지정된 스키마 로 만들고 싶습니다 . JSON 읽기 (빈 파일 읽기를 의미 함)를 사용하려고 시도했지만 이것이 최선의 방법이라고 생각하지 않습니다.

94 scala apache-spark dataframe apache-spark-sql

5

목록에서 데이터 프레임에 열 추가

다음과 같은 일부 열이있는 데이터 프레임이 있습니다. A B C 0 4 5 6 7 7 6 5 A의 값의 가능한 범위가 0 내지 7 만한다 . 또한 다음과 같은 8 개의 요소 목록이 있습니다. List=[2,5,6,8,12,16,26,32] //There are only 8 elements in this list A 열의 요소가 n 이면 List …

94 python pandas dataframe

16

각 그룹에서 최대 값이있는 행을 선택하는 방법

각 주제에 대한 여러 관측치가있는 데이터 세트에서 각 레코드에 대한 최대 데이터 값만있는 하위 집합을 취하려고합니다. 예를 들어 다음 데이터 세트를 사용합니다. ID <- c(1,1,1,2,2,2,2,3,3) Value <- c(2,3,5,2,5,8,17,3,5) Event <- c(1,1,2,1,2,1,2,2,2) group <- data.frame(Subject=ID, pt=Value, Event=Event) 주제 1, 2 및 3은 각각 5, 17 및 5의 가장 큰 pt 값을 …

94 r dataframe r-faq

6

적용에서 이전 값이 계산 될 때 Pandas에서 dataframe.apply의 이전 행 값을 사용하는 방법이 있습니까?

다음 데이터 프레임이 있습니다. Index_Date A B C D =============================== 2015-01-31 10 10 Nan 10 2015-02-01 2 3 Nan 22 2015-02-02 10 60 Nan 280 2015-02-03 10 100 Nan 250 요구 사항 : Index_Date A B C D =============================== 2015-01-31 10 10 10 10 2015-02-01 2 3 23 22 2015-02-02 …

94 python pandas dataframe for-loop iteration

11

Dataframe 셀 내부의 목록을 별도의 행으로 분해하는 방법

목록이 포함 된 팬더 셀을 각 값에 대한 행으로 바꾸려고합니다. 그래서 이것을 가져 가십시오. nearest_neighbors각 값이 각 opponent인덱스 내의 행이되도록 열의 값을 압축 해제하고 스택하려면 어떻게하면 좋을까요? 이와 같은 작업을위한 pandas 메서드가 있습니까?

93 python pandas dataframe

6

Spark Scala에서 DataFrame의 열 이름 이름 바꾸기

DataFrameSpark-Scala에서 모든 헤더 / 열 이름을 변환하려고합니다 . 지금은 단일 열 이름 만 대체하는 다음 코드가 나옵니다. for( i <- 0 to origCols.length - 1) { df.withColumnRenamed( df.columns(i), df.columns(i).toLowerCase ); }

93 scala apache-spark dataframe apache-spark-sql

6

Pandas 시리즈를 DataFrame으로 변환

팬더 시리즈 SF가 있습니다. email email1@email.com [1.0, 0.0, 0.0] email2@email.com [2.0, 0.0, 0.0] email3@email.com [1.0, 0.0, 0.0] email4@email.com [4.0, 0.0, 0.0] email5@email.com [1.0, 0.0, 3.0] email6@email.com [1.0, 5.0, 0.0] 그리고 그것을 다음 DataFrame으로 변환하고 싶습니다. index | email | list _____________________________________________ 0 | email1@email.com | [1.0, 0.0, 0.0] 1 | …

93 python pandas dataframe series

3

Python : Pandas 데이터 프레임의 두 열 (변수)을 기반으로 빈도 수를 가져옵니다.

안녕하세요, 다음 데이터 프레임이 있습니다. Group Size Short Small Short Small Moderate Medium Moderate Small Tall Large 동일한 행이 데이터 프레임에 나타나는 빈도를 계산하고 싶습니다. Group Size Time Short Small 2 Moderate Medium 1 Moderate Small 1 Tall Large 1

93 python pandas group-by dataframe

11

데이터 프레임을 여러 데이터 프레임으로 분할

실험 데이터 (응답자 60 명)가 포함 된 매우 큰 데이터 프레임 (약 1 백만 행)이 있습니다. 데이터 프레임을 60 개의 데이터 프레임 (각 참가자에 대한 데이터 프레임)으로 나누고 싶습니다. 데이터 프레임 data에는 'name'각 참가자의 고유 코드 인 라는 변수 가 있습니다. 다음을 시도했지만 아무 일도 일어나지 않습니다 (또는 실행이 한 …

92 python split pandas dataframe

«dataframe» 태그된 질문