«dataframe» 태그된 질문

데이터 프레임은 테이블 형식 데이터 구조입니다. 일반적으로 행은 관측치이고 열은 다양한 유형의 변수 인 데이터를 포함합니다. "data frame"또는 "dataframe"은 여러 언어 (R, Apache Spark, deedle, Maple, Python의 팬더 라이브러리 및 Julia의 DataFrames 라이브러리)에서이 개념에 사용되는 용어이지만 "table"은 MATLAB과 SQL.


6
다중 인덱스 판다에서 선택
열 'A'와 'B'가있는 다중 인덱스 데이터 프레임이 있습니다. 인덱스를 단일 열 인덱스로 재설정하지 않고 다중 인덱스의 한 열을 필터링하여 행을 선택하는 방법이 있습니까? 예를 들어. # has multi-index (A,B) df #can I do this? I know this doesn't work because the index is multi-index so I need to specify a …

1
Pandas 'Freq'태그에 대한 문서는 어디에 있습니까? [닫은]
닫은. 이 질문은 Stack Overflow 지침을 충족하지 않습니다 . 현재 답변을 받고 있지 않습니다. 이 질문을 개선하고 싶으십니까? Stack Overflow의 주제에 맞게 질문을 업데이트하세요 . 휴일 2 년 전 . 이 질문 개선 나는 Pandas를 처음 사용하고 date_range. 나는 좋은 것들의 모든 종류에 걸쳐 온 freq것처럼, BME그리고 BMS내가 빨리 내가 …

3
python pandas 데이터 프레임 열은 dict 키와 값으로 변환됩니다.
여러 열이있는 pandas 데이터 프레임이 있는데 하나는 dict의 키로, 다른 하나는 dict의 값으로 두 개의 열에서 dict를 구성하고 싶습니다. 어떻게 할 수 있습니까? 데이터 프레임 : area count co tp DE Lake 10 7 Forest 20 5 FR Lake 30 2 Forest 40 3 영역을 키로 정의하고 dict의 값으로 계산해야합니다. …

5
Pandas 데이터 프레임의 열을 1 위로 이동 하시겠습니까?
팬더 데이터 프레임이 있습니다. 내 열 중 하나를 '지연'하고 싶습니다. 예를 들어 전체 열 'gdp'를 하나씩 위로 이동 한 다음 나머지 행의 맨 아래에있는 모든 초과 데이터를 제거하여 모든 열이 다시 같은 길이가되도록하는 것을 의미합니다. df = y gdp cap 0 1 2 5 1 2 3 9 2 8 …

3
Pandas 막대 그림의 값으로 막대에 주석 달기
내 DataFrame의 둥근 숫자 값으로 Pandas 막대 그림에서 막대에 주석을 달 수있는 방법을 찾고있었습니다. >>> df=pd.DataFrame({'A':np.random.rand(2),'B':np.random.rand(2)},index=['value1','value2'] ) >>> df A B value1 0.440922 0.911800 value2 0.588242 0.797366 다음과 같은 것을 얻고 싶습니다. 이 코드 샘플을 사용해 보았지만 주석은 모두 x 눈금 중심에 있습니다. >>> ax = df.plot(kind='bar') >>> for idx, …

13
두 개의 데이터 프레임을 비교하고 차이점 얻기
두 개의 데이터 프레임이 있습니다. 예 : df1: Date Fruit Num Color 2013-11-24 Banana 22.1 Yellow 2013-11-24 Orange 8.6 Orange 2013-11-24 Apple 7.6 Green 2013-11-24 Celery 10.2 Green df2: Date Fruit Num Color 2013-11-24 Banana 22.1 Yellow 2013-11-24 Orange 8.6 Orange 2013-11-24 Apple 7.6 Green 2013-11-24 Celery 10.2 Green 2013-11-25 …

5
중첩 된 사전의 항목에서 Pandas DataFrame 생성
구조가있는 중첩 사전 'user_dict'가 있다고 가정합니다. 수준 1 : UserId (긴 정수) 수준 2 : 범주 (문자열) 레벨 3 : 여러 속성 (floats, int 등) 예를 들어,이 사전의 항목은 다음과 같습니다. user_dict[12] = { "Category 1": {"att_1": 1, "att_2": "whatever"}, "Category 2": {"att_1": 23, "att_2": "another"}} 의 각 항목 user_dict은 …

5
데이터 프레임의 모든 특정 값 바꾸기
데이터 프레임이있는 경우 모든 행과 열을 따라 모든 특정 값을 대체하는 방법은 무엇입니까? 예를 들어 모든 빈 레코드를 NA's (위치를 입력하지 않고) 로 바꾸고 싶습니다 . df <- data.frame(list(A=c("", "xyz", "jkl"), B=c(12, "", 100))) A B 1 12 2 xyz 3 jkl 100 예상 결과: A B 1 NA 12 …
88 r  dataframe  replace 

5
Spark DataFrame groupBy 및 내림차순 정렬 (pyspark)
pyspark (Python 2.7.9 / Spark 1.3.1)를 사용하고 있으며 내림차순으로 필터링 및 정렬해야하는 데이터 프레임 GroupObject가 있습니다. 이 코드 조각을 통해 달성하려고합니다. group_by_dataframe.count().filter("`count` >= 10").sort('count', ascending=False) 그러나 다음과 같은 오류가 발생합니다. sort() got an unexpected keyword argument 'ascending'

5
Pandas 데이터 프레임에서 튜플 열을 분할하는 방법은 무엇입니까?
나는 판다 데이터 프레임을 가지고 있습니다 (이것은 단지 작은 조각입니다) >>> d1 y norm test y norm train len(y_train) len(y_test) \ 0 64.904368 116.151232 1645 549 1 70.852681 112.639876 1645 549 SVR RBF \ 0 (35.652207342877873, 22.95533537448393) 1 (39.563683797747622, 27.382483096332511) LCV \ 0 (19.365430594452338, 13.880062435173587) 1 (19.099614489458364, 14.018867136617146) RIDGE CV …


3
열의 공통 값을 기반으로 큰 데이터 프레임을 데이터 프레임 목록으로 분할
열 중 하나에 ID (고유하지 않은 사용자 식별) (10 열)가 포함 된 "사용자"의 작업을 수집하는 10 개의 열이있는 데이터 프레임이 있습니다. 데이터 프레임의 길이는 약 750000 행입니다. 단일 액터의 동작을 분리하기 위해 "사용자"식별자를 포함하는 열로 분할 된 개별 데이터 프레임 (데이터 프레임의 목록 또는 벡터 가져 오기)을 추출하려고합니다. ID | …

1
DataFrame의 각 셀에 기능 적용
다음과 같은 데이터 프레임이 있습니다. A B C foo bar foo bar bar foo foo bar 각 행의 모든 ​​요소 (또는 각 열의 모든 요소)를 살펴보고 다음 함수를 적용하여 후속 DF를 얻고 싶습니다. def foo_bar(x): return x.replace('foo', 'wow') A B C wow bar wow bar bar wow wow bar 각 …

17
data.frame의 두 열 사이에 열 추가 (삽입)
a, b 및 c 열이있는 데이터 프레임이 있습니다. b와 c 사이에 새 열 d를 추가하고 싶습니다. cbind 를 사용하여 끝에 d를 추가 할 수 있다는 것을 알고 있지만 두 열 사이에 어떻게 삽입 할 수 있습니까?
87 r  dataframe  insert 

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.