«dataframe» 태그된 질문

데이터 프레임은 테이블 형식 데이터 구조입니다. 일반적으로 행은 관측치이고 열은 다양한 유형의 변수 인 데이터를 포함합니다. "data frame"또는 "dataframe"은 여러 언어 (R, Apache Spark, deedle, Maple, Python의 팬더 라이브러리 및 Julia의 DataFrames 라이브러리)에서이 개념에 사용되는 용어이지만 "table"은 MATLAB과 SQL.



7
팬더 DataFrame을 CSV 파일로 작성
팬더에 데이터 프레임이 있으며 CSV 파일에 쓰고 싶습니다. 나는 이것을 사용하여 이것을하고있다 : df.to_csv('out.csv') 그리고 오류가 발생합니다 : UnicodeEncodeError: 'ascii' codec can't encode character u'\u03b1' in position 20: ordinal not in range(128) 이 문제를 쉽게 해결할 수있는 방법이 있습니까 (예 : 데이터 프레임에 유니 코드 문자가 있음)? 그리고 'to-tab'방법을 사용하여 …
714 python  csv  pandas  dataframe 

8
사전 목록을 팬더 DataFrame으로 변환
다음과 같은 사전 목록이 있습니다. [{'points': 50, 'time': '5:00', 'year': 2010}, {'points': 25, 'time': '6:00', 'month': "february"}, {'points':90, 'time': '9:00', 'month': 'january'}, {'points_h1':20, 'month': 'june'}] 그리고 나는 이것을 이렇게 팬더로 바꾸고 DataFrame싶습니다. month points points_h1 time year 0 NaN 50 NaN 5:00 2010 1 february 25 NaN 6:00 NaN 2 …

10
전체 Pandas Series / DataFrame을 예쁘게 인쇄
터미널에서 Series 및 DataFrames를 많이 사용합니다. __repr__시리즈 의 기본값 은 일부 헤드 및 테일 값이 있지만 나머지는 누락 된 축소 샘플을 반환합니다. Series / DataFrame 전체를 예쁘게 인쇄 할 수있는 방법이 있습니까? 이상적으로는 적절한 정렬, 아마도 열 사이의 경계 및 다른 열의 색상 코딩을 지원할 것입니다.
650 python  pandas  dataframe 

3
iloc, ix 및 loc은 어떻게 다른가요?
누군가이 세 가지 슬라이스 방법이 어떻게 다른지 설명 할 수 있습니까? 나는 문서를 보았고 이러한 답변 을 보았지만 여전히 세 가지가 어떻게 다른지 설명 할 수 없다고 생각합니다. 나에게, 그들은 낮은 수준의 슬라이싱에 있기 때문에 대체로 상호 교환 가능한 것처럼 보입니다. 예를 들어의 첫 5 개 행을 가져오고 싶다고 가정 …

15
Pandas에서 SettingWithCopyWarning을 처리하는 방법은 무엇입니까?
배경 방금 팬더를 0.11에서 0.13.0rc1로 업그레이드했습니다. 이제 응용 프로그램이 많은 새로운 경고를 표시합니다. 그들 중 하나는 다음과 같습니다. E:\FinReporter\FM_EXT.py:449: SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame. Try using .loc[row_index,col_indexer] = value instead quote_df['TVol'] = quote_df['TVol']/TVOL_SCALE 정확히 무슨 뜻인지 알고 싶습니까? …

14
서브 세트 데이터 프레임의 드롭 팩터 레벨
을 포함하는 데이터 프레임이 있습니다 factor. subset또는 다른 인덱싱 기능을 사용하여이 데이터 프레임의 하위 집합을 만들면 새 데이터 프레임이 만들어집니다. 그러나 factor변수는 새 데이터 프레임에없는 경우에도 원래 수준을 모두 유지합니다. 패싯 플로팅을 수행하거나 요인 수준에 의존하는 함수를 사용할 때 문제가 발생합니다. 새 데이터 프레임에서 요인에서 수준을 제거하는 가장 간결한 방법은 …
543 r  dataframe  r-factor  r-faq 


20
목록을 데이터 프레임으로 변환
중첩 된 데이터 목록이 있습니다. 길이는 132이고 각 항목은 길이가 20 인 목록입니다. 이 구조를 132 행과 20 열의 데이터가있는 데이터 프레임으로 변환 하는 빠른 방법이 있습니까? 다음은 사용할 샘플 데이터입니다. l <- replicate( 132, list(sample(letters, 20)), simplify = FALSE )
513 r  list  dataframe 

11
매우 큰 테이블을 데이터 프레임으로 빠르게 읽기
R의 데이터 프레임으로로드 할 매우 큰 테이블 (3 천만 행)이 있습니다. read.table()편리한 기능이 많이 있지만 구현에 속도가 느려지는 논리가 많이있는 것 같습니다. 내 경우에는 미리 열 유형을 알고 있다고 가정하고 테이블에는 열 머리글이나 행 이름이 없으며 걱정해야 할 병리학 적 문자가 없습니다. 나는 테이블을 사용하여 목록으로 읽는 scan()것이 매우 빠를 …
503 r  import  dataframe  r-faq 




16
빈 데이터 프레임 만들기
행없이 data.frame을 초기화하려고합니다. 기본적으로 각 열의 데이터 형식을 지정하고 이름을 지정하지만 결과적으로 행이 생성되지 않습니다. 내가 지금까지 할 수 있었던 최선은 다음과 같습니다. df <- data.frame(Date=as.Date("01/01/2000", format="%m/%d/%Y"), File="", User="", stringsAsFactors=FALSE) df <- df[-1,] 원하는 모든 데이터 유형과 열 이름을 포함하는 단일 행으로 data.frame을 생성하지만 쓸모없는 행을 생성하여 제거해야합니다. 더 좋은 …
480 r  dataframe  r-faq 

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.