데이터 프레임에서 중복 열을 제거하는 가장 쉬운 방법은 무엇입니까?
다음을 통해 중복 열이있는 텍스트 파일을 읽고 있습니다.
import pandas as pd
df=pd.read_table(fname)
열 이름은 다음과 같습니다.
Time, Time Relative, N2, Time, Time Relative, H2, etc...
모든 시간 및 시간 관련 열에는 동일한 데이터가 포함됩니다. 내가 원하는:
Time, Time Relative, N2, H2
삭제, 삭제 등의 모든 시도 :
df=df.T.drop_duplicates().T
고유 값 인덱스 오류가 발생합니다.
Reindexing only valid with uniquely valued index objects
팬더 멍청이가되어서 미안 해요. 모든 제안을 주시면 감사하겠습니다.
추가 세부 사항
Pandas 버전 : 0.9.0
Python 버전 : 2.7.3
Windows 7
(Pythonxy 2.7.3.0을 통해 설치됨)
데이터 파일 (참고 : 실제 파일에서 열은 탭으로 구분되며 여기서는 4 개의 공백으로 구분됩니다) :
Time Time Relative [s] N2[%] Time Time Relative [s] H2[ppm]
2/12/2013 9:20:55 AM 6.177 9.99268e+001 2/12/2013 9:20:55 AM 6.177 3.216293e-005
2/12/2013 9:21:06 AM 17.689 9.99296e+001 2/12/2013 9:21:06 AM 17.689 3.841667e-005
2/12/2013 9:21:18 AM 29.186 9.992954e+001 2/12/2013 9:21:18 AM 29.186 3.880365e-005
... etc ...
2/12/2013 2:12:44 PM 17515.269 9.991756+001 2/12/2013 2:12:44 PM 17515.269 2.800279e-005
2/12/2013 2:12:55 PM 17526.769 9.991754e+001 2/12/2013 2:12:55 PM 17526.769 2.880386e-005
2/12/2013 2:13:07 PM 17538.273 9.991797e+001 2/12/2013 2:13:07 PM 17538.273 3.131447e-005
read_table내가 만든 예제 에서 열을 고유하게 만듭니다 .
import pandas as pd; pd.__version__)