다음과 같은 국가가있는 데이터 프레임이 있다고 가정합니다.
cc | temp
US | 37.0
CA | 12.0
US | 35.0
AU | 20.0
국가를 '원-핫 인코딩'으로 변환하는 pd.get_dummies 함수가 있다는 것을 알고 있습니다. 그러나 대신에 얻을 수 있도록 인덱스로 변환하고 싶습니다 cc_index = [1,2,1,3]
.
아래와 같이 numpy where 절과 함께 get_dummies를 사용하는 것보다 빠른 방법이 있다고 가정합니다.
[np.where(x) for x in df.cc.get_dummies().values]
이것은 'factors'를 사용하여 R에서 수행하기가 다소 쉽기 때문에 pandas가 비슷한 것을 갖기를 바랍니다.
cc_index = [0,1,0,2]
합니까?