다음 pandas 데이터 프레임이 있습니다 Top15
.
1 인당 인용 가능한 문서 수를 추정하는 열을 만듭니다.
Top15['PopEst'] = Top15['Energy Supply'] / Top15['Energy Supply per Capita']
Top15['Citable docs per Capita'] = Top15['Citable documents'] / Top15['PopEst']
1 인당 인용 가능한 문서 수와 1 인당 에너지 공급 사이의 상관 관계를 알고 싶습니다. 그래서 나는 .corr()
방법을 사용합니다 (Pearson의 상관 관계) :
data = Top15[['Citable docs per Capita','Energy Supply per Capita']]
correlation = data.corr(method='pearson')
단일 숫자를 반환하고 싶지만 결과는 다음과 같습니다.
.corr
데이터 프레임에 직접 적용하면 모든 쌍별 상관 관계가 반환됩니다. 이것이 행렬의 대각선에서 1을 관찰하는 이유입니다 (각 열은 자체와 완벽하게 상관 됨). 아래 내 편집을 참조하십시오.