Python에서 Pandas와 NumPy + SciPy의 차이점은 무엇입니까? [닫은]


195

둘 다 매우 유사 해 보이며 어떤 패키지가 재무 데이터 분석에 더 도움이 될지 궁금합니다.

답변:


314

팬더는 NumPy 위에 구축 된 고급 데이터 조작 도구를 제공합니다. NumPy 자체는 MATLAB과 비슷한 상당히 낮은 수준의 도구입니다. 반면 팬더는 풍부한 시계열 기능, 데이터 정렬, NA 친화적 인 통계, 그룹 별, 병합 및 조인 방법 및 기타 여러 편의를 제공합니다. 최근 몇 년 동안 금융 응용 프로그램에서 매우 인기가있었습니다. 다가오는 책에 팬더를 사용하여 재무 데이터 분석 전용 장을 만들 것입니다.


217
당신은 당신이 팬더의 주요 저자라고 언급해야합니다. :) 문제의 책 : shop.oreilly.com/product/0636920023784.do
Yktula

3
numpy가 주로 효율적인 배열을 제공하는 반면 팬더는 효율적인 사전을 제공한다고 말할 수 있습니까? (두 경우 모두 자유 형식이 아닌 일관된 데이터 형식으로 제한됩니다.) 저에게 (지금 막 살펴보기 시작했습니다), 이는 레이블로 묶인 데이터 처리 (1d aka dicts and 2D 일명 테이블). 이로 인해 데이터 정렬, 조인 등이 모두 가능해 지지만 그 근본적인 차이를 모르는 사람들에게는 그 의미가 무엇인지 명확하지 않습니다 (예 : 두 개의 numpy 배열의 "데이터 정렬"은 무엇입니까?).
Brandyn

6
구피 질문 일 수 있지만 NA-friendly statistics귀하의 답변에 언급 된의 의미는 무엇입니까 ?
Adil Abbasi

6
필자는 결측 데이터 (NA, "사용할 수 없음")를 고려한 통계를 말합니다.
user1319128

4
콜드 스레드이지만 성능 차이는 어떻습니까? 예를 들어, numpy에서는 복잡한 작업이지만 팬더에서는 구문 적으로 단순화됩니까? 높은 수준의 쉬운 구문 경로를 수행하는 데 성능 비용이 있습니까?
3pitt

59

Numpy는 팬더 (그리고 거의 모든 Python의 숫자 도구)에 필요합니다. Scipy는 팬더에게는 엄격하게 요구되지는 않지만 "선택적 종속성"으로 표시됩니다. 나는 팬더가 Numpy 및 / 또는 Scipy의 대안이라고 말하지 않을 것입니다. 오히려 파이썬에서 숫자 및 테이블 형식의 데이터로 작업하는보다 효율적인 방법을 제공하는 추가 도구입니다. 팬더 데이터 구조를 사용할 수 있지만 Numpy 및 Scipy 함수를 자유롭게 사용하여 조작 할 수 있습니다.


당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.