SQL을 사용하여 .xlsx 파일과 1,000,000 개 이상의 행을 병합 하시겠습니까?


0

데이터의 전단 크기에 의해 제한되는 것으로 판단되는 작업에 문제가 있습니다. 작업은 각각 1 백만 행이 넘는 두 개의 Excel 통합 문서를 병합하고 필터링하는 것입니다.

아마도 내가 여기서 받아 들여야 할 경로를 이해하는 데 도움이 될만한 숙달 된 사람이있을 것입니다. Microsoft Access에서 SQL을 사용하고 싶습니다.

두 통합 문서는 차량 데이터 및 사고 데이터입니다. 그들은 모두 영국의 교통 사고와 관련된 정보를 담고 있습니다. 차량 통합 문서는 각 차량과 관련된 정보 (사고 ID 번호, 차량 유형, 차량 속도 ...)를 제공합니다. 사고 통합 문서는 사고와 관련된 정보 (사고 ID 번호, 길, 위도, 사상자 ...)를 제공합니다.

기본 통합 문서로 차량 데이터를 사용하여 두 통합 문서를 하나의 통합 문서로 결합하고자합니다. 따라서 고유 한 사고 ID 번호를 사용하여 사고 통합 문서 행에서 차량 통합 문서 행에 정보를 추가하십시오. 참고 : 둘 다 고유 한 사고 ID 번호가 있지만 차량 통합 문서에는 종종 도로 사고에 여러 차량이 있기 때문에 고유 한 사고 ID 번호가 여러 번 표시됩니다 (28 개 차량이이 데이터 집합에 기록됩니다). 따라서, 열은 사고 통합 문서 정보를 한 번 이상 호출하고 나열해야합니다.

나는 SQL이 내 두 번째 작업을 동의어로 수행 할 수 있다고 믿기 때문에 약간의 SQL을 배우는 것이 가장 좋을 것이라고 생각한다.

작업 2. 데이터 세트가 병합 된 후 특정 차량을 데이터 세트에서 분리하고 싶습니다. 피봇 테이블을 만들고 QGIS에 연결하기 위해 한 줄에 모든 정보가 포함 된 자전거 데이터를 분리하고 싶습니다.

따라서 최종 제품은 두 개의 통합 문서에서 파생 된 각 사건에 대한 모든 데이터가있는 자전거 충돌 데이터의 단일 테이블이됩니다.

아무도 나를 시작할 수 있도록 도와 줄 수 있습니까?

내가 이해하는 것으로부터, 나는 두 가지를 연결된 서버로 결합해야하며, TSQL을 사용하여 필터링을 수행하십시오.


나는 네가 제대로 된 것 같아. 수퍼 유저는 정답이있는 "한입 크기"의 특정 문제에 중점을 둡니다. 주제에 대한 일반 학습은 범위를 벗어납니다. 귀하의 질문은 너무 광범위하게 닫히기 쉽지만, 사람들은 그러한 제안이 있기 전에 제안을 할 수 있습니다. 이 사이트는 문제를 파헤 치고 발생한 특정 문제에 대한 질문을 게시하는 경우에 도움이됩니다.
fixer1234

답변:


0

여러 파일 을 병합 하려면 Microsoft 추가 기능 전원 쿼리 를 사용할 수 있습니다 .

Power Query에는 몇 가지 제한 사항이 있습니다. 그러나 1mio만큼 병합 할 수 있어야합니다. 행은 시스템의 여유 메모리에 따라 다릅니다 (큰 데이터 세트의 경우 64 비트 버전을 사용해야합니다).
최종 데이터 세트는 1 Mio 미만이어야합니다. Excel 워크 시트에서 표를 내보내는 경우

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.