sqlite 백엔드가있는 작은보고 도구를 개발하려고합니다. 이 도구를 "거래"원장으로 가장 잘 설명 할 수 있습니다. 내가하려는 것은 주간 데이터 추출에서 "트랜잭션"을 추적하는 것입니다.
- "신규"(또는 추가)-리소스가 추출을 통해 보이지 않았기 때문에 앱 에서이 리소스를 추적 하지 않았기 때문에 리소스가 내 앱에 새로 추가 되었습니다.
- "업데이트"(또는 적중)-해당 리소스가 최근에 사용되며 업데이트 보존 기간이 1 주일 더 있습니다.
- "삭제"(또는 삭제)-이 항목은 마지막 보고서 이후에 사용되지 않았습니다 (선택 사항이지만 자원에 대한 주별 변경 사항을 그래프로 표시하는 것이 좋습니다).
내가 가지고있는 것은 내가 통제 할 수없는 레거시 보관 / 기록 관리 시스템에서 나오는 매주 데이터 추출 (파이프 구분 플랫 파일)입니다.
각 라인은 기본적으로 다음과 같이 증류 될 수 있습니다.
resource_id | resource info | customer_id | customer_info
샘플 데이터 :
10| Title X | 1 | Bob
11| Another title | 1 | Bob
10| Title X | 2 | Alice
목표는 X 개월 동안 사용되지 않은 리소스 (마지막 적중을 기준으로)에 대해 쉽게보고 할 수 있도록하는 것입니다. 리소스가 인기있는 경우 쉽게 액세스 할 수 있도록 보존 기간이 유지됩니다. 18 개월 동안 사용되지 않은 리소스는 다른 곳에서 장기 보관이 가능합니다.
이것은 일반적인 문제 여야합니다. 데이터 세트간에 새로운 / 동일한 / 제거 된 것을 결정하는 범용 알고리즘이 있는지 궁금하십니까 (db와 최신 추출)?