나는 정찰이 다소 일반적이라는 다음과 같은 문제를 겪었습니다.
예를 들어 몇 백만 개의 큰 데이터가 있습니다. 몇 가지 하위 쿼리로 구성된 SQL 쿼리와 같은 사소한 분석을 실행합니다. 예를 들어 시간이 지남에 따라 속성 X가 증가하고 있다는 결과가 나옵니다.
이제 두 가지 가능한 결과가 있습니다.
- X는 시간이 지남에 따라 실제로 증가하고 있습니다
- 분석에 버그가 있습니다
두 번째가 아닌 첫 번째가 발생했는지 어떻게 테스트 할 수 있습니까? 중간 단계 결과가 여전히 수백만 줄로 구성 될 수 있기 때문에 단계적 디버거는 존재하더라도 도움이되지 않습니다.
내가 생각할 수있는 유일한 방법은 테스트하려는 속성을 사용하여 작고 합성 데이터 세트를 생성하고 분석을 단위 테스트로 실행하는 것이 었습니다. 이를위한 도구가 있습니까? 특히, SQL로 제한되지는 않습니다.