2 ¢를 추가하겠습니다. 헤지 펀드를 위해 좋고 깨끗한 데이터를 얻는 것이 저의 임무입니다. 나는 많은 데이터 피드와 기록 데이터 공급자를 보았습니다. 이것은 주로 미국 주식 데이터에 관한 것입니다.
우선, Yahoo에서 데이터를 다운로드하는 데 돈이 들지 않는다면 CSI data 에서 하루 종일 데이터를 바로 얻으십시오 . Yahoo는 EOD 데이터와 AFAIK를 가져옵니다. 여기에는 원하는 형식으로 데이터를 추출 할 수있는 API가 있습니다. 매년 데이터 구독료는 100 달러입니다.
무료 서비스에서 데이터를 다운로드 할 때의 주요 문제는 여전히 존재하는 주식 만 얻는다는 것인데 , 이를 생존 바이어스 라고하며, 많은 주식을 보면 잘못된 결과를 줄 수 있습니다. 목록에없는 것은 아닙니다.
IQFeed 에서 살펴볼 일부 일상적인 데이터를 가지고 놀기 위해, 그들은 주로 실시간 피드에 적합하지만 역사적 데이터를 추출하는 여러 API를 제공합니다. 그러나 여기에는 몇 가지 옵션이 있으며 일부 브로커는 API를 통해 기록 데이터 다운로드를 제공하기 때문에 독을 선택하십시오.
그러나 일반적으로이 모든 데이터는 매우 깨끗하지 않습니다. 실제로 테스트를 다시 시작하면 특정 주식이 누락되었거나 두 개의 다른 기호로 표시되거나 주식 분할이 제대로 설명되지 않는 등을 볼 수 있습니다. 배당 데이터도 필요하므로 100 개의 서로 다른 데이터 소스에서 데이터를 패치하는 등 원에서 실행하기 시작합니다. 따라서 "할인"데이터 피드로 시작하려면보다 포괄적 인 백 테스트를 실행하자마자 수행 한 작업에 따라 문제가 발생할 수 있습니다. S & P 500 종목을 살펴보면 별 문제가되지 않을 것이고 "저렴한"일일 피드가 가능할 것입니다.
당신이 찾을 수없는 것은 무료 일중 데이터입니다. 몇 가지 예를 찾을 수 있습니다 .5 년 동안 MSFT 틱 데이터가 어딘가에 떠있을 것이라고 확신하지만 그다지 멀지 않습니다.
그런 다음 실제 물건 (레벨 II 주문서, 모든 거래소에서 발생한 모든 진드기)이 필요하다면 하나의 "적합한"이지만 탁월한 옵션은 Nanex 입니다. 실제로 테라 바이트 단위의 데이터가있는 드라이브를 제공합니다. 내가 매년 약 3k-4K의 데이터를 기억한다면. 그러나 좋은 하루 동안의 데이터를 얻는 것이 얼마나 어려운지 이해하면, 이것이 전혀 돈이 아니라고 생각할 것입니다.
당신을 실망시키지 말고 좋은 데이터를 얻는 것은 어렵습니다. 사실 많은 헤지 펀드와 은행들이 신뢰할 수있는 데이터를 얻기 위해 한 달 에 수십만 달러를 소비하기가 어렵습니다 . 다시, 당신은 어딘가에서 시작한 다음 거기에서 갈 수 있지만 상황에 따라 조금 보는 것이 좋습니다.
편집 : 위의 대답은 내 자신의 경험에서 온 것입니다. 사용 가능한 데이터 피드에 대한 Caltech의이 글 은 더 많은 통찰력을 제공하며 특히 QuantQuote를 권장 합니다 .