금융 서비스는 빅 데이터의 큰 사용자이며 혁신가이기도합니다. 한 예로 모기지 채권 거래가 있습니다. 그것에 대한 질문에 대답하려면 :
이 회사들은 어떤 종류의 데이터를 사용 했습니까? 데이터의 크기는 얼마입니까?
- 지난 몇 년 동안 발행 된 각 모기지의 오랜 역사와 그에 대한 월별 지불. (십억 행)
- 신용 기록의 긴 역사. (십억 행)
- 주택 가격 지수. (크지 않은)
데이터를 처리하는 데 어떤 종류의 도구 기술이 사용 되었습니까?
그건 다양하다. 일부는 Netezza 또는 Teradata와 같은 데이터베이스에 구축 된 사내 솔루션을 사용합니다. 다른 사람들은 데이터 공급자가 제공 한 시스템을 통해 데이터에 액세스합니다. (Corelogic, Experian 등) 일부 은행은 KDB 또는 1010data와 같은 열 데이터베이스 기술을 사용합니다.
그들이 직면 한 문제는 무엇이며 데이터를 얻는 통찰력으로 문제를 해결하는 데 도움이되었습니다.
주요 이슈는 모기지 채권 (모기지 담보 증권)이 선불 또는 채무 불이행시기를 결정하는 것입니다. 이것은 정부 보증이없는 채권에 특히 중요합니다. 지불 내역, 신용 파일을 파고 집의 현재 가치를 이해함으로써 채무 불이행 가능성을 예측할 수 있습니다. 이자율 모델 및 선불 모델을 추가하면 선불 가능성을 예측하는 데 도움이됩니다.
그들이 자신의 필요에 맞게 도구 / 기술을 선택한 방법.
프로젝트가 내부 IT에 의해 주도되는 경우 일반적으로 Oracle, Teradata 또는 Netezza와 같은 대규모 데이터베이스 공급 업체를 기반으로합니다. 퀀트에 의해 구동되는 경우 데이터 공급 업체 또는 타사 "All in"시스템으로 곧바로 갈 가능성이 높습니다.
데이터에서 어떤 종류의 패턴을 식별했으며 데이터에서 어떤 종류의 패턴을보고 있었습니까?
100 , 000 , 000 b e i n g승 o r t h t h a t a m o u n t , o r a s l i t t l e a s20,000,000.