또는 외환 시장을 예측합니다. 나는 이것이 꽤 복잡해질 수 있다는 것을 알고 있으므로 소개로서 정확성이있는 간단한 예측 알고리즘을 찾고 있습니다.
(4 개월간 지속되는 M.Sc. 대학교 프로젝트)
다층 신경망이 유용 할 수 있다는 것을 읽었습니다. 그것에 대한 생각? 또한 소셜 미디어의 의미 론적 분석은 주식 시장에 영향을 미치는 시장 행동에 대한 통찰력을 제공 할 수 있습니다. 그러나 시맨틱 분석은 현재 프로젝트의 범위를 약간 벗어났습니다.
또는 외환 시장을 예측합니다. 나는 이것이 꽤 복잡해질 수 있다는 것을 알고 있으므로 소개로서 정확성이있는 간단한 예측 알고리즘을 찾고 있습니다.
(4 개월간 지속되는 M.Sc. 대학교 프로젝트)
다층 신경망이 유용 할 수 있다는 것을 읽었습니다. 그것에 대한 생각? 또한 소셜 미디어의 의미 론적 분석은 주식 시장에 영향을 미치는 시장 행동에 대한 통찰력을 제공 할 수 있습니다. 그러나 시맨틱 분석은 현재 프로젝트의 범위를 약간 벗어났습니다.
답변:
으로 babelproofreader 언급 , 성공적인 알고리즘을 가지고 그 사람들은 그것에 대해 매우 비밀 경향이있다. 따라서 영리한 작업을 수행하지 않는 한 광범위하게 사용 가능한 알고리즘이 즉시 유용하지는 않을 것입니다 (이 시점에서 알고리즘을 추가 한 이후 광범위하게 사용할 수 없게됩니다).
즉, 자동 회귀 정수 이동 평균 (ARIMA) 모델 에 대한 학습은 시계열 데이터 예측에 유용한 시작일 수 있습니다. 그러나 무작위 결과보다 더 나을 것으로 기대하지 마십시오.
나는 당신의 목적을 위해, 당신이 흥미 롭다고 생각하는 기계 학습 알고리즘 을 선택 하고 시도 해야한다고 생각 합니다.
효율적인 시장 이론과 관련하여 시장은 시간 규모에 비효율적입니다. 또한 일부 사람들 (학계와 실제 학살 모두)은 부자가되기보다는 지적 도전에 동기를 부여하며 흥미로운 결과를 게시합니다 (실패한 결과를 흥미로운 결과로 간주합니다). 그러나 당신이 읽은 모든 것을 소금 한 덩어리로 취급하십시오. 결과가 정말 좋으면 과학적인 방법이 아닐 수도 있습니다.
R을 사용한 데이터 마이닝 은 유용한 책입니다. 값이 비싸므로 대학 도서관에서 찾아보십시오. 2 장에서는 원하는 것을 다루고 신경망을 통해 최상의 결과를 얻습니다. 그러나 결과가 좋지 않고 많은 CPU 시간을 소비한다는 점에주의하십시오. 아마존의 리뷰에 따르면이 장에서는 금융 이라는 단어가 언급되어 있기 때문에이 책의 가격은 20 달러 더 비싸다 . 그것을 읽을 때 출판사가 그에게 글을 쓰라는 인상을 받았습니다. 그는 숙제를 마쳤고, 문서를 읽고, 올바른 메일 링리스트를 읽었지만 그의 마음은 그 안에 없었습니다. 나는 그것으로부터 유용한 R 지식을 얻었지만 그것으로 시장을 꺾지 않을 것입니다 :-)
R에서 auto.arima 및 ets 함수를 사용해 볼 수 있습니다. rugarch 패키지 에서도 약간의 성공을 거두었 지만 자동화 된 매개 변수 선택을위한 기존 함수는 없습니다. 에서 평균 모델의 매개 변수를 얻은 auto.arima다음 전달하여 rugarch추가 할 수 garch(1,1)있습니까?
이 작업을 수행하는 데 성공했다고 주장하는 모든 종류의 블로그가 있습니다. 다음은 arima 모델 (및 나중에 garch 모델)을 사용하는 시스템과 SVM 모델을 사용하는 시스템 입니다. 특히 블로그 롤에서 블로그를 읽기 시작하면 FOSS 거래 에 대한 많은 좋은 정보를 찾을 수 있습니다.
어떤 모델을 사용하든 교차 검증하고 벤치마킹해야합니다! 순진한 모델 에서 벗어난 모델을 구성 할 수있는 arima, ets 또는 garch 모델을 발견하면 매우 놀랐습니다 . 시계열 교차 검증의 예는 여기 및 여기 에서 찾을 수 있습니다 . 실제로 예측하려는 것은 가격이 아니라 수익입니다.
저는 적어도 하나의 헤지 펀드가 현재 사용하고있는 하나의 머신 러닝 접근법을 알고 있습니다. numer.ai는 펀드의 행동을 지시하기 위해 사용자 제공 머신 러닝 알고리즘의 앙상블을 사용하고 있습니다.
다시 말해, 헤지 펀드는 수백 개의 투자 수단 (대부분의 주식)에서 암호화 된 버전의 데이터에 대한 공개 액세스를 제공합니다. 수천 명의 데이터 과학자 등이 해당 데이터에 대해 모든 종류의 머신 러닝 알고리즘을 훈련시키고 결과를 스코어 보드에 업로드합니다. 최고 점수는 결과의 정확성과 온라인에서 얼마나 오랫동안 결과를 볼 수 있었는지에 따라 적은 금액의 돈을받습니다.
최선의 예측은 아마도 알고리즘의 앙상블에 의해 이루어진다.
그래서 당신은 훈련 된 추측을 제공하는 많은 과학자들을 보유하고 있으며, 그중 일부는 스스로 추측의 앙상블이며 헤지 펀드는 제공된 모든 추측의 앙상블을 사용하여 투자를 지시합니다.
이 흥미로운 헤지 펀드의 결과는 나에게 두 가지를 가르쳐주었습니다.
가보고 싶다면 https://numer.ai/를 방문하십시오. 아니, 나는 그들과 제휴하지 않았으며, 온라인으로 하루를 보내지 않을 것입니다. 나는 수천 명의 직원을 고용하는 헤지 펀드에 연결되어있었습니다. , 그러나 측정 가능한 결과를 제공하는 것만 지불하십시오 :)
numer.ai 커뮤니티에는 접근 방식을 논의하는 포럼이 있으므로 동일한 작업을 수행하려는 다른 사람들로부터 배울 수 있습니다.
개인적으로 저는 좋은 알고리즘을 가진 사람이라면 누구나 매우 비밀로 유지할 것이라고 생각합니다.