주식 시장을 예측하기 위해 어떤 기계 학습 알고리즘을 사용할 수 있습니까?


15

또는 외환 시장을 예측합니다. 나는 이것이 꽤 복잡해질 수 있다는 것을 알고 있으므로 소개로서 정확성이있는 간단한 예측 알고리즘을 찾고 있습니다.

(4 개월간 지속되는 M.Sc. 대학교 프로젝트)

다층 신경망이 유용 할 수 있다는 것을 읽었습니다. 그것에 대한 생각? 또한 소셜 미디어의 의미 론적 분석은 주식 시장에 영향을 미치는 시장 행동에 대한 통찰력을 제공 할 수 있습니다. 그러나 시맨틱 분석은 현재 프로젝트의 범위를 약간 벗어났습니다.


15
내 것이지만, 분명한 이유로 나는 그것을 모두 나 자신에게 유지하고있다!
babelproofreader

7
효율적인 시장 가설을 믿는다면 현재의 요율 / 가격에 내장 된 평균 시장 수익률 (내부 지식없이)보다 높은 수익을 지속적으로 달성하는 것은 불가능합니다. 많은 사람들이 이것에 동의하지 않지만, 거의 모든 사람들이 일반 투자자에게는 이것이 사실이라는 데 동의합니다. 다시 말해서, rand ()를 기반으로 한 3 라인 모델은 아마도 일반적인 투자자만큼이나 좋습니다 : P
rm999

5
사람이있는 알고리즘을 공유하고자 할 것 같지는 않다 어떤 밖으로의 샘플 정확성을. 아마도 예외가 적고 거래 비용을 다루지 않는 출판 된 일부 학술 연구를 제외하고는.
NPE

2
학업의 경우 가격을 예측하는 것보다 모델을 모델링하는 것이 더 가치가있을 수 있습니다. 예측은 성공하지 못했을 것으로 보이지만 모델링은 최소한 실제 작동 방식에 대한 통찰력을 제공 할 수 있으며 이론적으로는 예측까지 확장 될 수 있습니다.
highBandWidth 2012 년

2
@wayne 나는 과적 합에 대해 생각하지 않습니다. 예측에 사용할 수없는 예측 변수, 예를 들어 주식 이동 중 / 후에 발생하는 변수를 허용하는 것에 관한 것입니다 .Apple과 Microsoft 주식이 상관 관계가있는 경우이 사실을 사용할 수 없습니다 msft 주식을 예측하지만 매우 유익 할 수 있습니다.
rm999

답변:


17

으로 babelproofreader 언급 , 성공적인 알고리즘을 가지고 그 사람들은 그것에 대해 매우 비밀 경향이있다. 따라서 영리한 작업을 수행하지 않는 한 광범위하게 사용 가능한 알고리즘이 즉시 유용하지는 않을 것입니다 (이 시점에서 알고리즘을 추가 한 이후 광범위하게 사용할 수 없게됩니다).

즉, 자동 회귀 정수 이동 평균 (ARIMA) 모델 에 대한 학습은 시계열 데이터 예측에 유용한 시작일 수 있습니다. 그러나 무작위 결과보다 더 나을 것으로 기대하지 마십시오.


5
+1 : 몇 번이나 읽거나 수업을 듣다가 복잡한 알고리즘을 가지고 있으면 주식 / 전기 / 상품 시장이 풍부 할 수 있다고 믿는 사람들의 이야기를 몇 번이나 들었습니다. 과적 합 등을 설명하려고하지만 아무 소용이 없습니다. 내가 아는 한, 내부자가 아닌 성공적인 주식 거래 소프트웨어는 거래 수수료, 차익 거래 및 고속에 의존하지 않았습니다. 최첨단은 자동화 된 거래 규칙에 허점을 사용하고 다른 자동화 된 트레이더를 빨판 펀치하기 위해 고속 제안 / 입찰 철회를 사용하는 것입니다.
Wayne

1
다른 문제는 여러 사람이 정확히 동일한 데이터에 대한 교육을 수행 한 다음 대량 판매 / 구매를 수행하기 때문에 동일한 알고리즘으로 끝나는 경우입니다. 어떤 알고리즘이 장기 정확도를 기대할 수 있습니까?
Michelle

@ 웨인 (Wayne)은 시계열 데이터를 구현하기는 어렵지만 과적 합을 줄이는 전략이 있습니다.
Zach

1
@ Zach : 예, 과잉 피팅을 처벌하는 방법이 있지만, 내가 반영하고있는 태도입니다 : Excel에서 기본 (아마도 잘못된) 곡선 피팅을하고 비밀 소스로 돈을 벌 수 있다고 생각하는 사람들 그러나 실제로 필요한 것은 교수가 수업과 공유하지 않는 최첨단의 정교한 알고리즘 중 하나입니다. 이 알고리즘은 글러브와 같은 데이터에 적합하며 Excel 스프레드 시트를 사용하는 다른 모든 투기자보다 훨씬 더 잘 예측할 수 있지만 교수는 과적 합과 데이터의 한계에 대해 계속 연구하고 있습니다. 한숨.
Wayne

12

나는 당신의 목적을 위해, 당신이 흥미 롭다고 생각하는 기계 학습 알고리즘 선택 하고 시도 해야한다고 생각 합니다.

효율적인 시장 이론과 관련하여 시장은 시간 규모에 비효율적입니다. 또한 일부 사람들 (학계와 실제 학살 모두)은 부자가되기보다는 지적 도전에 동기를 부여하며 흥미로운 결과를 게시합니다 (실패한 결과를 흥미로운 결과로 간주합니다). 그러나 당신이 읽은 모든 것을 소금 한 덩어리로 취급하십시오. 결과가 정말 좋으면 과학적인 방법이 아닐 수도 있습니다.

R을 사용한 데이터 마이닝 은 유용한 책입니다. 값이 비싸므로 대학 도서관에서 찾아보십시오. 2 장에서는 원하는 것을 다루고 신경망을 통해 최상의 결과를 얻습니다. 그러나 결과가 좋지 않고 많은 CPU 시간을 소비한다는 점에주의하십시오. 아마존의 리뷰에 따르면이 장에서는 금융 이라는 단어가 언급되어 있기 때문에이 책의 가격은 20 달러 더 비싸다 . 그것을 읽을 때 출판사가 그에게 글을 쓰라는 인상을 받았습니다. 그는 숙제를 마쳤고, 문서를 읽고, 올바른 메일 링리스트를 읽었지만 그의 마음은 그 안에 없었습니다. 나는 그것으로부터 유용한 R 지식을 얻었지만 그것으로 시장을 꺾지 않을 것입니다 :-)


@Darren-나는 당신의 스타일을 좋아합니다.
rolando2

1
R사용한 Data Mining 의 초안 (2003 년 5 월)은 여기 에서 찾을 수 있습니다 . (저는 책이 없어서 두 버전 사이의 차이가 무엇인지 말할 수 없습니다.)
chl

@chi 감사합니다! 나는 간략히 살펴 보았고, 4 개의 챕터 중 2 개만 있습니다. 그러나 더 큰 차이점은 주식 시장 수익률 예측 장이 매우 다르다는 것입니다. xts 또는 quantmod에 대한 언급이없고 대신 ts 패키지를 사용하고 acf 및 MARS 패키지를 사용하여 예측합니다. 보너스 장과 거의 비슷하며 제대로 읽을 시간을 내겠습니다. 그는 여전히 신경망을 사용하고 있지만 출판 된 책에서와 같이 SVM과 비교하지는 않습니다.
대런 쿡

10

제 생각에는 다음을 모두 수행 할 수있는 강력한 AI가 통계적으로 중요한 예측을 쉽게 만들어 낼 수 있습니다.

  • 소문 수집 및 이해

  • 모든 정부 지식에 접근하고 해석

  • 모든 관련 국가에서 그렇게

  • 다음에 대한 관련 예측을 작성하십시오.

    • 기상 조건

    • 테러 활동

    • 개인의 생각과 느낌

    • 무역에 영향을 미치는 다른 모든 것

통계 분석은 실제로 가장 걱정할 사항입니다.


4

R에서 auto.arimaets 함수를 사용해 볼 수 있습니다. rugarch 패키지 에서도 약간의 성공을 거두었 지만 자동화 된 매개 변수 선택을위한 기존 함수는 없습니다. 에서 평균 모델의 매개 변수를 얻은 auto.arima다음 전달하여 rugarch추가 할 수 garch(1,1)있습니까?

이 작업을 수행하는 데 성공했다고 주장하는 모든 종류의 블로그가 있습니다. 다음은 arima 모델 (및 나중에 garch 모델)을 사용하는 시스템과 SVM 모델을 사용하는 시스템 입니다. 특히 블로그 롤에서 블로그를 읽기 시작하면 FOSS 거래 에 대한 많은 좋은 정보를 찾을 수 있습니다.

어떤 모델을 사용하든 교차 검증하고 벤치마킹해야합니다! 순진한 모델 에서 벗어난 모델을 구성 할 수있는 arima, ets 또는 garch 모델을 발견하면 매우 놀랐습니다 . 시계열 교차 검증의 예는 여기여기 에서 찾을 수 있습니다 . 실제로 예측하려는 것은 가격이 아니라 수익입니다.


2

저는 적어도 하나의 헤지 펀드가 현재 사용하고있는 하나의 머신 러닝 접근법을 알고 있습니다. numer.ai는 펀드의 행동을 지시하기 위해 사용자 제공 머신 러닝 알고리즘의 앙상블을 사용하고 있습니다.

다시 말해, 헤지 펀드는 수백 개의 투자 수단 (대부분의 주식)에서 암호화 된 버전의 데이터에 대한 공개 액세스를 제공합니다. 수천 명의 데이터 과학자 등이 해당 데이터에 대해 모든 종류의 머신 러닝 알고리즘을 훈련시키고 결과를 스코어 보드에 업로드합니다. 최고 점수는 결과의 정확성과 온라인에서 얼마나 오랫동안 결과를 볼 수 있었는지에 따라 적은 금액의 돈을받습니다.

최선의 예측은 아마도 알고리즘의 앙상블에 의해 이루어진다.

그래서 당신은 훈련 된 추측을 제공하는 많은 과학자들을 보유하고 있으며, 그중 일부는 스스로 추측의 앙상블이며 헤지 펀드는 제공된 모든 추측의 앙상블을 사용하여 투자를 지시합니다.

이 흥미로운 헤지 펀드의 결과는 나에게 두 가지를 가르쳐주었습니다.

  1. 앙상블은 종종 주식 시장에서 예측을하는 좋은 방법으로 여겨집니다.
  2. 좋은 예측은 내가 기꺼이 만들려는 것보다 더 많은 앙상블을 요구합니다 ...

가보고 싶다면 https://numer.ai/를 방문하십시오. 아니, 나는 그들과 제휴하지 않았으며, 온라인으로 하루를 보내지 않을 것입니다. 나는 수천 명의 직원을 고용하는 헤지 펀드에 연결되어있었습니다. , 그러나 측정 가능한 결과를 제공하는 것만 지불하십시오 :)

numer.ai 커뮤니티에는 접근 방식을 논의하는 포럼이 있으므로 동일한 작업을 수행하려는 다른 사람들로부터 배울 수 있습니다.

개인적으로 저는 좋은 알고리즘을 가진 사람이라면 누구나 매우 비밀로 유지할 것이라고 생각합니다.


1

GMDH 유형 신경망을 시도해야합니다. 나는 주식 시장 예측을위한 성공적인 상업 패키지가 그것을 사용하고 있다는 것을 알고 있지만 문서의 깊이에서만 언급합니다. 간단히 말해서 그것은 다층 반복 신경망이므로 올바른 길을 가고 있습니다.


0

숨겨진 마르코프 모델은 주식 시장에서 인기가 있다고 생각합니다. 명심해야 할 가장 중요한 것은 데이터의 시간적 측면을 보존하는 알고리즘을 원한다는 것입니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.