用深度强化学习(DRL)研究外汇交易(1)--引言

从开通博客到现在已经7个多月了,岁月蹉跎,还一篇博文都没写,想起开通博客的初衷,深感汗颜。

1. 为什么要写这个博文系列

我是一名程序员,并具有近十年的外汇交易经验,也写过一些跑在MT4上的EA,但效果都不理想。不过多年的交易经验给我一种直觉:

  • 抛开基本面,只从技术面而言,短线交易是有规律可循的,是明显地存在大概率盈利的行情的。
  • 既然人可以识别出这种盈利的行情,就没有理由否认机器也能做到。
  • 人类不适合交易的缺点是贪婪和恐惧,而这正是机器的优点,机器没有这样的缺点。
  • 由于外汇是24小时交易的,人的精力有限,很难全天候来抓取这个短线盈利行情的出现时机。根据我的经验,大多数的盈利交易都是在这种行情一出现时就介入的交易,中途的介入往往由于心理上抵抗不了正常的震荡而变为亏损的交易。而机器则可以不眠不休地24小时盯盘。
  • 因此,直觉告诉我:机器是可以做到自动交易及盈利的。
  • 从数学的角度看,理想的交易实际就是一个将非线性函数(行情)转化为线性函数 f(x) = kx + b(其中,k为资金曲线的斜率,b为初始资金)的过程。这个过程显然是非线性的。
  • 由于通常在MT4里写的EA都是低维的,线性的,因此注定不可能有理想的效果。
  • 随着近年深度学习的兴起,特别是深度强化学习(Deep Reinforcement Learning)的模型与交易极为吻合,直觉告诉我:最适合研究自动交易的工具应该是深度强化学习。

有了上述直觉或者说是信念,为了防止自己偷懒,也信奉好记性不如烂笔头的原则,所以决定将学习及研究的经过记录下来。如果有志同道合的网友,欢迎交流探讨。如果您不认同本博客的内容,也请不要吐槽,所谓道不同不相为谋,您不看就行了。

另外也行有人会说:交易是非完全信息的系统,即使用深度学习也不可能成功。我不是学者,不是做学问的;我只是程序员和交易员,只是想寻找自动交易工具。

记得以前国际象棋的计算机程序战胜了人类时,便有人说:围棋的复杂度远远超过象棋,计算机围棋程序战胜不了人类;当AlphaGo和AlphaZero横空出世时,又有人说:围棋是完全信息的系统,交易与围棋不同,是非完全信息的,程序交易不可能成功。我想,如果有一天程序交易成功了,一定还会有人说:什么什么是什么什么,程序绝不可能成功的。

所以我的信念是:Don't talk, just do it。因为我是交易员,不是评论员。

2. 本博文系列的结构

因为是研究,还不知道能得出什么结果,所以目前大致考虑的是按这样的顺序来写:

  • 深度强化学习环境的搭建
  • 经典深度强化学习例子的复现
  • EURUSD货币对的深度强化学习交易模型的初步研究
  • 根据研究结果再考虑下一步的行动方案

下一篇文章将记录深度强化学习环境的搭建过程。

本文章为作者原创,享有版权所有权,未经许可,严禁转载或修改。

阅读更多

更多精彩内容