超长干货预警!专业第一的学霸学习量化投资的课程记录!





2019QTC-深圳

量化投资实战营


欢迎收看

QTC轻行迹之学霸笔记!

有请我们的今日分享嘉宾



沈 吉 梅


沈吉梅,东北大学工商管理学院互联网+金融专业2016级学生。她在主修金融学与辅修软件工程相关专业中均排名第一;连续两年获得国家奖学金、校优秀学生标兵、校一等奖学金;曾参加剑桥学术发展项目,交流学习人工智能与大数据;曾于伦敦证券交易所等企业实训;获国际级、国家级、省市校级奖项共计十八项;参加国家级大学生创新项目,协助项目组发明专利一项;现任东北大学机器学习社长,曾协助创新工场组织并主持AI技术分享会。



寒假的量化投资实战

我们在深圳相遇

见证了大神carry全场的学习精神

一起来看看她的学霸体验吧




量化投资实战营:从0到1的飞跃


很高兴在最好的时光在量化投资实战营遇到你们,恰好,我们都风华正茂,意气风发。在短暂而不凡的五天里,我们一同为自己人生的画卷中添上了浓墨重彩的一笔。





Day 1

>
2019.01.21 背景与基础知识


这个项目最吸引我的地方之一就是豪华的师资团队,在第一天上午就有幸见到了我非常崇拜的林健武教授本人。林教授与我们分享了量化投资前沿和量化投资与基本面投资。



林建武

国金基金管理有限公司研究总监

清华大学深圳研究生院金融学客座教授


首先,林教授从世界对冲基金的发展开始,介绍了从美国时代、到欧洲时代,最后进入亚洲时代的重要时间节点与重要事件。从1949年美国AW Jones用100k美金建立首个对冲基金、1966年Fortunate Magazine报导、1967-69年Soros Quantum和Steinhardt基金成立、1980年Tiger Management成立、到美国、欧洲与亚洲对冲基金产业先后到达20bn美元,最后到2008年世界金融危机对冲基金收到猛烈冲击。


接着,林教授讲到了对冲基金的风险收益,对冲基金与单一产品而言长期内具有更好的夏普比率和更低的回撤,单一资产品种的高波动率,高风险回撤必然对投资组合的主动管理和配置择时能力提出更高的挑战。


进一步地,林老师从对冲基金及FOF母基金规模变化情况引入,提出亚洲是全球量化投资的净土,列举了中国量化投资从1991年深圳有色金属期货交易所开始到2018年12股指期货的继续开放的十三个重要里程碑,指出中国量化投资发展中逐步完善的数学公式(加减法、乘除法、高阶和积分)和参数(基本面与行情、利率与信用、波动性、汇率等),并用数据说明了目前中国公募、私募、海外资管巨头的量化基金规模。




然后,林教授介绍了投资管理理念被动投资管理以市场有效性为基础,认为市场是有效的、投资者是理性的、不存在长期套利机会,积极投资管理以行为金融学为基础,认为市场存在无效现象、投资者是有限理性的、存在长期稳定的套利机会。其中积极的投资管理理论中,信息系数是其核心,表示投资回报和投资决策的相关性,是投资深度的度量。




而阿尔法与夏普指数、波动性、信息系数和投资广度的关系,如何最大化阿尔法的方法有提高投资技能(高信息比例)、寻找良好的环境(高波动性)、创造更多机会(高投资广度),为后面我们项目学习的课程做铺垫。并进一步解释了投资深度不易直接测量,而投资广度易于直接测量。投资深度可以间接测量但要根据投资广度的定义,并给出了具体的测量方法。进一步指出基本面投资是一种高深度(信息系数),低投资广度的投资风格量化投资是一种低投资深度(信息系数),高投资广度的投资风格




基本面投资和量化投资各有所长量化投资稍稍胜出

量化投资依靠一致、有序的严格流程;易于测试;可以应用于大量的投资标的;客观性;关注普遍现象;严重依赖历史数据;可以连续调整投资预测;可能做出一些伪假设。基本面投资依靠创造力和想象力;很难复制;非常消耗人力;主观性;可以解释特例;可以分析过去的经验是否有借鉴价值;调整投资预测不频繁;会被行为偏差所影响。接着介绍了量化投资金字塔,分享了量化投资策略框架。并启发我们:量化投资是一个很好的投资工具,但取决于我们的正确使用,纯数据挖掘、把幸运当技巧是两个误区,要走出误区还必须以科学理论为基础小心求证,大胆实践。




最后老师介绍AI技术逐渐渗透金融领域,在量化投资时间序列建模中,涉及元知识学习、人工智能算法和非结构化数据处理。在优化策略方面从网络结构、特征提取、输入数据纯人工到纯机器的演进。这给我后来设计基于神经网络的优化策略很大的启发与帮助。



温故知新:Python基础语法


下午是Python基础语法,包括Python基础语法、数据类型、数据运算、流程控制、函数设计、模块导入、内建函数、递归函数、高级特性、异常处理、面向对象与继承以及量化必备的Python基础知识,这给了其他零基础同学们从0到1的机会,对于我们这些熟悉Python的人也是难得的温故知新的好机会。





Day 2

> 2019.01.22 数据获取与数据处理


第二天上午学习了Python数据处理,包括numpy与pandas库基本功能、二维数据和三维数据处理、时间序列数据分析、数据可视化与Talib金融数据分析库。



谢昊

从量化新兵到课程导师

戳图片了解详情


之前在我们学校大概是花了一学期,通过学习Python程序设计、Python数据处理两门课程,加之修仙数晚熬完课设才取得了理想双满分优异成绩。Python量化投资项目在一下午与一上午就几乎包含了我这学期所有Python课程内容,高强度、干货满满!并且有项目配套免费的线上网易云课程,也不用担心课上跟不上没听懂,可以课下自己温习,非常周到。

下午主要介绍了金融数据的获取,各种API让我这个之前只用过Tushare和Wind的涨了不少知识。



Day 3

>2019.01.23 因子分析工具、因子分类与组合原理



Richard 田睿奇
大鱼金融CEO

清华大学生命科学及经济学本科双学位

清华大学金融系硕士、清华FMBA导师


在经过前两天热身,了解了Python基础语法、数据获取与数据处理方法及版本控制工具后,我们终于进入了重头戏阶段。


第三天早上田睿奇老师带我们走进了因子研发工具实操。从Alphalens定义和其数据准备工作、如何用Alphalens测试因子选股效果、信息系数的定义、如何使用信息系数的可视化呈现进一步观测因子效果、因子在不同板块的选股能力分析开始,到SignalDigger的定义、SignalDigger和Alphalens的区别与联系、如何使用SignalDigger测试和分析选股工作与可视化,到自定义因子与事件分析、因子预处理方法、多因子合成,进一步到参数优化、策略组合,理论结合代码实操,层层深入,带我们从零学会找到决定股票涨跌的关键因素构建属于自己的因子投资策略,并能够分析自己的策略绩效同时进行可视化



Robin

曾任标准普尔(亚洲)数量化投资部门/ 副总裁

现任香港投行量化投资总监

先后担任HKeX、CME等海外知名交易所的场内签约做市商


下午拥有丰富全球交易经验的Robin老师给我们详细介绍了量化投资的国内外现状和一些基本的金融基本面知识。让我们这些小白了解到目前券商、公墓、私募、个人投资者的行情,为了自己未来从业选择提供一些参考。


Day 4

>2019.01.24

VNPY引擎介绍与CTA量化策略



CMT美国特许技术分析师Channel


第四天Channel老师给我们介绍了大鱼金融的VNPY从策略到成交。从安装vnpy_fxdayu开始,手把手教我们如何配置引擎参数、编写策略与查看回测绩效,并以MA趋势为例,具体介绍了如何编写策略、设置止盈止损、如何进行MA+RSI的投资组合编写、如何进行多信号的组合策略编写,从易到难,每个细节老师都注意到了,并实时与我们互动,保证我们都跟上了老师的步伐,最后能够跑通整个系统的代码


在跑通代码的基础上介绍了均线策略、通道策略、动能指标策略、成交量指标策略、线性回归策略等,并启发我们在熟练掌握老师教的策略基础上进行创新,编写属于自己的策略。最后交了蜡烛图可视化分析、如何统计收益率与如何做金融数据统计。


这四天的学习帮助我们建构了量化投资知识的基本框架,同时学会了自己构建基本金融投资策略的逻辑与实操技术、回测绩效与可视化的方法。


Day 5

>2019.01.25

高频盘口策略与量化投资策略大赛


纸上得来终觉浅,绝知此事要躬行。在听了老师几天的精彩课程后,我们早就跃跃欲试,想要构建属于自己的投资策略了。


作为组长,在之前保证组员每天出勤、安全回到宿舍等问题的同时,也关注了一下组员们基础与学习进度。我们组虽然大部分都是零基础,有一个郭晓枫同学基础较为扎实,在高强度学习下也一直跟紧着。因为时间有限,为了在短时间内发挥团队最大的协同作用,根据每个组员具体情况进行了分工。我在第三天结束就开始准备多因子的策略并进行参数调优、郭晓枫负责单因子策略,其他同学再多巩固下老师上课教授内容,最后集体在因子选择上下点功夫优化,进行单因子、多因子两个策略进行对比总结。




不过计划也不是钉死的,随时可能产生变动。在第四天的时候,Channel老师向我们介绍了Alpha191,经过课下自己查阅资料了解到这是继《WorldQuant Formulaic 101 Alphas》报告公布后,2017年6月15号国泰君安证券推出《基于短周期量价特征的多因子选股体系》报告提出的选股策略。


报告指出在之前的101个阿尔法表达式部分因子在中国股市效果平平或已失效,自2017年以来,市场风格发生剧烈变化,曾经大放异彩的小市值策略已经失效的背景下,Alpha191仍在2017年上半年依然保持强劲的势头,自2012年1月至2017年4月,在扣除所有交易成本后,较之中证500指数,实现年化超额收益率50.2%,最大回撤5.9%,信息比率4.67。有了这些理论支持,我们可以在这些因子中进行筛选,形成我们的多因子投资策略,以期提高策略绩效与科学性


随之而来一个问题:这么多因子,如果用老师上课讲的方法,处理起来非常繁琐,耗时也比较多。我联想到了第一天林教授介绍的AI与选股。




于是在晚上阅读了几篇关于AI量化交易的文献,将选股问题转化为一个01分类问题,运用机器学习构建一个指数增强选股策略。可惜我们组没有会机器学习的,就只能我一个人单干这个部分了,压力也是非常大。


短短几天学习还是不是很精通DataView的数据操作,在凌晨3点才完成了Alpha191的构造,计算出跑赢十日市场收益率构造01目标、把特征合并到一张表上,然后划分训练集和测试集的时候已经快天亮了。当时非常着急,直接把数据标准化就丢进了用keras构建神经网络,发现不论怎么调网络结构准确率就在50%左右,甚至梯度还消失了,当时真的非常紧张怕自己没做好,作为组长我希望我带领的团队做的每一个项目都能取得最好的成绩。




冷静一下之后开始和之前打kaggle一样,一步一步来,从Exploratory Data Analysis开始,分析数据的结构、缺失值、异常值、特征之间的相关性等,然后进行数据的降维去噪声工作,最后再调了调网络结构,达到了正确率90.3%,AUC90%的效果。可惜时间不够,没有能够与XGBoost、LightGBM、SVM、Random Forest等在文献中同样有不俗表现的模型进行对比分析。



▲沈吉梅答辩中


在答辩的时候,没有过多的修饰,把这几天我们最真实的工作情况进行了呈现。在现场导师也给予我一些非常宝贵建议,如时间窗选择需要进行实验调试、要更多关注选了哪些股票、神经网络方法难以解释使用的时候要多加考虑等。虽然取得了一等奖,但这并不代表我们做到了尽善尽美,从别的组的答辩中我也吸取到了很多优点,认识到了我们做的不足的地方:应更加注重团队凝聚力,要有在大家都不会的情况下也决不放弃,做完实验的坚持;应仔细分析因子背后的经济学原理等。



▲比赛时专业导师在点评


我们来自全国各地,有各年级的本科生、研究生,其中不乏清华、中财、西财等学校的优秀同学,甚至有来自澳洲与英国留学的同学。为了心中的梦想,为了更为卓越的人才,我们不约而同来到了深圳量化投资实战营,五天的时光匆匆而逝,我们的2019深圳Python量化投资实战营之旅也画上了一个圆满的句号。



▲沈吉梅小组取得第一名的好成绩


但这里的句号并不代表终点,而是我们的量化投资之旅进入了一个新的转折点,在回到各自的生活后,我们会带着这次的美好回忆,不断充实自己,完善自己的知识体系,补全自己的漏洞,在量化投资路上越走越远。朋友们,我们江湖见!




如果你也想学习量化投资

收获满满干货

可以扫码预报名




     中创学院结合前沿产业与最佳商业实践对专业人才的需求,举办实战应用型培训课程,补充传统高等教育的不足,帮助人才实现技能和素质的提升,适应大数据和人工智能时代的挑战,培养新时代新业态需求的优秀人才。

--------------------------------------------------------------------------------
关于课程报名/课程了解等,请点击填写表单或邮件联系我们!
您的姓名
*
联系电话
*
联系邮箱
*
提交
我们的服务
公司介绍
联系我们
最新消息
关于学院
· 中创学院客服号:rechargehnq
· 中创学院公众号:chinacii
· 商业项目合作:yandon@g-sice.com.cn