收藏本站
《2017年(第五届)全国大学生统计建模大赛获奖论文选》2017年
收藏 | 手机打开
二维码
手机客户端打开本文

基于文本挖掘和SVM的股票市场择时交易研究

刘晔诚  田鹏飞  林海潮  
【摘要】:近年来,随着计算机计算能力的提高以及人工智能的飞速发展,量化投资开始在中国金融市场崭露头角。借助于大数据的发展趋势,机器学习逐渐在量化投资领域发挥出优势。本文主要研究机器学习技术在量化投资领域的应用。学术研究表明,投资者的情绪能够影响股票市场的未来走势。为合理量化投资者情绪,本文首先利用Python编写网络爬虫程序,在东方财富网"股吧"爬取了200万条标题文本数据,进行分词处理、词频统计后,得到初始关键词库。之后利用百度指数相关搜索词功能将关键词的个数扩充至69个,并通过Elastic Net和主成分分析法构造投资者情绪指数。同时,本文使用上证指数2011年3月24日至2017年5月24日共1500个交易日的数据,经过特征工程处理,建立了基于支持向量机(SVM)的股票市场择时交易模型,使用Sliding Window法进行最优参数的学习,从而对股市的未来趋势进行预测,得到未来每个交易日的操作信号。最后,将基于文本挖掘所构建的投资者情绪指数作为数据的一个特征代入SVM中,探讨其是否能提升模型的预测性能。本文经过研究主要得到两个结论:一是经过特征工程对原始数据进行处理后,基于SVM所建立的股票市场择时交易模型对于上涨市、下跌市、震荡市均有较高的预测精度,且在震荡市捕捉到了更多的交易信息,相比买入并持有策略有更高的年化收益率。二是基于文本挖掘所构建的投资者情绪指数能在一定条件下提升模型对股票市场未来趋势的预测性能。
【作者单位】:中南财经政法大学
【分类号】:TP391.1;F832.51

【相似文献】
中国期刊全文数据库 前10条
1 石善冲;朱颖楠;赵志刚;康凯立;熊熊;;基于微信文本挖掘的投资者情绪与股票市场表现[J];系统工程理论与实践;2018年06期
2 孟雪井;孟祥兰;胡杨洋;;基于文本挖掘和百度指数的投资者情绪指数研究[J];宏观经济研究;2016年01期
3 陶洁;;文本挖掘领域研究现状与趋势分析[J];武汉船舶职业技术学院学报;2018年02期
4 郭瑞华;崔雷;;文本挖掘在药物靶位研究中的应用[J];中华医学图书情报杂志;2017年03期
5 王继钢;;文本挖掘重点技术研究[J];漯河职业技术学院学报;2015年05期
6 陈莹玉;;让标点符号教学“厚实”起来[J];福建基础教育研究;2016年12期
7 鹿鹏;庄敏;龙刚;林宋伟;;文本特征提取研究现状分析与展望[J];科技创新与品牌;2017年04期
8 杨明智;张召浦;;基于文本挖掘的商学院数字创新课程研究[J];当代教研论丛;2017年04期
9 汪顺玉;赵晴;;基于文本挖掘的不同层次大学生英语作文的词汇和主题特征分析[J];英语研究;2017年01期
10 陈皓琰;;基于文本挖掘的电子商务市场表现研究[J];科学中国人;2017年12期
中国重要会议论文全文数据库 前10条
1 刘晔诚;田鹏飞;林海潮;;基于文本挖掘和SVM的股票市场择时交易研究[A];2017年(第五届)全国大学生统计建模大赛获奖论文选[C];2017年
2 朱强生;田英;周延泉;何华灿;;基于非负因子分析的模糊文本挖掘[A];2006通信理论与技术新进展——第十一届全国青年通信学术会议论文集[C];2006年
3 高飞;荆继武;向继;;文本挖掘系统的可视化方法研究[A];全国网络与信息安全技术研讨会论文集(上册)[C];2007年
4 钱程扬;龙毅;徐震;孙昊;;基于Web文本挖掘的地理位置信息重建技术[A];中国地理学会2007年学术年会论文摘要集[C];2007年
5 陈宇;王强;;聚类算法在Web文本挖掘中的应用研究[A];2009全国计算机网络与通信学术会议论文集[C];2009年
6 武洪萍;周国祥;;Web文本挖掘研究[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
7 吴威;;基于Web文本挖掘算法预防现实危害的研究[A];第31次全国计算机安全学术交流会论文集[C];2016年
8 郭晓菲;李清军;潘子颖;蒋锋;;基于投资者情绪指数的上证综指预测研究[A];2015年(第四届)全国大学生统计建模大赛论文[C];2015年
9 李薇;刘琦;马占鸿;;基于SVM法的小麦条锈病潜育期冠层高光谱识别研究[A];植保科技创新与农业精准扶贫——中国植物保护学会2016年学术年会论文集[C];2016年
10 杨镇宇;祝诗平;;基于机器视觉和SVM的花椒外观品质检测[A];2009全国虚拟仪器大会论文集(二)[C];2009年
中国重要报纸全文数据库 前10条
1 本报记者 施鹏;非结构信息和文本挖掘[N];21世纪经济报道;2009年
2 周青 编译;文本挖掘工具实现非结构化数据价值[N];计算机世界;2004年
3 中国社科院金融所金融市场研究室副主任 尹中立;“券商内幕交易第一案”反思[N];南方周末;2009年
4 长江商学院金融学教授 金融与经济发展研究中心主任 甘洁;汉能的“不寻常”与香港股市监管不足[N];经济观察报;2015年
5 本报记者 李保华 胡中彬;到海外买股票去[N];经济观察报;2014年
6 ;股权融资大时代到来[N];经济观察报;2015年
7 ;对下半年股票市场不宜悲观[N];中国经营报;2018年
8 贾志;股票市场 价值投资继续深化[N];中国城乡金融报;2018年
9 郭施亮;如何理解“股票不是用来炒的”这句话?[N];金融投资报;2018年
10 本报记者 孙震 实习生 柳青;70.6%受访者今年买了股票[N];中国青年报;2015年
中国博士学位论文全文数据库 前10条
1 周雪忠;文本挖掘在中医药中的若干应用研究[D];浙江大学;2004年
2 陈晓云;文本挖掘若干关键技术研究[D];复旦大学;2005年
3 王明春;基于粗糙集的数据及文本挖掘方法研究[D];天津大学;2005年
4 卜东波;聚类/分类理论研究及其在文本挖掘中的应用[D];中国科学院研究生院(计算技术研究所);2000年
5 孙道军;文本挖掘预处理相关基础技术分析与应用研究[D];北京邮电大学;2008年
6 崔亮;投资者情绪的统计测评及其应用研究[D];西南财经大学;2013年
7 檀敬东;文本挖掘的若干关键算法研究[D];中国科学技术大学;2010年
8 董孝伍;投资者情绪对中国股票市场的影响研究[D];山西大学;2017年
9 邓增洪;中国股票市场主要参与者行为特征研究[D];武汉大学;2013年
10 阙紫康;中国股票市场制度效率研究[D];中国社会科学院研究生院;2002年
中国硕士学位论文全文数据库 前10条
1 张伟;基于微博文本挖掘的投资者情绪与股票市场表现研究[D];山东大学;2015年
2 郭立秀;基于文本挖掘的生鲜电商顾客满意度研究[D];西南交通大学;2018年
3 冯忠强;基于文本挖掘的医用加速器核心部件FMECA分析[D];电子科技大学;2018年
4 陈冬冬;基于专利的技术趋势分析系统的设计与实现[D];北京邮电大学;2018年
5 刘星辰;基于文本挖掘的用户画像系统的设计与实现[D];北京邮电大学;2018年
6 龚言浩;基于文本挖掘的智慧城市建设的热点与城市差异研究[D];南京大学;2018年
7 陈冠豪;数据开放中的症结问题研究[D];北京邮电大学;2018年
8 崔苹;基于文本挖掘的个性化推荐系统研究[D];上海师范大学;2018年
9 杨郁琪;基于文本挖掘的用户满意度影响因素研究[D];中北大学;2018年
10 丁诗晴;基于在线网站评论的中文文本挖掘[D];华中科技大学;2016年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026