您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[北京大学]:2017年9月北京大学金融科技情绪指数 - 发现报告
当前位置:首页/行业研究/报告详情/

2017年9月北京大学金融科技情绪指数

金融2017-11-01北京大学赵***
2017年9月北京大学金融科技情绪指数

北京大学金融科技情绪指数 (2017年9月) 王靖一① ② 摘要:互联网金融,自其作为一个概念被提出,其发展便伴随着媒体的不同声音;近年来,随着“互联网金融”这一名词逐渐污名化,金融科技,或FinTech因其更好的概念包装与国际沟通遍历,逐渐成为业界与媒体描述的主要表达。为了能够科学、准确、量化地刻画互联其发展变化脉络,我们利用逾1700万条新闻全文数据,借助自然语言处理、机器学习等方法,编制了一套覆盖2013年1月至2017年9月的互联网金融情绪指数,指数包含了对于金融科技整体与P2P网络借贷、互联网支付等12个子类的关注度与正负情感的度量。指数表明,金融科技的整体关注情况呈现出波动上扬的趋势,而对其整体的正负情感态度,则振动较为剧烈。而金融科技各子类,在关注程度与正负情感态度上,则有着较大分化。 关键词:金融科技、情绪指数、主题模型、词向量模型 2017年11月 ① 王靖一,北京大学国家发展研究院博士研究生 ② 本课题为北京大学数字金融研究中心课题《北京大学互联网金融情绪指数》资助下的阶段性成果;作者感谢黄益平、沈艳、黄卓、谢绚丽、孔涛、王海明、郭峰、鄂维南、窦笑添、任洁、王旭、曹琦、杨雨成、予象、周伊敏在指数编制过程中的建议与帮助。 i 北京大学金融科技情绪指数 http://idf.pku.edu.cn i 2017年11月 目录 1.引言................................................................................................................... 1 2.关注度指数构建方法 ........................................................................................ 2 2.1 数据准备 ............................................................................................................. 3 2.2主题过滤及筛选 .................................................................................................. 5 2.2.1 朴素过滤器................................................................................................... 6 2.2.2 LDA过滤器 ................................................................................................... 7 2.2.3 讨论:为什么不将LDA的结果直接输出作为关注度指数 ................... 10 2.2.4 HDP过滤器介绍 ........................................................................................ 10 2.2.5 LDA归类器 ................................................................................................. 13 2.2.6 未来扩展:动态主题模型(DTM) ........................................................ 15 2.3关注度指数化 .................................................................................................... 15 3.正负情感指数构建 ........................................................................................... 16 3.1词向量模型关键词拓展 .................................................................................... 17 3.2 情感指数的计算 ............................................................................................... 19 3.3 词向量版本的情感描述 ................................................................................... 20 4.主要指数结果汇报 ........................................................................................... 20 4.1关注度指数 ........................................................................................................ 20 4.2正负情感指数 .................................................................................................... 21 5.展望与扩展:开源 ........................................................................................... 22 参考文献 ............................................................................................................. 23 北京大学数字金融研究中心简介 ........................................................................ 25 ii 北京大学金融科技情绪指数 http://idf.pku.edu.cn ii 2017年11月 图表目录 图表 1 关注度指数计算流程图 .................................................................................. 3 图表 2 数据准备阶段流程 .......................................................................................... 4 图表 3 主题过滤及筛选流程 ...................................................................................... 6 图表 4 LDA模型示意 .................................................................................................. 7 图表 5 一个LDA模型的结果示例 ............................................................................ 8 图表 6 中国餐厅过程 ................................................................................................ 11 图表 7 中国餐厅集团过程 ........................................................................................ 12 图表 8 HDP结果 ........................................................................................................ 12 图表 9 LDA归类器识别了支付子类下的不同主题 ................................................ 14 图表 10 动态主题模型 .............................................................................................. 15 图表 11 关注度指数化 .............................................................................................. 16 图表 12 情感指数构建流程 ...................................................................................... 17 图表 13 CBOW和SKIP-GRAM模型示意图 .............................................................. 18 图表 14 三层神经网络示意 ...................................................................................... 18 图表 15 词向量模型,“庞氏骗局”近义词输出结果 ............................................... 19 图表 16 金融科技情绪指数-关注度指数 ................................................................. 21 图表 17 金融科技情绪指数-正负情感指数 ............................................................. 21 1 北京大学金融科技情绪指数 http://idf.pku.edu.cn 1 2017年11月 1.引言 互联网金融,自作为一个独立概念,在四十人论坛2012年年会被谢平提出,其发展过程始终伴随着来自不同源头、秉持不同态度的声音。互联网金融得益于信息技术,其发展速度远超传统金融,据北京大学互联网金融发展指数度量,在2014年1月至2016年3月期间,增长了4.3倍(郭峰等(2016));而同时,截止至2015年11月,累计