主题:财经文本数据库管理平台交流会
报告人:聂永生
时间:2019年10月10日周四上午9点
地点:松江校区序伦大楼804会议室
报告人简介:
现任锐思数据公司高级产品经理,主要负责锐思数据产品线的设计与研发工作。拥有10多年一线教学产品研发和设计经验,主要参与的项目包括数据库产品、一带一路产品、大数据教学与实训产品、金融量化投资平台和仿真教学产品等。
负责公司产品的全过程管理,对整个产品策略设计、实施、上线、反馈、数据收集等全流程及结果负责,包括领导研发团队进行产品开发;领导项目组制定业务合作模式与方向,与商务部合作开发市场渠道等。
同时熟悉市场上各类数据公司的数据源情况,具有多年的数据处理、数据分析、数据服务等业务经验。
报告内容简介:
介绍即将在我校大数据平台上上线的财经文本数据库管理平台,并征求教师们的意见和建议。
该平台通过Python爬虫技术,爬取涵盖A股和B股上市公司从1991年至2018年之间的上市公司报告数据,数据包括上市公司年报、上市公司重大事项公告、上市公司审计报告、上市公司开展风险管理业务的公告、内部控制报告、上市公司IPO招股说明书文本、上市公司问询函及回复说明、上市公司业绩说明会等。
然后平台从学术研究和业界量化投资需求出发,聚焦于海量财经文本数据,应用自然语言处理、深度学习和人工智能技术对财经文本进行深度加工,为用户提供财经文本的词频、相似词、文本特征等全新深度处理的数据,从而为学术研究、投资决策应用等提供多方位支持。
欢迎广大师生积极参加!
会计学院
2019年10月9日