由于投资者的注意力偏差,经济上相互关联的公司发布的消息不会立即反应在股票上,这就产生了收益可预测性。通过已经抽取的实体结合业务逻辑确定实体间的关系,同时已经完成了知识图谱存储的工作。其中实体主要包括上市公司上下游原材料、主营产品、主营业务、所属行业、所属板块等十余种实体。
基于此理论构建模型,利用产业链知识图谱寻找相关联公司,验证了收益的可预测性。
知识图谱构建数据:招股说明书、财务报表等上市公司公开文档。
所用其他数据:
1)资产价格时间序列数据
2)价格、金额、指数、销量、出货量等五个指标所代表的宏观指数