摘要:【目的】构建国家经济大脑,运用大数据手段支撑宏观经济监测预测。【应用背景】国内外已有大量实践,国家发改委大数据中心正在积极尝试构建形成战略、政策、项目、企业、自然人五类本体构建规则。【方法】坚持均衡与演化路径相统一,引入批判实在论分析视角,整合复杂网络、自然语言理解和时空分析等算法模型,形成宏中微观一体化分析体系。【结果】微观层面,整合打通政府和社会数据,构建动态本体库,实现以企业社会信用代码为主线统一关联全国3000万家企业和5000万家个体工商户的78大类、1828个指标项;中观层面,基于复杂系统突现的三个依赖性,构建仿真分析平台;宏观层面,围绕监测经济动力(投资、消费、贸易)、产业运行和区域发展三方面,提出实践应用较成熟的15种大数据监测指数,构建传统预测与复杂性预测、行为预测和时空预测等新方法相结合的预测平台,强化风险识别。【结论】构建微观动态本体、中观仿真分析和宏观监测预测的统一框架,能够有效解决宏微观经济学脱节的理论困境,促进提升宏观决策科学性。
关键词:大数据经济监测预测国家经济大脑
分类号:TP391
1 引言
近年来,充分发挥云计算、大数据、人工智能等新技术手段,提高宏观经济运行决策水平,已经成为各界高度共识。从全球范围来看,政府治理模式正在从传统的韦伯模式和新公共管理(NPM)模式过渡到数字治理(DEG)模式,其基本特征就是将大数据和数字化技术置于机构层级的核心位置,推动数字化的整体性政府建设,在决策模式上高度强调“使用数据来理解公民,并为政策制订提供依据”。充分发挥大数据技术优势,助力提升国家经济监测预测和宏观调控水平,已经成为大势所趋。国务院2015年发布的《促进大数据发展行动纲要》(国发〔2015〕50号)专门指出,要建立运行平稳、安全高效的经济运行新机制,实现对经济运行更为准确的监测、分析、预测、预警,提高决策的针对性、科学性和时效性。从研究方法论的视角看,大数据在打通经济学“均衡范式”与“演化范式”、形成宏中微观一体化的经济分析框架,有效衔接经济学艺术(theartofeconomics)、实证经济学(positiveeconomics)与规范经济学(normativeeconomics)方面[]具有独特作用。本文拟从大数据经济学的上述特点出发,论述在国家层面发挥我国独特制度优势,构建政企一体化的数据归集和治理体系,建设支撑宏中微观经济运行分析的“国家经济大脑”的基本思路。
2 国内外相关领域的实践探索
2.1国外的实践探索
2012年3月29日,美国白宫网站发布的《大数据研究和发展倡议》(BigDataResearchandDevelopmentInitiative)提出,实施大数据计划旨在帮助美国获得从海量复杂数据集中萃取知识的能力,借此提高国家应对急迫挑战的水平,大数据上升成为美国的国家战略。此后,主要西方发达国家均发布与大数据相关的宏观政策优化战略,如澳大利亚政府发布的《公共服务大数据战略》、法国政府印发的《数字化路线图》、英国政府发布的《把握数据带来的机遇:英国数据能力战略》等等[]。总体而言,目前西方发达国家政府运用大数据开展宏观经济监测预测的实践尚处在起步阶段,但也形成了一些成熟经验和模式。
一是利用大数据技术丰富和提升传统统计手段。美国经济研究局(NBER)2019年3月举办了题为“面向21世纪的经济统计大数据”(BigDatafor21stCenturyEconomicStatistics)的专题研讨会,与会者集中探讨了利用网络自然语言数据、众包数据、商业扫码数据、交易数据等新型数据归集方式构建失业率等统计指标。通过此次会议还可以发现,美国宏观经济运行的多个相关部门都在积极探索利用大数据等新技术手段改进宏观经济运行分析,如美国经济分析局(BEA)尝试对比机器学习和替代性数据在经济预测中的效果,美国劳工统计局(BLS)尝试利用第三方数据、企业数据和Web抓取的零售商API数据来优化消费者价格指数(CPI)的数据采集,美国人口普查局利用机器学习和公共数据尝试自动化生成北美工业分类系统(NAICS)代码,等等。
二是利用大数据技术优化宏观经济决策。早在大数据技术诞生的初期,各国政府就十分关注大数据技术在公共政策领域的应用。如澳大利亚政府通过采集交通系统感应器的海量信息,构建了交通密度指标,并根据该指标观察出经济活动与交通密度之间的高度相关性,以此作为经济政策的评价工具之一。德国政府利用家庭电表反馈的海量数据制定具有可行性的激励政策以增加对智能电网基础设施的投资,调整传统的补贴方式和规制方式,根据需求优化电力资源配置。英国政府曾组织开展基于社交媒体的政策效果预测研究,通过在一系列社交平台中系统性地抓取数据,针对即将推出的经济政策变动在社交媒体中反应进行预测性分析。
三是构建全国大集中的政府宏观决策数据中心。在这方面,澳大利亚社会保障服务信息中心(Centrelink)和新加坡的“风险评估和水平扫描”系统(RAHS)是代表案例。Centrelink是澳大利亚联邦政府的一个政府机构,是公共事业部(HumanServicesportfolio)的六大机构之一,在联邦和各州都设有,其在堪培拉设有两个大型数据中心,与联邦和各州的税务、金融、警局等部门实现联网共享,并运用大数据分析技术构建了一系列围绕就业、社会福利、医保等领域的风险预测评估模型。新加坡建设的“风险评估和水平扫描”系统(RAHS)最初目的是应对恐怖主义和传染病,后来逐渐扩展到住房、交通、教育、安全等各个领域,其不仅可以帮助新加坡各级部门监测和识别恐怖袭击等风险事件,还可以帮助政府规划采购周期和预算、预测经济走势、制定移民政策和研究房地产市场。
2.2国内的实践探索
国家发展改革委作为我国宏观经济运行的核心部门,在运用大数据手段开展宏观经济分析研判方面起步很早。早在2015年,就组建了国家发展改革委互联网大数据分析中心,并启动建设国家发改委互联网大数据分析系统。2016年,国家发展改革委办公厅正式印发的《关于推进全国发展改革系统大数据工作的指导意见》(发改办厅〔2016〕1993号)提出,要“围绕发展改革系统履行职能,建设国家和省两级宏观决策可视化平台,充分应用可视化技术,围绕投资、工业、交通、能源、农业等重点领域开发经济地图,建设基于地理信息可视化的宏观经济运行大数据监测分析‘一张图’,形成涵盖宏观决策各方面的数据汇聚展示系统,支撑各级发展改革委领导会商与综合研判。”2017年,《国家发展改革委“智慧发改”建设规划》(发改办厅〔2017〕1959号)正式印发,提出打造智慧决策大脑的设想,要求“面向重大决策需求,构建‘智慧发改’决策算法库、模型库、指标库、知识库,开展各类大数据分析指标与传统统计指标的回归比对和关联分析,逐步推动经验智慧与人工智能融合创新,为加强和创新宏观调控提供强有力技术支撑。”根据文件要求,将原国家发展改革委互联网大数据分析中心改名为国家发展改革委大数据中心,推进归集位置信息、电子商务、交通物流、招投标、专利软著、自媒体等各种大数据资源,并面向国家发展改革委等上级机构开展重大政策大数据评估研究,目前已经完成500余期大数据决策参考报告,取得了较大决策影响力。
地方层面,海南、重庆、河北、杭州、宁波等地方政府也由当地宏观部门牵头,在利用大数据开展宏观经济分析方面开展了大量有益探索。如2017年11月,依托国家发展改革委大数据中心重庆分中心建设的重庆经济社会发展大数据决策支持平台项目正式启动,归集重庆市经济社会运行相关的17亿条数据资源,并构建了产业地图、投资地图、消费地图、外贸地图、创新地图、人才地图等分析板块。河北省发改委[]提出加快“全委信息化系统整合及大数据建设”的工作任务,通过构建信息资源目录和大数据系统实现了河北省发展和改革委员会全委政务信息资源共享、建立完善的宏观经济数据采集渠道、宏观经济大数据融合分析及可视化展示等目标,并将时序算法、预测算法、相关性算法、聚类算法、影响因素等五类算法应用于宏观经济分析全生命周期。海南省发展改革委依托国家发展改革委大数据中心海南分中心建设了海南省宏观经济决策大数据分析系统,发布了《2018年海南省经济社会发展大数据分析报告》等一系列重要研究报告。深圳市发展改革委、青岛市发展改革委先后启动“智慧发改”工程,全面提升产业决策和重大项目事中事后监管水平。宁波市地税局启动了“宁波税收发展指数”课题研究,基于地方税收大数据开展挖掘应用,课题组将反映经济运行的税收指数通过建指标、合成统一数值的方法,所形成的税收指数与统计局所发布的PPI数值相关性达70%左右。
3 构建国家经济大脑的基本思路
未来,应吸收借鉴美国、澳大利亚、新加坡等国通过归集数据开展宏观决策的成功经验,充分发挥我国独特的制度优势,有效归集和开发利用全社会范围内经济运行相关数据,建设集宏中微观经济运行分析于一体的“国家经济大脑”,助力实现国家治理体系和治理能力现代化。总体设计思路遵循以下几个原则。
3.1在数据基础上,坚持政府数据与社会数据相统一
当前,随着互联网、物联网、移动通信等社会化数据源渠道的飞速发展,全社会数据资源正在从过去政府掌握80%的全社会公共数据资源逐渐转变为社会化数据资源占绝大多数的新格局。梅宏指出[],在当前万物互联化、数据泛在化的大背景下,越来越多物理实体的实时状态被采集、传输和汇聚,从而使数字化的范围蔓延到整个物理世界,物联网数据将成为人类掌握的数据集中最主要的组成部分。正因如此,习总书记在中央政治局第二次集体学习时指出,要加快公共服务领域数据集中和共享,推进同企业积累的社会数据进行平台对接,形成社会治理强大合力。要想系统描述和刻画全社会经济运行全貌,就要形成覆盖政府、企业、社会机构、个人和海外相关信息,跨层级、跨地域、跨系统、跨部门、跨业务的数据采集汇聚机制,强化陆海空天电网数据资源全领域、全要素统筹,实现对全国范围内信息化、网络化、可视化和智能化的数字集成创新,实现“一人一档、一物一档、一事一档、一机一档”的国家一体化数据资源体系框架,有效增强国家数据资源的纵横联动和协同管理能力。通过各类数据的深度整合和关联应用,深刻刻画国家政治、经济、文化等各方面发展状况,揭示宏观经济结构和微观社会状况。
3.2在分析手段上,坚持均衡范式与演化范式相统一
过去百余年来,经济学研究领域的均衡范式和演化范式正在呈现逐渐融合的态势。一方面,主流经济学近年来发展出的博弈论、行为经济学、实验经济学、信息经济学、新制度学派等分支已经吸收了借鉴了演化范式下对部分理性、创新扩散、路径依赖等的论述;另一方面,以复杂经济学、演化经济学等则将新古典(均衡)经济学看作是演化经济学(或非均衡经济学)的一个特例。目前,大数据在均衡和演化两个方向上都在发挥重要作用:在均衡范式下,由于大数据在分析时效性、颗粒度、热点识别等方面的优势,主流经济学界开始大量尝试基于大数据的计量经济学方法创新;在演化范式下,通过将基于主体建模(ABM)、演化博弈论、机器学习等新技术方法与大数据相结合,形成人类真实主体(HS)数据和计算虚拟主体(CA)数据之间的对比,有效支撑宏观经济风险识别和趋势预测。因此,在构建国家经济大脑时,应当力图将演化分析和均衡分析方法融为一体。在这一方向上,上世纪七十年代英国科学哲学家罗伊·巴斯卡(RoyBhaskar)提出的批评实在论,在沟通实证主义(大致对应于“均衡”范式)和非实证主义(大致对应于“演化”范式)两大范式方面取得了较大影响力,成为20世纪后半叶“英美哲学研究领域中最令人震撼的发展”。特别是巴斯卡提出社会系统具有不同于自然界的涌现特征,并主要表现在三个方面,即行为依赖性(Activity-dependence)、观念依赖性(Concept-dependence)和时空依赖性(Space-time-dependence),对本文研究框架的构建具有重要借鉴作用。
另一方面,从前期对国内外宏观经济大数据监测预测领域的研究方法的梳理也可以看到,目前经济运行大数据分析所使用的方法大致可以分为四类:一是统计分析方法,如ARMA模型、LASSO算法、向量自回归(VAR)、灰度关联分析、协整检验、主成分分析、多元线性回归、时序分析等,主要是将利用大数据手段构建的各种新指标与传统计量经济学的分析模型相结合,实际上是均衡范式在大数据环境下的进一步延续。二是复杂网络方法,如社会网络分析(SNA)、图模式识别、网络特征空间、二部图分析等,这类方法主要侧重于对微观经济主体的行为关联性进行分析挖掘,识别其中的潜在模式和演化趋势,大致可以对应于演化范式下的行为依赖性分析。三是人工智能方法,如潜在语义分析、支持向量机、贝叶斯分类、观点识别、新词发现、情感分析、回归树、随机森林、卷积神经网络等等,这类方法目前在宏观经济中主要应用场景是对微观行为主体的观点性文本进行分析挖掘,大致对应于演化范式下的观念依赖性分析。四是时空分析方法,如时空分布、位置分布、行为轨迹分析、区域关联网络分析等等,这类方法大致可以对应于演化范式下的时空依赖性分析。
表1大数据经济分析的主要方法及代表性研究
3.3在应用方向上,坚持监测预测与风险监管相统一
从应用方向上看,当前国家经济大脑建设的主要用途包括两个方面:一是运用大数据手段改进经济监测预测的效果。在经济监测方面,应用大数据手段可以提高经济运行监测的时效性、精准性和客观性,如通过开展经济现时预测(Nowcasting)研究帮助人们相比过去更快应对经济运行可能出现的趋势性、苗头性问题,通过应用异常检验、新事件探测等技术手段发现海量经济数据中隐藏的新业态、新模式等等。在经济预测方面,大数据不仅可以改进传统统计预测模型的预测表现,还可以运用多主体复杂性建模、时空演化预测、行为预测、基于机器学习自动识别先行性指标等手段建立全新经济预测模型。二是近年来随着中国贸易争端等不断升级,国际国内经济形势日趋复杂,加之中央政府大力推进“放管服”改革,各级政府在防范化解重大风险、加强重大政策重大项目事中事后监管等方面面临的挑战日益增加,亟待利用大数据手段强化监管手段,提升风险识别与防范能力。而传统经济学理论模型对于风险的识别与应对一直是一个软肋。正如著名经济学家布莱恩.阿瑟指出,经济学理论本身存在一个根本性弱点,即“缺乏一种能够在政策实施之前找到可能的失败模式的系统方法”。未来,通过运用新技术手段,对经济运行过程中的异常点、突变点、奇异点进行识别预测,对涉及重大政策、重大项目的风险领域开展预测预警,将成为宏观经济运行分析的又一理论和应用“蓝海”。
从大数据视角看待经济运行,可以构建一个以中观层面的规则、结构、机制及其涌现性分析为切入,向上向下统筹宏观和微观经济分析的新框架。正如多普菲(KurtDopfer)所指出的,“在经济演化过程中,无论是微观角度(复杂的规则结构构成系统,如公司)还是宏观角度(规则总体的复杂结构,如工业和经济),它们都建立在中观视角之上。”从这一角度,我们可以分别从微观、中观和宏观三个层面思考和规划国家经济大脑的技术框架。
4 微观层面:构建微观经济运行动态本体库
在大数据时代,构成各种复杂经济现象的微观主体(企业、机构、个人、商品等等)的行为数据、关联关系、基本属性等信息可以通过多种方法进行全面及时的收集和整理,从而为客观这些复杂现象提供了坚实的数据基础。正如维克托.舍恩伯格所说,“有了大数据的帮助,我们不会再将世界看作是一连串我们认为或是自然或是社会现象的事件,我们会意识到本质上世界是由信息构成的。”基于此,在国家经济大脑建设的微观层面,应当着眼于利用大数据手段快速构建领域本体和通用本体,形成对海量微观主体行为演变和关系网络的快速挖掘能力。具体而言,其主要任务包括几个方面:
4.1建立政企一体化数据归集汇聚体系
应当综合考虑政府、企业、个人、海外、互联网、物联网等多种数据来源,形成与国家经济运行相关各方面数据源的统一汇聚机制。其中,政府数据来源主要指国家平台(如全国信用信息共享平台、全国公共资源交易平台、全国投资项目在线审批监管平台等)、各部委平台(如公安、人社、税务、市场监管、民政、教育等)和各地方政务数据整合共享平台;企业数据来源是指企业生产经营全生命周期各类数据(如工商登记注册、税务、海关、就业社保、投融资、专利软著等);个人数据来源主要是指自然人工作生活中产生的各类行为数据(如移动位置、出行、教育、消费、通讯等);海外数据来源是指“一带一路”沿线等重点国家基本概况、经济产业、政策法规、规划计划、项目工程、投资贸易、科研机构、企业组织、旅游及文化交流、社会舆情等各方面信息;互联网数据来源是指互联网上公开信息(如新闻、微博微信、学术智库、电商评论、房产等);物联网数据来源是指从智能硬件设备中获取数据资源(如可穿戴设备、车辆、智能家居、工业控制等)。通过开展覆盖政务数据和社会化数据资源的数据标准化稽查、清洗、消减、转换、去重、打标、校验、修复、聚合、分级分类、血缘分析等数据治理和质量提升,不断提升大数据分析挖掘的可靠性。
4.2建立面向微观经济主体的动态本体库体系
在归集汇聚相关数据的基础上,构建人、企、车、物、事、地等微观经济对象的动态本体库。以企业工商注册信息、个人证件号、车牌号等个体唯一ID为主线,依托统一编码对接相关数据资源,对本体对象(Objects)、属性(Properties)和关系(Relationships)进行抽象化处理,依托复杂网络分析方法及大规模图计算技术,实现动态本体图谱的展现、布局、搜索、统计、分析、推理、演绎和学习,支持动态本体混合检索、路径发现、频繁子图挖掘、关键节点识别、社团发现等功能,形成多维度分析、多视角监测、多领域应用的动态本体图谱分析能力。
目前,国家发展改革委大数据中心已经联合数联铭品(BBD)等业内相关企业开发了微观经济主体的动态本体(DynamicOntology)管理系统,其将不同类型本体(企业、个人、事件、文档等)建模的基本维度划分为对象(Objects)、属性(Properties)和关系(Relationships)三个方面,通过关联打通工商企业注册信息库、投资项目在线审批监管平台、全国信用信息共享平台和国家公共资源交易平台等若干国家级大数据平台数据资源,初步实现了“重大战略-重大政策-重大项目-企业-自然人”五类本体的关联关系构建。如通过重大政策和项目招标文本的自然语言处理,自动关联识别“重大战略落实政策”、“重大政策配套项目”等本体关联关系;通过重大项目招投标和空间位置数据,自动识别关联“重大项目招中标企业”、“重大项目建设地点人流变动”等本体关联关系;通过企业工商注册信息关联识别“企业交叉持股关系”、“企业股东和高管组成”等本体关联关系。特别是在企业本体构建方面,目前已实现以企业统一社会信用代码为主线,对全国3000万家企业和5000万家个体工商户的工商注册、就业招聘、招投标、投融资、专利软著、社会信用、行政审批、法院判决等78大类、1828个指标项进行统一关联。
图1数据资源动态本体组织管理系统框架
5 中观层面:构建中观经济大数据仿真分析平台
正如前文所论述的,从经济社会运行的中观层面来看,复杂经济系统突现的行为依赖性、观念依赖性和时空依赖性等三个基本特征,既可以基于微观层面的经济动态本体进行仿真模拟,又可以归总并呈现为宏观层面经济运行监测预测的基本规律。因此,构建国家经济大脑的中观系统,就是要整合复杂网络、自然语言理解和时空分析三大类算法模型,将其作为模拟仿真中观经济现象的技术支撑。
5.1以复杂网络分析为核心的行为依赖性仿真分析
与自然科学研究不同,社会科学研究的对象与人高度相关。批判实在论认为,社会经济关系、结构和机制的存在具有对人的活动的依赖性,它既是人自身各种行为的社会化结果,又是存在于行为者之间的相对持久的社会关系。正如诺贝尔经济学奖得主罗伯特.索洛在其获奖致辞中指出的:“所有狭义的经济行为都植根于社会制度、习俗、信仰和态度的网络之中。”。行为经济学则认为,情境往往决定了人们如何决策,因此我们可以利用对情境的研究来解释甚至预测人们的经济行为。大数据相比传统统计手段一个最大的优势就是可以通过非干预的方法获取经济社会主体行为方方面面的“痕迹”数据。通过归集政府、企业、个人等各类微观经济主体的行为数据,可以刻画政企之间(如工程项目招投标)、企业之间(如企业间持股关系、商业合同、创新合作等)、企业与个人之间(企业招聘、消费记录等)、个人与个人之间(如社交关系、亲友关系、位置关联等)的主体关系,构建以微观主体为节点、以主体间关联关系为边的经济社会运行复杂网络,并运用图计算、网络社群挖掘、复杂网络演化分析、社会网络等分析方法识别经济运行主体的行为依赖性突现现象和演化规律。这方面技术方法和应用已十分成熟,如布莱恩.阿瑟基于复杂网络演化模型,对资本市场中资产价格变动的自我强化、集群波动(clustedvolatility)和突然渗透(suddenpercolation)三种涌现现象进行了预测模拟。HIDALGOCA等[]基于国别间贸易数据构建了“国家-产品”二部图网络,并基于网络拓扑结构刻画国家经济复杂性,并实现对国家发展潜力的预测。TACCHELLAA等基于“国家-产品”矩阵关系,利用非线性迭代算法刻画国家发展潜力和产品复杂性,较好地解释了不同国家的经济竞争力变化趋势。笔者也曾基于专利文本数据构建企业技术创新网络、基于税务发票进销项数据构建某市企业发票网络,并基于启发式社团发现模型对相关领域演化态势进行预测分析。
该子系统的基本分析功能应当包括:(1)统计特征分析。即对复杂网络基本拓扑指标的统计分析,如平均路径长度、聚集系数、度值、小世界和无标度特性等;(2)社团发现。典型算法如模块度优化算法、谱分析法、k-社团算法、模糊聚类算法等;(3)链路预测。包括相似性预测、最大似然估计预测、概率模型预测等);(4)重要节点发现。结合网络局部属性、全局属性、网络位置等指标,基于PageRank、LeaderRank和HITS等算法度量超大规模网络中节点重要程度;(5)社会网络分析。研究社会行动者包括人员、集团、组织或者其他信息与知识处理实体之间的关系和流动,并对其进行映射测量;(6)知识图谱分析。基于“实体-关系-实体”三元组以及实体相关属性的键值对,通过实体相互联结从而构成网状的知识结构[]等等。
5.2以自然语言处理为基础的观念依赖性仿真分析
发表评论