教育培训
基于大数据的交通全生命周期投资决策
日期:2018-05-17 来源:中国公路
对于交通行业而言,投融资是交通全生命周期的一个重要环节。投资决策的质量和效率关乎到交通行业资源的优化配置,对实现交通强国的目标具有重要的战略意义。大数据技术有助于解决传统投资决策目前存在的问题,为提高交通投资决策的质量和效率提供有力的支撑。
(1)大数据辅助交通投资
当前,我国交通投资决策存在分阶段决策、信息碎片化、考虑因素不全、海量数据价值挖掘不足、投资决策无法实时应对市场变化、投资分析模型选择偏主观等问题,贯穿项目全生命周期的立项、实施管理、养护, 以及运输服务等环节的投资决策科学性和准确性,都有待进一步提升。
在立项环节,存在预测分析不准的问题,原因在于规划的阶段性太强,而信息却是碎片化的,数据采集成本高,数据间分析过多依赖经验,投资决策的精准度还有待提高。在实施管理环节,由于技术手段等原因,传统方式下项目管理精细化程度不高。
在养护方面,技术数据获取有限并且使用率不高,数据深入挖掘分析有待开展,养护管理信息化程度、行业决策及政策制定手段都有待提高。在运营服务环节,由于市场信息共享不充分,运输服务市场通用诚信体系尚未建立,存在效率低、成本高、资源配置不平衡的情况。
针对上述问题,中国公路工程咨询集团有限公司(简称“中咨集团”)利用大数据技术,辅助交通全生命周期投资决策。
大数据的应用贯穿了交通全生命周期,包含建、管、养、运等多个环节。在大数据环境下,可积极探索用数据流去活化交通流,每一次循环都给每个业务环节单元带来新的变化,最终促成基础设施产业链的生态系统升级。具体而言,是深入考察研究交通全生命周期的立项、设计、施工、管理、养护、运营等环节中的投资决策问题,并尝试利用大数据技术建模分析。
在每个环节的应用研究过程中,首先,收集大量的数据源,包括路网、车辆行驶过程、高分遥感、交通经济、资源环境等综合性样本数据。其次,将每个数据因素进行归类,并关联建模、分析解决问题的输出项,再耦合迭代多个模型,得到相对精准的模型,输出科学合理的预测值或结论,辅助解决相应的投资决策问题,弥补、改善传统模式的不足,使投资决策更加科学和精准。
在交通全生命周期投资决策中,中咨集团建立了大数据支撑平台,具体包括四个步骤:
把采集的数据在存储平台进行分布式存储和分类管理;搭建“SPARK+Hadoop“分析平台并提供通用分析工具;运用神经网络、机器学习等技术建立相应解决方案模型;最终形成投资决策、管理决策等实际应用。
通过大数据模式与传统模式的对比发现,传统模式数据简单,往往把很复杂的系统问题进行简单化处理,比如将交通量与GDP 挂钩,而最终决策还是以专家经验为主,更多是做趋势化的预测;而大数据模式则是追求在海量数据间寻找规律和关系,更精准地预测未来,以此找到解决问题的路径。
简单的说,传统模式是简单处理复杂问题,其误差是每年累积的,且预测周期越长,误差越大,甚至可能南辕北辙;而大数据模式是全面客观处理复杂问题,随着时间周期的增长,通过机器学习使误差不断被校正,其准确率会越来越高。
(2)大数据交通量预测方法及公路养护投资决策管理系统
基于大数据的山西省公路立项投资决策是一个典型的案例。在传统模式下,公路立项环节由于交通流量预测不准,导致投资决策依据不充分。
在解决这一问题时,综合考虑多种影响因素,利用大数据对交通流量进行准确预测,以此作为提高立项投资决策质量和效率的突破口。
总体来讲,我国的交通需求分析还是遵循交通四阶段法。传统四阶段法的不足之处共有四方面:首先,OD调查难度高,数据样本量小;其次,增长分析时受弹性系数法的限制,考虑的影响因素较少,甚至在一些特殊的地区、特殊的项目,有可能关键的影响因素并不被重视;再次,数据误差较大,由于交通量存在时空波动,以少数几天的调查数据推算年平均日交通量,会导致基础数据存在较大的误差;最后,四阶段法建模时,许多过程依赖经验进行参数标定,不可避免引入人为误差,这些误差可能会产生迭代累积并被放大。
为了弥补不足,在大数据环境下采用机器学习和大数据技术,在四阶段法的基础上建立大数据交通量预测方法,实现了对传统方法的改进提升。
首先,大数据方法使用全路网全样本数据,包括历年路网数据、收费站流水数据、交调数据以及配合其他数据获取源共享数据;其次,大数据方法采用动态路网参与模型计算,包括从过去、现在、到将来的动态演化路网;再次,在统计年鉴等通常数据获取途径的基础上,通过网络爬虫等技术补充数据,提炼了对交通量产生影响的上百个影响因子;最后,对交通量预测中的相关函数,利用大数据技术统计分析历史数据再自动标定参数。
通过以上方式,建立的新交通量预测模型。这个模型的特点是,不止为一个项目服务。某级政府部门建立这个系统后,由于其网络爬虫数据等动态数据实时更新,可以依据政府需求随时提出预测。这在某种程度上是对我国前期交通预测、交通需求分析工作的一个革命性改变。
在借鉴传统四阶段法基础上,建立基于大数据的交通量预测模型,这个模型内部构建了路网拓扑关系模型、交通总量预测模型、交通分布预测模型、路段交通量预测模型四个子模型。
对于路网拓扑关系模型,在收集到高速公路网和国省道公路网的数据,通过匹配相应字段,建立高速与国省道的拓扑关系,将这两个路网合二为一。
对于总量预测模型,首先尽可能采集与交通量相关或有可能相关的基础数据。山西的项目中,一共采集了130 个影响因子,通过主成分分析降维处理,提取关键影响因子,通过降维,提炼出涉及到社会经济指标、路网总体结构、交通运输指标等30 个主成分因子,远远超过以往常规的交通需求分析的变量要求。
确立主要影响因子后,寻找模型建立影响因子与交通量的关系,通过比选各种模型,构建了BP 神经网络和RNN 神经网络的联合模型,分别实现增长分类功能和增长预测功能,共同组成交通总量预测模型。对于构建交通分布预测模型主要分为两步。首先是构建基年OD 表,根据基础年的OD标定预测模型的参数。其中,高速公路OD 是由收费站之间交通量转换得到的,国省道OD基于断面交通量观测数据,采用反推算法得到的。然后,对上一步交通总量模型预测出的交通发生与吸引总量,采用重力模型得到流量在最小区间的分布。
在路段交通量预测模型方面, 把小区间的OD 分配到具体路段上, 这里采用Frank-Wolfe 算法来求解用户均衡问题。对模型中的相关参数,基于实际数据,采用机器学习曲线拟合的方法标定,模型最终输出每个路段的交通量,同时可形成行程速度、行程时间、路段服务水平等数据。模型建好后,还需要不断补充数据进行模型的维护与更新,从技术维度、空间维度和时间维度等多个方面迭代更新,持续改进模型,提高预测精度。
众所周知,交通量预测是投资立项决策的最大变量。首先其难度是高的,另外对项目经济效益的影响也是很大的。该案例充分利用大数据技术,优化传统四阶段法,通过对交通流量精准预测分析、建模,为项目立项环节提供更好的支撑。
为了检验模型效果,在利用实测数据对模型精度核查后,综合采用浮动车现场调查数据、连续观测站监测数据、主线收费站流水数据等核查预测模型,结果准确率都在80% 以上。随着技术进步、数据更新、模型迭代,预测精度还将进一步提高。这是以山西全省范围的一个路网交通需求的案例。
第二个案例是中咨集团开发的基于大数据的公路养护投资决策管理系统。我国公路养护投资决策一直存在信息化程度不高,缺乏决策技术手段等问题,影响到公路养护资金的使用效率。
利用大数据全面梳理养护业务,从区域、路线等维度,建立技术状况综合评定、养护资金优化分配模型来提高道路服务水平。养护投资决策管理系统充分利用有限资源,输出更加科学合理的养护投资决策方案,使得公路基础设施在其全生命周期内发挥最佳的经济和社会效益。
开发的系统在收集了历史技术状况、社会经济环境、路面养护业务及路面养护资金预算等数据资料后,经过数据整合、分析,建立技术状况评定模型、养护投资决策模型,资金优化分配模型,提供一年至多年的养护资金分配方案,同时可根据实时发生的资金分配方案产生的数据迭代分析,辅助相关部门做出科学合理的养护投资决策。
在微观方面,通过引入实时交通量,建立“基于实时交通量的路面性能模型”,建立时间、交通量、路面性能指标三者的关联关系模型,更好地为养护资金使用提供实时的评定数据,便于缩短养护投资决策周期。
公路养护投资决策系统可满足不同层级用户的管理需要,在大数据技术的应用下,采集历史养护需求数据、检测数据、时间维度和空间维度等数据,通过建立路况评定模型和养护资金优化分配模型,输出项目级养护决策资金,为养护投资决策提供更科学、更高质量、更高效率的依据。
(3)未来将实现全生命周期流程再造
未来,将通过高分遥感、联网收费等技术,致力于构建以交通一张图和数据一张网为基础的全国交通运输一张网,实现道路交通的多维度信息可视化,并将其应用于政策研究、防灾减灾、路网规划、勘察设计等领域,更好地服务行业、服务政府、服务公众。目前,中咨集团已取得阶段性进展,高分交通数据中心已对外正式提供服务。
现阶段只是利用感知、认知、洞察与控制的数据驱动,实现交通基础设施的全过程可管,未来将实现全生命周期流程再造,以及全新商业模式的革新。
(本文根据作者在2017 中国交通投融资年会上的报告整理,题目为编者所加。)( 来源: 《中国公路》 作者:文/ 中国公路工程咨询集团有限公司总经理 李志军 )