苏州城市数大脑实践之一:交通事故预测模型,早高峰预测准确率达到34%

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 本文由苏州市公安局信科委副主任施庆华在2017年12月8日苏州云栖大会分享。大数据时代来临,会给城市生活带来什么变化?苏州城市数据大脑项目有哪些具体进展?能给市民带来那些具体的便利?让我们来看一看施庆华怎么说。

以下为精彩视频内容整理:

城市大脑的起点,就是对数据的认知,数据是城市大脑的核心。苏州城市大脑项目的探索与实践,给城市大脑赋予了新内容和新含义。在苏州,我们按照系统性的思维,把城市大脑定位成苏州整个城市的信息化体系框架下,以重点领域的突破,整体推进城市大数据的“创新工程”。

 

一、数据驱动

城市大脑为什么会落地在苏州呢?

近年来,城市人口对于互联网、甚至互联网+的新型产业运用的越来越多,产生的数据也越来越多。数据的作用在日趋显现,它正在推进苏州的信息化进入到一个新的发展阶段——在原有的业务驱动的模式下,加载了数据服务功能,形成了以业务和数据双轮驱动的一种信息化发展模式。在苏州,城市大脑是一项前瞻性的决策,把苏州现有的信息化基础,和当前世界最前沿的技术应用结合起来,让数据帮助城市来做思考和决策。

fef01af092323bcfeb2cd82fd3404c8079ad3070

城市大脑是一项创新工程,它的一个重要特点是滚动设计——不断的实践,之后停下来不断的思考,周遭反复。我们每一次会议,每一次头脑风暴都贯穿着一条主线,是对城市新能源数据的开发、加工和利用。所以我们是小步快跑,快稳结合。

苏州是从两个维度来启动城市大脑的。首先,在领域这个维度,我们选择了交通治理来进行突破。为什么选择这个领域?是因为这个领域的关注度高,涉及面广,数据来源多,它能够为其他的领域发挥带动作用。实践也验证了交通领域的应用基于关联带动性,带动了更多行业的发展,也使得城市大脑有了越来越多的应用场景。其次,在区域这个维度,我们选择了苏州地区发展最快的工业园区。政府相信思维新、基础好、发展快的园区能够为其他板块发挥示范效应。

8c8a819a35a740772c261ffb001491acf36f64e5

人工智能技术就像一把刀。那么,它的磨刀石是什么?就是大数据。我们首先建立起一个聚焦交通的大数据生态。我们从政府部门、企业、互联网等角度聚焦交通,得到数据并将数据汇总,之后建立一个更新维护机制。整个数据汇集的过程,是一种以数据思维来重塑数据和业务关系的过程。我们把原始数据从业务部门抽取,通过标签化处理,形成能够服务于各个政府功能的数据库。

1ee69495a73830d19448ee7854c1d11b7b9183ae

我们可以继续的通过数据的不同组合按照不同的思维方式实现多种功能。并且同样的一项数据可以服务于多个功能,这个时候,数据的多维度价值就体现出来了。

目前,苏州建立了一个针对并服务于交通治理的立体数据生态系统。这个系统,让政府各个职能部门对于大数据有了更加实际和客观的认识。

 

二、数据赋能

1ae606c2eb309fed3cf914409f1a0f754869ac97

那么,数据层次的大数据建立能够给城市带来什么?首先,我们可以通过数据来观察这座城市,可以说,数据是我们观察城市的一双眼睛。通过最初建立交通的实施感知,让我们第一次全面的、客观的去观察这座城市的交通基础设施和出行人群之间的关系。比如:数据分析得知,苏州的68%的出行人群,出行距离在10公里以内。这就是对于苏州规划的很高的评价。长期以来,苏州是以区为单位来规划服务功能的。当然,数据还会告诉我们,哪些方面还有发展的空间。比如:我们以工业园区为试点,数据分析出每个时段的公交出行人数和换乘情况;分析出主干道上,用不同的出行工具,出行效率的差别;分析出每个时段公交的分担率,让相关部门衡量公共交通是不是还有所提升。

da62d48f36c585a18eee80ebde710d4b71e0fd87

我们当时选择了两条具有代表性的公交线路,一条是快7,是跨区的;另外一条是1001,是社区巴士。我们从数据源开始,建立新的公交优化方案。同时,我们正在把它固化成模型,这样一来,就可以把新型的公交优化方案模型做成一个产品,推广到城市公交的新建和优化过程当中。

b315d254e9a385e82acb05341442f612769f318e

城市大数据的建立,意味着磨刀石已经存在了,问题是可以磨什么样的刀?大家也知道,统计这些数据是为了实现两个目标:理解和预测。大数据的存在为未来的预测,提供了更多的可能。目前,苏州工业园区的湖东地区,已经运用交通事故预测系统在构建一个更加主动的警务模式。预测系统每两小时来提供1%-2%的重点路段,它的预测准确率在早高峰可以达到34%。通过这种方式,使得相关部门可以更加科学的部署警力,能够更加具有针对性的部署防范措施,来更好的压降事故。

cbd430d4b973a02af8ea93f912ad5b24b3b30695

同时,城市的数据也让苏州原有的企业建筑火灾模型得到了优化和迭代,将日常防范的精准度提升8倍。同时,我们将城市大脑平台利用到了安检领域,使得预测、预警、预防能够在更多的领域发挥作用。

d59632cf4a3c2121b289d2459383ae1ff294854c

苏州中心在2017年11月11日已经开通。道路车辆数据,人群活动数据,公交、轨交的数据,通过融合技术,为各个部门,提供了全方位、多角度的数据的教研和比对。因此,面对这么多人流、这么多车辆,苏州的各个部门都非常的从容。现在工业园区也正在固化工作模式,总结在数据驱动的背景下,我们要怎样来应对大型商贸区的开业,以及大型活动包括体育赛事这些新的工作机制。

bb91420e19b91e4de55d29d4eb2bf9d808746860

城市大脑数据更多的连接,也让我们对信号控制系统的优化和提升,有了更多的想象力和提升空间。更多互联网企业的加入,也使整个城市的数据链,形成闭环。让更多的城市人群,更快的去享受城市大脑的成果,同时他们也成为数据的提供者。

我们还在不断的挖掘数据的价值。比如说,构建轨交可疑行为侦测模型来发现可疑人员;构建异常车辆侦测模型,来发现异常车辆。当前计算机技术,特别是计算机视觉技术的发展,使得我们在交通管理的过程中,可以更加快捷的发现交通异常,更加及时的去处置,提高了各项技能的水平和能力。

a69bef6d070afe867f2a8ca816022b2060821bae

包括以图搜图等高新技术的发展,也使得相关部门利用城市的视频,在寻找可疑人员、走失人员、可疑车辆等工作上,有了更多的可能性和更快捷的途径。苏州已经将人脸识别技术运用到民政工作当中。让很多走失的、神志不清的、甚至是不知道自己是谁的人,在人脸识别技术的帮助下,能够知道他的真实身份,让他们回到失散多年的亲属身边,让更多人感受到了人工智能的力量和它带来的温暖。

9d2155a930bd8a9d10f90e804f3a33b6ff19ba2d

当前城市大脑的数据正在驱动着苏州各个部门,包括高科技公司,都在不断创新。很多项目已经落地运行了,还有一些在实施,更多的正在规划之中,正在有序的推进。

在整个项目推进的过程当中,城市大脑使政府的各项工作能够更加主动、精准、有效。在这个过程当中,也是让我们对城市大脑的功能有了更加深刻的理解。

 

三、数据生态

数据越来越成为整个城市大脑的各个参与者之间的一个纽带,也引领着整个城市形成了一种新型的关系。大家可以看到,从开始的时候,是公安局,交通局等五个部门参与,现在项目组吸引了包括民政局、国土局等越来越多的部门参与。

74762937eb4dde2710be9d405b7092e5521eed95

城市的大数据,也不断的吸引更多的高科技企业加入,更多企业也在尽力催化产业动能,正在催生大数据产业一种新型生态的构成。

9c5c0bc6027eec94b7721d81d082c4b3c3e66f3c

基于城市大脑已经成为一种平台,让参与者既是数据的提供者,也是数据的受益者。当各个部门在工作中关注到某一个问题的时候,通过运用全面的、客观的数据,使得我们对于同一问题的认识,在最短的时间内形成共识。可以想象得到,政府的行动可以变得更加协同的进行。

参与建设过程中,更多参与方意识到:数据带来的价值是通过分享来实现的。通过城市大脑,各部门既协同配合提升效果,也让企业更有活力,形成共创共赢的氛围,还让市民享受到了城市大脑的成果,成为城市大脑的主动参与者。这也正是城市大脑所追求的的目标——要建立一个城市治理数据运营体系。

当前,城市大脑已经从交通治理领域不断向外多占。苏州将建立一个对公共安全的更广泛的预测预警预防机制,用于提升城市安全保证能力;在更大范围内建立多部门协同,来提升整个城市的整体性和协同性;在更大范围内利用数据提升服务的针对性和准确性,来保证整个城市的服务水平更上一个台阶。

苏州城市大脑项目才刚刚开始,期待大家能够在更多方面提出宝贵的意见与建议。


本文由云栖社区志愿者小组王晓慧整理,毛鹤审校。编辑:郭雪梅。


相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
Oracle 关系型数据库 MySQL
实时计算 Flink版操作报错之在处理MySQL的DECIMAL类型时出现了报错,是什么原因
在使用实时计算Flink版过程中,可能会遇到各种错误,了解这些错误的原因及解决方法对于高效排错至关重要。针对具体问题,查看Flink的日志是关键,它们通常会提供更详细的错误信息和堆栈跟踪,有助于定位问题。此外,Flink社区文档和官方论坛也是寻求帮助的好去处。以下是一些常见的操作报错及其可能的原因与解决策略。
EMQ
|
JSON Linux 网络性能优化
MQTT 5.0 报文解析 02:PUBLISH 与 PUBACK
本文将介绍在 MQTT 中用于传递应用消息的 PUBLISH 报文以及它的响应报文。不管是客户端向服务端发布消息,还是服务端向订阅端转发消息,都需要使用 PUBLISH 报文。决定消息流向的主题、消息的实际内容和 QoS 等级,都包含在 PUBLISH 报文中。
EMQ
734 53
MQTT 5.0 报文解析 02:PUBLISH 与 PUBACK
|
传感器 机器学习/深度学习 编解码
一文尽览 | 基于点云、多模态的3D目标检测算法综述!(Point/Voxel/Point-Voxel)(下)
目前3D目标检测领域方案主要包括基于单目、双目、激光雷达点云、多模态数据融合等方式,本文主要介绍基于激光雷达雷达点云、多模态数据的相关算法,下面展开讨论下~
一文尽览 | 基于点云、多模态的3D目标检测算法综述!(Point/Voxel/Point-Voxel)(下)
|
10月前
|
存储 缓存 关系型数据库
MySQL 查询优化方法
在数据库应用中,高效的查询性能至关重要。本文探讨了常用的 MySQL 查询优化方法,包括索引优化(选择合适的索引字段、复合索引、定期维护索引)、查询语句优化(避免全表扫描、限制返回行数、避免使用不必要的函数)、表结构优化(选择合适的数据类型、分区表、定期清理无用数据)及数据库配置优化(调整缓存大小、优化存储引擎参数)。通过这些方法,可以显著提高 MySQL 的查询性能,为应用程序提供更好的用户体验。
931 4
|
9月前
|
数据采集 XML 数据挖掘
CDGA|数据治理新视角:清洗数据,让数据质量飞跃提升
在数据治理中,标准化处理和确保数据的可溯源性是两个重要的方面。通过标准化处理,我们可以将复杂的数据转化为易于管理和分析的形式;通过确保数据的可溯源性,我们可以验证数据的准确性和可靠性。这两个方面共同构成了数据治理的基石,为数据分析和挖掘提供了有力的支持。因此,我们应该重视数据治理工作,不断完善和优化数据治理体系,以应对日益复杂的数据挑战。
|
SQL 缓存 DataWorks
DataWorks操作报错合集之当绑定 Hologres 后出现 "Build connection error! The connection attempt failed" ,是什么导致的
DataWorks是阿里云提供的一站式大数据开发与治理平台,支持数据集成、数据开发、数据服务、数据质量管理、数据安全管理等全流程数据处理。在使用DataWorks过程中,可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。
|
数据采集 敏捷开发 BI
数据仓库(5)数仓Kimball与Inmon架构的对比
数据仓库主要有四种架构,Kimball的DW/BI架构、独立数据集市架构、辐射状企业信息工厂Inmon架构、混合Inmon与Kimball架构。不过不管是那种架构,基本上都会使用到维度建模。
465 0
数据仓库(5)数仓Kimball与Inmon架构的对比
|
机器学习/深度学习 数据可视化 算法
【学习打卡04】可解释机器学习笔记之Grad-CAM
【学习打卡04】可解释机器学习笔记之Grad-CAM
|
JSON Kubernetes 数据格式
ServiceAccount、Role和Rolebinding。
ServiceAccount、Role和RoleBinding是Kubernetes(K8s)中的三个核心概念,它们用于管理集群内各种资源的访问权限。下面是这三个概念的详细介绍以及如何使用它们。
384 4
带你读《基于数据资产全生命周期估值与实践报告》——3. 数据资产价值评估的技术实现探索(2)
带你读《基于数据资产全生命周期估值与实践报告》——3. 数据资产价值评估的技术实现探索(2)
165 0