数智洞察丨一文带你了解健康码背后的故事

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 春运将至,归心似箭的同时,保护好自己的健康和安全,才是对家人最大的负责。在这个“绿码走遍天下,红码寸步难行”的时期,每个人听到最多的问候就是:请出示一下健康码!今天,我们就来聊一聊这个码,它从哪儿来,又有什么奥秘。
来源 | 阿里云研究

640.gif

编者按:
春运将至,归心似箭的同时,保护好自己的健康和安全,才是对家人最大的负责。
在这个“绿码走遍天下,红码寸步难行”的时期,每个人听到最多的问候就是:请出示一下健康码!
今天,我们就来聊一聊这个码,它从哪儿来,又有什么奥秘。

image.png

导语

抗击疫情,既是一场医疗战“疫”,也是一场数字化战“疫”。数字中国的防疫地图正以互联网的速度推进,这其中的典型代表就是支付宝健康码。

2月11日杭州上线,一周落地超过百城。随后四川、浙江、海南实现全省覆盖,健康码成为各地数字化防疫标配。

近日,国家发改委联合多部门发布关于做好2021年春运工作和加强春运疫情防控的意见,指出加快推动“健康码”全国一码通行,提高人员通行效率。

健康码从哪儿来,又有什么奥秘?本文带你深入了解。

image.png

从人防到“码上”防疫

疫情防控,关键是人的防控。

健康码推出之前,全国各地的防疫关卡都是靠“人肉”登记,纸路条是一个个孤岛,且只能证明你此时此刻的状态。

健康码以真实数据为基础,市民或者返工返岗人员通过自行网上申报,经后台审核后,即可生成属于个人的二维码。这张码是动态的,随着用户每天的状况提交,所处区域的变化、健康状况等因素,会发生相应的变化。

image.png

红、黄、绿三色的健康码,从2月9日在杭州余杭区率先推出,之后杭州全市推广,浙江11地市全部上线,到2月16日,国务院办公厅电子政务办指导支付宝加速研发全国统一的疫情防控健康信息码,只用了7天时间。

截至2月18日,领取浙江省健康码的人数已经高达1500万。四川、海南、重庆……健康码几乎以一天一个省的速度在落地,在全国24个省200多座城市散开,一张数字化防疫的“天网”以中国速度全面铺开。

依靠数字化的办法,让因为疫情“关”上门的每一个人,不再是一座座信息孤岛,城市运行管理也拥有了可靠有力的数据支撑。

从无到有,健康码的诞生

民警中的产品经理

2月4号,余杭开会明确提出要建议一套数字化方案,并且要做到三个全:“全人群覆盖+全流程掌办+全领域联防”。

2月5号凌晨5点,第一个版本诞生了,之后就开始了每半小时一迭代的优化过程。余杭区的这套经验也很快被杭州市采纳,余杭健康码推行不到24小时后,支付宝端上线了杭州健康码。

2月6日,还在杭州市公安局防疫专班奋战的钟毅接到了市局紧急召集令——研发建设“杭州健康码”,钟毅不负责编程,但是需要统筹产品,相当于“产品经理”。

因为是一个全新的构想,“杭州健康码”没有样本可以参照,从色彩搭配到图形调整、从空间布局到文案设计,每一个细节都需要钟毅和团队反复斟酌和确定。

image.png
图片来源:杭州公安微博

2月11日下午,杭州健康码正式上线,向全杭州市民开放注册。首日申请量突破130万,短短上线4天,群众电话投诉件超过5000起,网络等各个渠道的咨询件更是达到了惊人的10万件。40天内, 29轮次技术调整,14个版本的规则完善,63项功能应用的迭代,数据获取效率较上线初提升9倍,杭州健康码的正确率达到99.99%以上,成为杭州数字防疫、数字治理的一张闪亮名片,也迅速复制推广到全国18个省200多个城市。

被国博收藏的代码

7月14日,阿里云研发的全国健康码引擎第一行代码,被国家博物馆收藏。这是国博历史上首次收藏代码。

image.png

这个小小的码,背后是一个需要复杂协同的浩大工程:涉及的岗位有技术、产品、BD、法务、客服……并肩作战的团队还有钉钉、阿里云。

还有来自全国各地地方政府的来电。2月11日杭州全市推广支付宝健康码后,越来越多省市联系过来,开发时间不断缩短,从常规的4周压缩到4天,到一天,再到以小时计

支付宝和余杭ISV上线余杭版健康码,4天;钉钉和阿里云团队上线杭州市健康码,1天;支付宝上线浙江省、四川省健康码,3天;两省上线时间间隔,16.5小时……

2020年2月13日,阿里云数据智能团队写下了这行代码,军令状立下——48小时内浙江全省上线健康码。

2月14日晚上8点,大家正在紧张测试浙江省健康码,突然同步过来一个信息:大家准备好四川健康码上线,上线时间:明早10点。

2月15日,四川健康码顺利上线,随即接到通知:大家准备一下,上线全国版健康码。

全国复工在即,阿里云技术团队把自己变成了“火神山”。

健康码的奥秘

健康码的运作原理

健康码最主要的是基于手机号码的手机定位,基于身份证号码下的消费记录、乘车及飞机记录,及填报行程信息或者扫描场景位置登记等,结合疫情进行大数据分析后的结果展示。

各种健康码基本都是对接的 “通信大数据行程卡”,它不受地域限制,不收集身份证号、家庭住址。只要对接输入手机号码,就能基于通信网络数据获取过往14天内的出行信息。原理就是基于手机信令数据能够有效定位用户的手机位置,从而寻找到机主本人。

健康码的数据来自于大数据,举个简单的例子,过往7-14天的GPS位置、线下扫码商家位置、购买火车票的信息等等,如果你买了一张正处于疫情严重城市地区的火车票,健康码很可能就会变色。

image.png

手机定位三大原理

说到这,有人可能会问,那如果我把手机关掉并拔出SIM卡,大数据排查时相关工作人员还能找到我吗?

要回答这个问题,应先知道手机定位的工作原理。一般而言,手机主要通过以下三种方式进行定位:

1. 基站定位

移动通信网络由许多按照一定规则布局的基站构成,每个基站不仅具体位置不变,且有固定编号。手机开启后会自动搜索周边基站,并选取信号最优的接入。

与此同时,手机还会随着位置变换自动切换基站。因此,通过各个基站检测接收到的信号参数,如信号到达时间(时间差)、信号达到方位角、到达信号的强度,就能确定手机的位置。

基站数量远少于WIFI,且基站都有公开的位置数据,因此采集工作相对简单。

image.png

2. 卫星定位

卫星在太空不停向地面发射导航电文信号,等于实时标注自身位置。一旦手机接收到多颗卫星信号,就可以通过手机与每颗卫星的距离、角度等进而推算出手机的位置。

卫星定位系统的优点在于精度高,误差一般在15米以内。GPS芯片会接收天空中多颗卫星的同步信号,然后根据信号的相位差,计算出具体的经纬度。保持多颗卫星信号同步,将误差控制在纳秒级以下,是GPS核心技术之一。

image.png

3. Wi-Fi定位

每个Wi-Fi路由器都有全球唯一的MAC地址(包括启动移动热点功能的手机),且会不停发射SSID广播。如果我们的手机开启无线功能,Wi-Fi天线就会时刻侦测周围的无线热点功率和MAC地址,并将其提供给专门的位置服务商。一般情况下,用户周边会有多个WIFI信号源,此时手机会默默地解析出所有WIFI的MAC地址,如果某些WIFI的信息在数据库中已经存在,则可以根据信号强度,推导出未知WIFI的经纬度。如果没有已知WIFI,而手机碰巧开着GPS,则也能完成数据采集。这样,服务商就能获取个人的具体定位。

WIFI方式和基站方式,都需要联网,要不你怎么和服务器联系?但是WIFI模块打开后,即可进行WIFI扫描和信息采集,不必连接到某一AP上,基站也是一样,不必打开蜂窝网络。因为向服务器发起查询请求,既可走蜂窝数据流量,也可走WIFI流量。

image.png

因此,关机、拔卡不影响手机定位。单纯拔掉SIM卡就像是“掩耳盗铃”。因为手机只要开机就会尝试接入基站,而基站一旦识别到手机,即使没有SIM卡,也可以通过手机唯一的识别码IMEI号关联其相关信息。

需要说明的是,个人所处的位置、行踪记录等属于高级别的个人隐私信息,它们平时作为加密数据,无法被普通人盗用。即便是运营商的工作人员,没有国家机关的授权也不能轻易利用这类信息。

健康码的技术原理

1. 数据源

“健康码”的生成包含了个人基础信息,例如人脸识别,同时结合了公安、移动运营商、卫健委、高铁、机场、高速公路道口等信息,由于此次公共卫生事件涉及10多亿人,而且每个人每天都会产生新的生活轨迹,所以在大数据时代,面对各种各样的数据“洪流”,如果希望从中提取出有效信息,就如同在高压水枪下喝一口水一样困难。这样就凸显了大数据技术的重要性。

image.png

2. 状态机

健康码有三种颜色,大部分人的码是绿色的,代表健康,一旦发现有相关人员感染确诊,在指定时间和感染者有接触的相关人员也必须进入自我隔离状态,从码的角度来说会变成黄色。

这种数据的获取和处理不是传统的静态数据的筛查,而是实时的动态数据的比对和监控,使用非大数据技术想完成这个功能,基本是天方夜谭。

首先,从采集的角度来看,此次健康码的数据源不是静态数据源,而是动态数据源。

如果说双十一只是每年一次的平台压力测试,那么健康码则是每天都是平台的压力大考,利用数据接入层的负载均衡接入能力,后台每天都会产生数以亿计的数据量。

其次,从存储角度来看,利用大数据技术的海量存储功能,接近PB级别数据存储和扩容的能力,这也是传统技术无法做到的。

image.png

3. 数据整合

其三,也是重中之重,仅仅把数据存储下来可不能解决健康码要解决的问题,关键是要数据分析和数据整合。

所以利用大数据技术中最重要的ETL和流处理能力,不管是采用Spark架构的内存计算模型还是利用Flink的流处理模式,集合上千台服务器的计算能力,让我们的数据进行实时的比对,实时的处理成为了可能。

结语

数字化战疫是一场无声的战争,也是全民参与的战争,支付宝健康码的诞生,实则是数字中国建设的一个缩影,面对突发事件的应急联动、全民动员,将产生长远的影响。

相信,当全国皆“绿”,便是数字化战“疫”春暖花开之时。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
7月前
|
数据采集 数据挖掘 数据管理
智能决策实力获行业认可,瓴羊入选《2022爱分析 · 智能决策厂商全景报告》
智能决策实力获行业认可,瓴羊入选《2022爱分析 · 智能决策厂商全景报告》
|
边缘计算 达摩院 小程序
2022中国云游戏行业认知与观察》——第四章、解读多家专业机构的研究报告 了解云游戏行业的发展——4.4 Newzoo& 伽马数据发布《元宇宙全球发展报告》
2022中国云游戏行业认知与观察》——第四章、解读多家专业机构的研究报告 了解云游戏行业的发展——4.4 Newzoo& 伽马数据发布《元宇宙全球发展报告》
127 0
2022中国云游戏行业认知与观察》——第四章、解读多家专业机构的研究报告 了解云游戏行业的发展——4.4 Newzoo& 伽马数据发布《元宇宙全球发展报告》
|
编解码 边缘计算 运维
《2022中国云游戏行业认知与观察》——第四章、解读多家专业机构的研究报告 了解云游戏行业的发展——4.1 沙利文& 头豹研报《2022 年中国云游戏服务平台市场报告》
《2022中国云游戏行业认知与观察》——第四章、解读多家专业机构的研究报告 了解云游戏行业的发展——4.1 沙利文& 头豹研报《2022 年中国云游戏服务平台市场报告》
369 0
|
存储 数据采集 开发框架
数智洞察丨聆听数据思维“双声道”:数据战略与数据能力解析
编者按: 大数据应在社会中扮演什么样的角色?有人说数据是一种资源,大数据是新时代的“石油”;也有人认为数据是类似于土地的资产,其更多的价值来自所带来业务的指数级增长。而互联网之父蒂姆·伯纳斯·李提出的观点是“数据是一种公共基础设施”,强调数据作为基础将支撑起一个城市的创新体系。本期内容我们将从数据战略与数据能力入手,深度剖析数据思维首要解决的两大问题。 本文约3532字,建议阅读时间9分钟。
305 0
|
人工智能 自然语言处理 监控
云客服能否让客服行业迎来新价值时代?
云客服能否让客服行业迎来新价值时代?
456 0
云客服能否让客服行业迎来新价值时代?
|
存储 编解码 分布式计算
【云栖号案例 | 医疗健康】华大基因上云 打造精准医疗应用云平台日志方案
基因数据产生的体量越来越大,超出了原有计算能力所能支持的范围。通过使用Maxcompute加速对人群结构的分析速度的进展,计算成本大幅降低至1000美金以内。
【云栖号案例 | 医疗健康】华大基因上云 打造精准医疗应用云平台日志方案
|
机器人 BI 数据管理
引入小能智能云客服的尚德机构,怎样革新教育培训机构沉疴
尚德机构是一家专注于学历教育,职业教育的互联网教育公司。历经16年的发展,尚德机构已在在线成人教育市场树立起了品牌,业务覆盖全国多个城市,培训学员超百万。随着“AI+教育”技术的进步和应用程度的不断加深,教育培训行业的领先机构首先开始积极布局,并积极尝试把AI技术引入至管理与服务中,尚德将智能云客服系统引入至企业管理中就显得尤为关键。
|
存储 弹性计算 运维
【云栖号案例 | 医疗健康】燃石医学上云,为百万患者的生命而努力
燃石医学专注肿瘤患者个体化治疗指导,混合云存储方案解决了数据存储和保存的问题,实现了本地计算和云端计算能力的整合,使患者生存几率大大提高。
|
存储 弹性计算 安全
【云栖号案例 | 教育与科研机构】科研机构上云提供更加精准分析检测服务
作为科研机构想要利用本地物理机实现数据实时备份,将业务都部署到一台服务器上。上云后购买两台ECS分别部署,DTS将云上数据实时传输到本地物理机。
|
算法 5G 物联网
图说报告|智能技术群的“核聚变”推动智能+时代到来
过去十多年来,随着新技术爆发性的发展,以5G、物联网、人工智能等技术为代表的智能技术群落迅速成长,从万物互联到万物智能、从连接到赋能,进而带动了“智能+”时代的到来。
863 0

热门文章

最新文章