来源 | 阿里云研究
编者按:
春运将至,归心似箭的同时,保护好自己的健康和安全,才是对家人最大的负责。
在这个“绿码走遍天下,红码寸步难行”的时期,每个人听到最多的问候就是:请出示一下健康码!
今天,我们就来聊一聊这个码,它从哪儿来,又有什么奥秘。
导语
抗击疫情,既是一场医疗战“疫”,也是一场数字化战“疫”。数字中国的防疫地图正以互联网的速度推进,这其中的典型代表就是支付宝健康码。
2月11日杭州上线,一周落地超过百城。随后四川、浙江、海南实现全省覆盖,健康码成为各地数字化防疫标配。
近日,国家发改委联合多部门发布关于做好2021年春运工作和加强春运疫情防控的意见,指出加快推动“健康码”全国一码通行,提高人员通行效率。
健康码从哪儿来,又有什么奥秘?本文带你深入了解。
从人防到“码上”防疫
疫情防控,关键是人的防控。
健康码推出之前,全国各地的防疫关卡都是靠“人肉”登记,纸路条是一个个孤岛,且只能证明你此时此刻的状态。
健康码以真实数据为基础,市民或者返工返岗人员通过自行网上申报,经后台审核后,即可生成属于个人的二维码。这张码是动态的,随着用户每天的状况提交,所处区域的变化、健康状况等因素,会发生相应的变化。
红、黄、绿三色的健康码,从2月9日在杭州余杭区率先推出,之后杭州全市推广,浙江11地市全部上线,到2月16日,国务院办公厅电子政务办指导支付宝加速研发全国统一的疫情防控健康信息码,只用了7天时间。
截至2月18日,领取浙江省健康码的人数已经高达1500万。四川、海南、重庆……健康码几乎以一天一个省的速度在落地,在全国24个省200多座城市散开,一张数字化防疫的“天网”以中国速度全面铺开。
依靠数字化的办法,让因为疫情“关”上门的每一个人,不再是一座座信息孤岛,城市运行管理也拥有了可靠有力的数据支撑。
从无到有,健康码的诞生
民警中的产品经理
2月4号,余杭开会明确提出要建议一套数字化方案,并且要做到三个全:“全人群覆盖+全流程掌办+全领域联防”。
2月5号凌晨5点,第一个版本诞生了,之后就开始了每半小时一迭代的优化过程。余杭区的这套经验也很快被杭州市采纳,余杭健康码推行不到24小时后,支付宝端上线了杭州健康码。
2月6日,还在杭州市公安局防疫专班奋战的钟毅接到了市局紧急召集令——研发建设“杭州健康码”,钟毅不负责编程,但是需要统筹产品,相当于“产品经理”。
因为是一个全新的构想,“杭州健康码”没有样本可以参照,从色彩搭配到图形调整、从空间布局到文案设计,每一个细节都需要钟毅和团队反复斟酌和确定。
图片来源:杭州公安微博
2月11日下午,杭州健康码正式上线,向全杭州市民开放注册。首日申请量突破130万,短短上线4天,群众电话投诉件超过5000起,网络等各个渠道的咨询件更是达到了惊人的10万件。40天内, 29轮次技术调整,14个版本的规则完善,63项功能应用的迭代,数据获取效率较上线初提升9倍,杭州健康码的正确率达到99.99%以上,成为杭州数字防疫、数字治理的一张闪亮名片,也迅速复制推广到全国18个省200多个城市。
被国博收藏的代码
7月14日,阿里云研发的全国健康码引擎第一行代码,被国家博物馆收藏。这是国博历史上首次收藏代码。
这个小小的码,背后是一个需要复杂协同的浩大工程:涉及的岗位有技术、产品、BD、法务、客服……并肩作战的团队还有钉钉、阿里云。
还有来自全国各地地方政府的来电。2月11日杭州全市推广支付宝健康码后,越来越多省市联系过来,开发时间不断缩短,从常规的4周压缩到4天,到一天,再到以小时计。
支付宝和余杭ISV上线余杭版健康码,4天;钉钉和阿里云团队上线杭州市健康码,1天;支付宝上线浙江省、四川省健康码,3天;两省上线时间间隔,16.5小时……
2020年2月13日,阿里云数据智能团队写下了这行代码,军令状立下——48小时内浙江全省上线健康码。
2月14日晚上8点,大家正在紧张测试浙江省健康码,突然同步过来一个信息:大家准备好四川健康码上线,上线时间:明早10点。
2月15日,四川健康码顺利上线,随即接到通知:大家准备一下,上线全国版健康码。
全国复工在即,阿里云技术团队把自己变成了“火神山”。
健康码的奥秘
健康码的运作原理
健康码最主要的是基于手机号码的手机定位,基于身份证号码下的消费记录、乘车及飞机记录,及填报行程信息或者扫描场景位置登记等,结合疫情进行大数据分析后的结果展示。
各种健康码基本都是对接的 “通信大数据行程卡”,它不受地域限制,不收集身份证号、家庭住址。只要对接输入手机号码,就能基于通信网络数据获取过往14天内的出行信息。原理就是基于手机信令数据能够有效定位用户的手机位置,从而寻找到机主本人。
健康码的数据来自于大数据,举个简单的例子,过往7-14天的GPS位置、线下扫码商家位置、购买火车票的信息等等,如果你买了一张正处于疫情严重城市地区的火车票,健康码很可能就会变色。
手机定位三大原理
说到这,有人可能会问,那如果我把手机关掉并拔出SIM卡,大数据排查时相关工作人员还能找到我吗?
要回答这个问题,应先知道手机定位的工作原理。一般而言,手机主要通过以下三种方式进行定位:
1. 基站定位
移动通信网络由许多按照一定规则布局的基站构成,每个基站不仅具体位置不变,且有固定编号。手机开启后会自动搜索周边基站,并选取信号最优的接入。
与此同时,手机还会随着位置变换自动切换基站。因此,通过各个基站检测接收到的信号参数,如信号到达时间(时间差)、信号达到方位角、到达信号的强度,就能确定手机的位置。
基站数量远少于WIFI,且基站都有公开的位置数据,因此采集工作相对简单。
2. 卫星定位
卫星在太空不停向地面发射导航电文信号,等于实时标注自身位置。一旦手机接收到多颗卫星信号,就可以通过手机与每颗卫星的距离、角度等进而推算出手机的位置。
卫星定位系统的优点在于精度高,误差一般在15米以内。GPS芯片会接收天空中多颗卫星的同步信号,然后根据信号的相位差,计算出具体的经纬度。保持多颗卫星信号同步,将误差控制在纳秒级以下,是GPS核心技术之一。
3. Wi-Fi定位
每个Wi-Fi路由器都有全球唯一的MAC地址(包括启动移动热点功能的手机),且会不停发射SSID广播。如果我们的手机开启无线功能,Wi-Fi天线就会时刻侦测周围的无线热点功率和MAC地址,并将其提供给专门的位置服务商。一般情况下,用户周边会有多个WIFI信号源,此时手机会默默地解析出所有WIFI的MAC地址,如果某些WIFI的信息在数据库中已经存在,则可以根据信号强度,推导出未知WIFI的经纬度。如果没有已知WIFI,而手机碰巧开着GPS,则也能完成数据采集。这样,服务商就能获取个人的具体定位。
WIFI方式和基站方式,都需要联网,要不你怎么和服务器联系?但是WIFI模块打开后,即可进行WIFI扫描和信息采集,不必连接到某一AP上,基站也是一样,不必打开蜂窝网络。因为向服务器发起查询请求,既可走蜂窝数据流量,也可走WIFI流量。
因此,关机、拔卡不影响手机定位。单纯拔掉SIM卡就像是“掩耳盗铃”。因为手机只要开机就会尝试接入基站,而基站一旦识别到手机,即使没有SIM卡,也可以通过手机唯一的识别码IMEI号关联其相关信息。
需要说明的是,个人所处的位置、行踪记录等属于高级别的个人隐私信息,它们平时作为加密数据,无法被普通人盗用。即便是运营商的工作人员,没有国家机关的授权也不能轻易利用这类信息。
健康码的技术原理
1. 数据源
“健康码”的生成包含了个人基础信息,例如人脸识别,同时结合了公安、移动运营商、卫健委、高铁、机场、高速公路道口等信息,由于此次公共卫生事件涉及10多亿人,而且每个人每天都会产生新的生活轨迹,所以在大数据时代,面对各种各样的数据“洪流”,如果希望从中提取出有效信息,就如同在高压水枪下喝一口水一样困难。这样就凸显了大数据技术的重要性。
2. 状态机
健康码有三种颜色,大部分人的码是绿色的,代表健康,一旦发现有相关人员感染确诊,在指定时间和感染者有接触的相关人员也必须进入自我隔离状态,从码的角度来说会变成黄色。
这种数据的获取和处理不是传统的静态数据的筛查,而是实时的动态数据的比对和监控,使用非大数据技术想完成这个功能,基本是天方夜谭。
首先,从采集的角度来看,此次健康码的数据源不是静态数据源,而是动态数据源。
如果说双十一只是每年一次的平台压力测试,那么健康码则是每天都是平台的压力大考,利用数据接入层的负载均衡接入能力,后台每天都会产生数以亿计的数据量。
其次,从存储角度来看,利用大数据技术的海量存储功能,接近PB级别数据存储和扩容的能力,这也是传统技术无法做到的。
3. 数据整合
其三,也是重中之重,仅仅把数据存储下来可不能解决健康码要解决的问题,关键是要数据分析和数据整合。
所以利用大数据技术中最重要的ETL和流处理能力,不管是采用Spark架构的内存计算模型还是利用Flink的流处理模式,集合上千台服务器的计算能力,让我们的数据进行实时的比对,实时的处理成为了可能。
结语
数字化战疫是一场无声的战争,也是全民参与的战争,支付宝健康码的诞生,实则是数字中国建设的一个缩影,面对突发事件的应急联动、全民动员,将产生长远的影响。
相信,当全国皆“绿”,便是数字化战“疫”春暖花开之时。