阿里巴巴集团CRO刘振飞:双11的六维技术准备

简介: 2016年4月15日,阿里巴巴技术论坛在清华大学新清华学堂启幕。阿里巴巴集团CRO刘振飞围绕“双11”的技术演进以及互联网安全两大主题进行了演讲。
2016年4月15日,阿里巴巴技术论坛在清华大学新清华学堂启幕。阿里巴巴集团CRO刘振飞围绕“双11”的技术演进以及互联网安全两大主题进行了演讲。


阿里技术的演进:从业务驱动到拓展商业边界

2009年,阿里巴巴在技术层面做出两个极其重大的决定。

1. 成立阿里云计算公司,时间定格于2009年9月10日。

2. 2009年10月,阿里巴巴启动“去IOE”。耗时三年,在淘系中完全“清除”IOE(IBM小型机、Oracle数据库和EMC存储);而支付宝因为涉及金融,所以比较谨慎,计划在2016年年底,完成清理工作。

现在看来,这两个决定都是“伟光正”的,但是在7年前,做出这样的决定,绝非易事。

在过去的数年,阿里巴巴的技术发展一直被业务所驱动,但现在,这一情况发生了改变,技术开始赋能商业,并不断拓展阿里商业版图的边界。

那么,阿里是如何面对越来越严苛的“双11”的挑战呢? 

每年差不多在7月份的时候,阿里的一万多名技术人员就开始进入状态,并从六个维度准备“双11”。

第一个是资源交付,包括机房,服务器,网络等等的到位。这些资源的交付时间非常有讲究,晚了或者是早了都不行,太早意味着资源浪费,太晚则可能引发差错。在这一环节还有很多不可预知的因素,都会尽量做预案,以确保万无一失。

第二个是架构优化。随着业务体量的飞速增长,相关的技术架构也日趋复杂。如何让架构更为适合业务的发展,优化工作是必不可少的。

第三个是业务研发。无论是在移动端还是PC端,各业务BU的技术团队会根据业务需求开发出各种稀奇古怪的诱发和游戏,而这些玩法很容易在最后一刻发生修订或更改。也就是说,业务需求的频繁变化意味着不可控性增加,这对技术能力也提出了极高的要求。

第四个是压测演练。鉴于“双11”的不确定性因素太多,因此,技术团队必须模拟真实场景来进行压测和演练,不断提升经验并做相应的改进或准备。

第五个是组织保障。每年“双11”是阿里巴巴几十个BU参与的大活动,涉及上万人的协同,组织保障就是为了让各BU,各个团队,尽可能地保持一致性和高度协同。

第六个是现场应急。“双11”这一天24小时随时都可能发生“意外”,当出现问题时,如何第一时间最优地解决之,这是现场应急必须具备的能力。

通过“双11”这种世界级的“大考”,阿里技术团队不断创新,自主研发出海量金融级关系型数据库OceanBase,并首创异地多活技术,成为全球第一家实现全站HTTPS的电商网站以及打造出全球最大的混合云架构。

阿里安全的“秘诀”

在互联网极度发达的今天,传统的安全措施已经几乎失效。传统的安全,基本是以“修城墙”的方式防御各种攻击和入侵,也就是设置大家耳熟能详的防火墙。

而互联网就像一个四通八达的城市,没有边界,不可控,而且拥有海量的用户因此,传统的方式已经无法提供更好的安全保障。

据统计,去年阿里巴巴安全部扫描出1.2亿次恶意病毒木马,95%的热门APP都被破解过。移动设备、人和内容都变得不可控,互联网安全状况堪忧。

阿里安全构建了一整套的风控平台,从基础设施、网络到具体的业务完全覆盖,这也是基于阿里大数据能力而成。

在整个生态中,阿里将自己的安全能力进行打包,并以公共服务的形式提供给商家、消费者和合作伙伴。   

阿里安全推行九字方针,即“轻管控、重检测、快响应”。轻管控不等于不管,而是减轻各种限制,让大家更方便;重检测是充分利用阿里在大数据方面的技术能力,快速地辨别和定位各种危害;快响应则是第一时间建立防御,并进行清理或精确打击。

阿里安全在三个层面进行安全防护。在系统层面,防止网络攻击、病毒木马等;在数据应用服务层面,防止各种黄牛刷单等行为;在用户、内容到社会层面,可以清理垃圾账号,保护内容安全。

与此同时,阿里还推动国家相关法律法规的改进,并成立了互联网安全志愿者联盟。该联盟从2007年成立至今,已经提供15亿次的安全服务,也得到了民政部的正式注册,成为国家认可的机构。

欢迎扫码关注,更多技术分享。

ea14ec7fb062eab8a29333c7a100d227a258a14a

目录
相关文章
|
3月前
|
人工智能 分布式计算 大数据
ODPS重磅升级!全面支撑AI应用爆发
阿里云全面升级自研大数据平台ODPS架构,旗下MaxCompute、Hologres和DataWorks等核心产品全面融合AI技术,提升数据处理能力与多模态计算支持,推动企业智能化转型。
170 0
ODPS重磅升级!全面支撑AI应用爆发
|
9月前
|
大数据 Java 数据处理
《大数据时代“快刀”:Flink实时数据处理框架优势全解析》
Flink是一款开源分布式流处理框架,在数字化浪潮中崭露头角。它具备真正实时的毫秒级响应、卓越的高吞吐与低延迟性能、强大的容错机制确保数据一致性、灵活的窗口操作适配多样业务场景、丰富的API易于开发,以及批流一体的数据处理能力。Flink在金融交易、电商、物联网等领域广泛应用,助力企业实时处理海量数据,抢占先机,创造更大价值。
477 15
IDEA中properties文件中文乱码解决方案
IDEA中properties文件中文乱码解决方案
471 2
|
9月前
|
人工智能 Java 云计算
Salesforce X 阿里云:加速中国市场合作!
Salesforce X 阿里云:加速中国市场合作!
435 13
基于ACO蚁群优化的UAV最优巡检路线规划算法matlab仿真
该程序基于蚁群优化算法(ACO)为无人机(UAV)规划最优巡检路线,将无人机视作“蚂蚁”,巡检点作为“食物源”,目标是最小化总距离、能耗或时间。使用MATLAB 2022a版本实现,通过迭代更新信息素浓度来优化路径。算法包括初始化信息素矩阵、蚂蚁移动与信息素更新,并在满足终止条件前不断迭代,最终输出最短路径及其长度。
|
SQL 存储 小程序
【教程】navicat配合HTTP通道远程连接SQLite数据库
本文介绍了如何通过 Navicat Premium 工具配合 n_tunnel_sqlite.php 和 HTTP 通道远程连接服务器上的 SQLite 数据库。SQLite 是一种自给自足的、无服务器的 SQL 数据库引擎,由于其端口未对外开放,直接使用 Navicat 进行远程连接不可行。文章详细记录了使用 HTTP 通道实现远程连接的过程,包括定位本地 `ntunnel_sqlite.php` 文件,将其上传至服务器,并通过 Navicat 配置 HTTP 通道连接 SQLite 数据库的具体步骤。
837 0
【教程】navicat配合HTTP通道远程连接SQLite数据库
Mac每次都要执行source ~/.bash_profile配置的环境变量才生效
Mac每次都要执行source ~/.bash_profile配置的环境变量才生效
504 2
|
存储 机器学习/深度学习 人工智能
云端数字资产管理:构建高效数据生态
随着数字化进程的加速,云上数字资产管理已成为企业成功的关键因素之一。通过采用适当的云存储方案、实施严格的安全措施、建立高效的搜索和检索系统,企业可以充分利用数字资产的价值,推动业务发展。未来,随着人工智能、机器学习等技术的应用,云上数字资产管理将进一步提高效率和智能化水平,为企业创造更多价值。
|
Linux 调度 KVM
KVM详解(一)——KVM基础知识
KVM详解(一)——KVM基础知识
908 0
|
机器学习/深度学习 达摩院 供应链
阿里CTO线/CRO线/达摩院/法务合规等专家,分享隐私保护计算应用实践
随着企业数据资产的不断累积,各数据资产拥有者迫切需要实现“数据可用不可见”,在严格保障数据隐私安全的前提下,最大化地把数据价值释放到业务中去。 在近年来对隐私保护计算技术的探索过程中,阿里巴巴内部也在积极促进业务数据安全流通,并沉淀下了丰富的实践案例。12月16日,《阿里巴巴隐私计算应用纷享会》(内部分享)在阿里巴巴总部西溪园区成功举办,超1000位集团员工在线收看了本次活动直播。
阿里CTO线/CRO线/达摩院/法务合规等专家,分享隐私保护计算应用实践
下一篇
开通oss服务