开发者社区> 阿里技术> 正文

卧底阿里11年

简介: 这是阿仁在阿里卧底的第11个年头了 多少次 阿仁试图从内部瓦解阿里巴巴 但都因为各种原因失败了:

这是阿仁在阿里卧底的第11个年头了
多少次
阿仁试图从内部瓦解阿里巴巴
但都因为各种原因失败了:

串通洋人的eBay,
被淘宝的免费模式打败了;
想制造付款信任危机,
却被一个支付宝解决了;
想用高价服务器拖垮阿里,
没想到被王坚整出一个阿里云。

阿仁很苦恼
当年的一头青丝如墨染
如今已是人间仙境地中海
再这么卧底下去
不止账上的美元兑不了现
怕是手上股票的价值都要超过王健林了

image

但阿仁时时刻刻都记着自己是一名卧底
这一次,
他从内部打探到一个非常爆炸的消息!
阿里巴巴要做一件非常冒险的事
这件事一旦砸了,
可能这几年都抬不起头来

机会来了!
阿仁兴奋地在天台上点了楼下的盒马外卖
正看着手机
钉钉突然弹窗了
内线发来两个字:上云

image

这一定就是那件冒险的事了
阿仁的脸逐渐舒展开来
原先紧致的表皮
还残留着没抹开的大宝SOD蜜

回想起卧底的时光
阿仁第一次听说云还是在2009年
王坚说服了马云要做云计算
当时社会上的IT精英分为两派
一派支持阿里的去IOE搞云计算,
认为中国需要自主研发核心操作系统,
也就是后来的“飞天”
另一派则质疑云计算没有前景
好好的系统放着不用
为什么要自己整一个新的

当时阿仁就觉得这事要黄
为什么?
在云计算的自研路上,
这群人太“孤独”了。
在国内,没有任何前人的经验,
完全是从0做起
没有人知道飞天长什么样子
没人敢说MySQL就能完全取代Oracle
光是一个淘宝,上面就跑了上万个应用
每个应用的底层环境都不一一相同
要把这么多的东西都装到云计算的框子里
工作量是难以想象的

比这更难的是
革自己的命
当时,阿里巴巴有80多个国内顶级的Oracle 工程师
突然有一天,上头下了死命令:
淘宝要放弃 Oracle,
转投自研的数据库架构
“你再说一句试试?
兄弟们的前途在哪里?”
阿仁还记得当年自己卧底成数据库工程师的台词。
但阿里还是干了

image

不过,之后3年。
阿里云和飞天依然没什么起色
有段时间阿仁甚至以为自己成功了
当时的飞天还在襁褓里
第一个陪练的是阿里金融云“牧羊犬”
飞天一边开发,一边为牧羊犬服务
不负众望,BUG百出
数据传输、计算稳定性、处理速度等等
都不达标
工程师必须24小时盯着系统
有位奶爸工程师为了值夜班盯系统
把自己小孩的哭声设成了闹铃

最困难的时候
阿里云和金融云都要干不下去了
阿仁还偷偷策划了一起“事件”
让当时阿里金融创始人
带着核心骨干
跑到王坚办公室门口“讨个说法”
无奈之下
王坚派出了所有的技术工程师
驻扎在阿里金融的现场加班开发
然吐槽的声音依然不断:

人家的是云计算,
我们家的是“人肉云计算”;
人家的是“分布式计算”,
我们家的是“分步试计算”。

image

让阿仁没想到的是,父爱打败了BUG
2009 年春节过后
阿里云发布了一次大版本升级。
升级完成的一瞬间
空气突然安静了
飞天系统稳定得不像阿里云的作品……
“秒级放贷”、“小额多次放贷”什么的,
统统实现了

不过此时内部依然有很多人质疑阿里云
阿仁趁机密谋,
散发“阿里云要被撤掉”的谣言
并让业务部门负责人参加高管会议的时候带上技术负责人
只等高管一声令下,就争抢技术人才
但马云的一句话,堵上了所有人的嘴:
“我每年给阿里云投 10 个亿,投个十年,做不出来再说”
阿仁又失败了

转折发生在2013年
当时,阿里巴巴面临着一个世界级的难题
以开源软件为基础的“云梯1”
实现了4000台集群调度
而纯自研“云梯2”
还在1500台集群数量徘徊
但这都无法满足业务的运行
需要达到 5000 台服务器的调度才行,
简称5K。
这几年,阿里云一直在死磕5K
虽然进展缓慢,但慢慢开始有化学反应了
不仅质疑消失了
那些技术大神
这个时候一齐杀了进来
正明、褚霸、多隆、长仁……
最终,5K进入了最后的稳定性测试

image

测试当天,阿仁正好在机房值班
振飞提出了一个真•钢铁直男的测试办法:拔电源
“如果这种突然暴力断电都能撑得住,阿里云还有什么不稳定的呢?”
阿仁反复问了三遍
拉吗?拉吗?拉吗?
最后才颤抖着双手拉下了电源

四个小时以后,机器陆续重启完毕
系统自检一切正常
数据毫发无损
阿仁的后背已经被冷汗打湿
他开始怀疑自己卧底的意义
不知不觉
阿仁经历了一场
充斥着荷尔蒙的理想主义者的长征

一个钉钉消息再次将阿仁拉回了现实
内线撤回了“上云”两字
缓缓打出:“双11核心系统100%上云”

阿仁用大脑快速搜索了一遍
又用google搜索了一遍
这样级别的技术工程
全球范围内绝无仅有

image

核心系统100%上云
就是把自己的身价性命都放在云上
这事连亚马逊、微软、谷歌都不敢做
果然是有够冒险

2019年11月11日零点
阿里巴巴总部作战指挥室里
所有人紧张地盯着大屏幕
路过的扫地阿姨对此习以为常
她以为这和往年一样
又是轻轻松松喝茶
度过开心和愉快的一段时光
但阿仁知道
平静的背后是暗流涌动
淘宝天猫的系统应用极其复杂
光是购物车一个场景
就关联了十多个后台和系统
绝对是牵一发而动全身
把这些系统全部搬到云上
还要保证业务不中断
相当于万米高空上,
给时速900公里的飞机更换引擎
难度不言而喻

时间一分一秒在度过
大屏幕上一直显示着“无紧急任务”
00点45分
有人喊出了一声
“扛住了!”
接下来阿仁感受到了人生中
最响亮、持续时间最长的一次鼓掌
“他们竟然做到了”
阿仁泪流满面

image

接下来的一些数字
阿仁看到已经麻木了:

双11全天交易额2684亿
订单创建峰值54.4万笔/秒
实时计算处理峰值25.5亿次/秒

他只知道
没有人能够阻挡这群技术人前进的脚步
而自己的卧底之路还将继续

(完)

原文发布时间为:2019-11-14
文章转载自 后园

版权声明:如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件至:developerteam@list.alibaba-inc.com 进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:
阿里技术
使用钉钉扫一扫加入圈子
+ 订阅

关于阿里的技术创新均呈现于此.

官方博客
官网链接