9月12日虚拟化平台新产品的媒体沟通会上,不少记者对鸡蛋演示的demo很感兴趣也有一些疑惑。看看来自小白不菜的精彩分享吧。
鸡蛋究竟宜不宜生吃——看阿里云计算怎么破?
姐告诉你,算!鸡蛋里有一种物质,生吃会导致人早生华发,往小了说影响泡妞撩妹,甚至终身大事,往大了说,那可能会导致你光头谢顶,疾病缠身!
因为生鸡蛋清中含有一种抗生物素,叫“亲和素”,是一种蛋白质,会防碍人体对鸡蛋黄等食物中所含的“生物素”的吸收。这个生物素非常重要,在脂肪合成、糖质新生等生化反应途径中扮演重要角色。如果你缺少生物素,就会导致毛发脱落、体重减轻、皮炎等疾病。
(所以鸡蛋一定不能生吃——要熟了后,才可以杀死鸡蛋内外的细菌,又能破坏亲和素,且禽流感病毒NH的灭活温度是100度沸水,必须煮沸!!!)
其实最早是一位德国科学家曾做过这类研究,采用了一种分子动力学模拟的方法来确定,看两种有机分子之间有多大的结合力,教授们试图用一种极其复杂的数学模型来验证非关联性因素——用阿里云高性能计算资深专家何万青的话说,由于分子动力学计算都是典型的高性能并行计算,还需要不断调整里面的各种参数,运算量非常大,这事必须用超级计算机才能算出来!
如果是过去,教授要么自己构建一个超级计算机,但涉及购买、安装、运维和软件授权;要么租用超级计算机,那也要排队、租赁、发送请求、等待结果,还要考虑不同超算中心的不同软硬件环境……总之是很繁琐的事情。
事实是,非常巧合,阿里云的何万青博士认识一位生物学教授,对亲和素和生物素的结合很有研究,何万青就用阿里云最新的E-HPC机群试用了一把。
用分子动力学模拟不同分子间的结合情况(你看懂了么,没关系,反正我也没看懂。)
“结果是,教授在星巴克喝着咖啡就把这事儿干了。”何万青透露,只需要笔记本,在下拉式菜单中选择自己要的配置,阿里云就可以生成一个云上的超算集群。
一般情况下,教授会用手边的工作站做这个计算,但现在已经可以轻松登入阿里云用8个节点的并行集群环境,且还用阿里云上连通的可视化软件来做实时渲染。教授的数学模型跑一个参数的实验,就用了不到十秒钟——把整个实验的所有因素都排查一遍,一整天也差不多够了。
当然,本着科学严谨的精神,杨姐必须指出的是,生鸡蛋中的亲和素会和体内的生物素强力结合形成晶体,从而造成生物素大量损失导致黑发变白的事,需要你每天大量吃生鸡蛋,比如每天吃一打儿坚持几个月,才会发生。偶尔尝尝鲜,只要注意卫生,还是可以的。
其实教授的这个事情只是中国人工智能领域遭遇困境的例子之一。现在有很多创业公司想做的事都需要高性能计算的支持:例如汽车碰撞模拟实验,再例如人脸识别……
人工智能最大障碍:计算力
在人工智能(AI)大红大紫的今天,一般人都能列出人工智能的三要素:算法、计算力和大数据。
其实人工智能是一个六七十年前就提出的概念,经历过数十年中无数科研人员的推进,目前已经发展出了深度学习、神经网络等等具体的应用门类。它们中的任何一个概念,提出也至少有超过30年的历史,许多算法已经在实践中趋于成熟。
而自从互联网诞生到现在的区区数十年中,人类已经积累了数十ZB的数据。杨姐在这里帮着换算一下,1ZB等于1万亿GB,而我们现在主流的笔记本电脑的存储,大概是512GB的SSD。
也就是说,人工智能的发展几十年来受制约的重要因素,就是计算力跟不上(其中包括存储能力),这在个人电脑时代这几乎是不可能完成的任务,只有云才能解决,而且,不是普通的云!
阿里云异构计算负责人张献涛对此体会至深,这也是阿里云为什么在此刻推出全新的异构计算平台的原因。
科普一下,什么是异构平台。所谓异构平台,就是基于不同的运算单元搭建的计算平台:最早的运算单元,也就是我们熟悉的CPU。CPU发展到今天,性能已经到了某种上限,已经不能单靠增加核心数来增加计算能力了。
就好比家里的汽车,如果单靠增加汽油发动机的排量来增加马力,那么污染问题就无法承受,所以,现在流行混合动力,许多车上装了一部汽油机、一部电动机,高速时靠汽油机,低速时靠电动机,特殊情况时双机一起发力。
所以,人类开始有了GPU,也就是图形运算单元。它最开始研发的目的,是为了让电脑有更好的图形效果,与CPU不同,它的架构是单核计算能力弱,但核心数多,适合高并发运算的工作,很多时候,它和CPU协同运算的效率更高。
但这还不够,因为人工智能需要同时开很多“车”!所以,必须引入新的一种能力“FPGA”!
如果说CPU、GPU是一块出厂时就刻好了字的金属板,阿里云新部署的FPGA就好比一块黑板,可以无限次的擦写、重写,每次擦写后都可以写入一套新的逻辑,相当于产生了一块新的芯片,这是依靠它内部的内部静态存储单元加载编程数据来实现的。
以前,人们用FPGA解决设计实验环节中的问题,现在,发现它特别适合特定场景,如深度学习、物联网、基因分析等某个特定硬件环节的加速。
所以,阿里云最近干了一件事,搞了一个最新一代的异构平台,其最大特点,就是囊括了目前所有主流计算平台上的所有运算单元,包括AMD、英伟达提供的GPU,以及英特尔和赛灵思的FPGA……
恕姐不在这里罗列复杂的芯片编号。姐猜,阿里云这样的做法,是希望能够覆盖异构计算的所有主要场景需求,说的再直接一些,就是想包打天下。
可市场有这样的需求么?
人工智能当然是一个需求,苹果的SIRI就是一个简单而明确的人工智能需求案例,在语音问答的背后,藏着语音识别、语义理解、深度学习等诸多方面的人工智能,它就是靠云端提供的计算能力来完成的。
而非常多的创新就是在某个微观领域进行人工智能的突破,比如一块可以监测你血糖的口香糖,又或者一个可以分析你家里雾霾状况的传感器。
全面布局AI
如果你认同未来将是人工智能向各个领域渗透的“未来”,那么阿里云今天的部署就没有错:FPGA更适合非标数据位宽的深度学习、金融分析、基因匹配、物联网数据库等领域。
其实,阿里云推出了基于英特尔FPGA的F1实例,英特尔呢,不是在今年以167亿美元收购了FPGA双雄之一Altera吗,当时英特尔瞄准的是物联网;但随着目标应用场景的不断丰富,阿里云也扩展到了基于赛灵思的F2。
其中,GA1适用于图形图像渲染,在这方面能降低50%成本;GN5呢则被阿里云誉为“为计算而生”,计算能力是上一代的近100倍;还有就是GN5i可以匹配在线推理场景,可以让人工智能的在线服务成本降低50%。
如果按以往的模式看,比如杨姐要搞一个企业,需要建立一个处理能力非常大的超级计算机群,那我就得按我需要的最大能力来购买,比如我的最大需求是5000个核,那我就要付出一笔天文数字的硬件费用,和更是天文数字的软件及维护费用。
但在很多情况下,我是用不到5000个核,在旺季与淡季,在不同的需求变化的周期里,我会浪费大量的计算能力——有一篇报道曾经写到,许多地方花巨资建立的超算中心,很多时候都在闲置,这就是一个最大需求和一般需求的矛盾。
但是,有很多时候,企业又会遇到计算能力超过自有计算集群上限的时候,比如说,在暴风雨到来的时候,需要做大量微型云图的计算;在地震后,需要完成深层地质构造的大量断面分析;在发生战争的时候,模拟武器实验效果的需求会激增……那按传统的办法是,继续购买硬件,直到满足需求。
其实,租用超算更加划算。
所以,这也就是为什么何万青认为,E-HPC的最大价值并不在于顶峰的计算能力有多大,而是胜在灵活性,企业可以按照包月包年或者按需计费的方式,来快速获得高性能计算集群能力,高性能计算调度能力和软件能力,按需组建自己的“云上超算中心”——和太湖之光这样的顶级超级计算机相比,如果前者是珠穆朗玛峰,E-HPC就是青藏高原,大概海拔4000多米。就像中国教授做的那个鸡蛋能不能生吃的推理模型,就属于这个系列,还可以按小时租。
当然,这种“租合适还是买合适”的问题,因需求而异。而对于那些更多有云计算需求,但没有算法和研发能力的公司,阿里云更愿意直接“分享技术”,提供全方位的人工智能产业服务,包括智能语音交互、图像/视频识别、交通预测、情感分析等技术服务,这些技术正通过阿里云ET对外服务。
过去一年里阿里云推出ET城市大脑、ET工业大脑、ET医疗大脑、ET环境大脑等行业垂直的人工智能系统,在城市治理、医学诊断和工业生产方面,诸多大型企业逐步将核心业务转至云上。
而这一点,也是未来竞争最为激烈的。
硬件服务虽然看起来很赚钱,但随着硬件产能的提升,利润总是在不断的摊薄,而软件和服务的价格,才有更大的弹性空间。
而写到这里,大家也都看到了,在谷歌、微软都深耕自研芯片的大浪潮下,不排除阿里将在芯片方面有大动作……
来自小白不菜的精彩分享。