3月27日至29日,阿里云2017年第一场云栖大会在深圳拉开帷幕。29日上午的主题演讲由阿里巴巴副总裁、阿里云总裁胡晓明带来。在题为《通往智能之路》的演讲中,他与现场数百名开发者、媒体和合作伙伴分享了阿里云、阿里巴巴集团一年来的变化。
胡晓明在演讲中提到一件值得关注的事:腾讯本月以一分钱的报价成为厦门市政务云外网云服务提供商。他认为这是对行业的破坏。
他说:“我要对马化腾说:随着云计算已经越来越多地成为大企业选择的时候,我们要想如何为用户提供更有价值的技术和服务。在所有人都希望用企业的发展成就一个行业的时候,马化腾和他的团队用1分钱的投标对行业进行了破坏。”
下午记者专访时,胡晓明再次被问到此事。他说,作为友商,首先要祝贺腾讯拿到厦门的订单,他们确实是在背后付出了很多的努力,不仅仅是价格,也投入了很多力量。
有记者提出,阿里云此前“一分钱不花”拿下12306网站项目。他解释道,12306 当时情况特殊,“这不是一个单纯的商业项目,而更是一个社会问题”,当时,腾讯和百度也都参与竞标,但只有阿里留了下来。
他认为,今天所提到的政务云的问题,情况已经发生改变。这个问题背后,是技术能力的体现,而能力是要和价格对等起来的。“比拼的是能力、安全和数据保护”,“一分钱价格去服务,很难保证连续性和稳定性”。
阿里云飞天研发负责人李津补充说,12306 那一刻是必须要解决的问题,而不是一个商业问题。而今天政务云,只是一个生意,而不是急需解决的问题。“请不要把二者等同起来,这样我们很受伤”,他说。
谈到阿里云的产品也在进行降价。胡晓明解释说,需要从两个方面来看待价格问题:1)降价是不是真的是技术带来的红利;2)厂商有没有最基本的行业操守。
胡晓明说:“如果腾讯能够以一分钱的价格持续提供服务,我对他们是真尊敬。这个一分钱对我们没有任何影响。我只是心疼这个行业,中国的云计算行业经过7、8年的打造不容易。PC 操作系统中国没成什么,让微软一家独大。云计算的操作系统好不容易有几家做起来,必须去珍惜这个环境。希望10年、20年后,中国能有一到两家企业具备参与全球竞争的能力。”
不管是国内还是国外,云服务的竞争正呈白热化。根据胡晓明的介绍,阿里云平台上,来自海外的业务呈现出比中国本土业务更快的增长速度。
胡晓明本次云栖大会的演讲主题是“智能”,非常贴切地体现了云服务近年来的发展趋势——智能化。
在接受新智元的专访时,胡晓明说,经过7年多的发展,在整个市场上,对云计算的理解,对大数据和安全的理解,让我们获得了大量用户的信任,所以目前在阿里云拥有的客户是200多万,同时,我们也在加快全球化云计算的布局,作为全球第三大的云计算厂商,我们不仅在中国,在全球也获得了发展。阿里巴巴把云计算整体技术打通,整体的技术能够以产品化的方法服务中小企业,帮助创新型企业和政府发展。包括最强启动NASA计划,都是希望加大对技术的投入,赋能整个产业。除了云计算大数据,更看重人工智能、机器智能对产业的深度影响,互联网让所有的数据在线,而数据在线,我们能让数据成为资源,参与决策。
上午的演讲中,胡晓明还提到,阿里云做的是信任的生意,提供了云计算的基础服务和大数据、人工智能、安全各类服务。去年,在阿里云的平台上,一家企业可以一年消费一亿人民币,这在四五年前是不能想象的。
本次大会的一大主题是智能医疗。
去年,阿里云联手英特尔,与华大基因发布了一个计划,希望到2020年把人体基因的测序成本降到1000人民币。
胡晓明在演讲中提到,阿里云正在跟更多的医疗机构开展合作。去年跟安徽的医科大学合作,对人类的医疗疾病凝血病进行全量的基因测序,花最少的时间对凝血病的基因基础进行检测。在上海跟华山医院一起合作,阿里云提供技术,让华山医院在新药的研究上计算的能力更强。一般的医生通过肉眼看甲状腺结节,判断的准确率是60%-70%。今天由于有了云计算,准确率可以提高到85%。
大会上,胡晓明正式发布阿里云 ET 医疗大脑:采用深度学习的技术,ET通过海量的数据作为示例来训练机器完成特定任务,即由计算机通过学习病例数据来提升医术。目前,ET已经在具备多项医疗能力,未来希望在患者虚拟助理、医学影像、精准医疗、药效挖掘、新药研发、健康管理等领域承担医生助手的角色。
这个平台目前已经为很多医院提供人工智能的计算服务。胡晓明说:“我相信,随着医生把越来越多的他们的经验集成到这个平台上,越来越多的阿里云和我们的伙伴把越来越大的计算能力作为一种服务推到市场,我们也把越来越多的深度学习的能力整合到平台上来,这个平台会越来越强大。这对于我们疾病的诊断、新药的研制会带来很大的帮助。”
大会上,胡晓明还发布了另一个阿里云的“大脑”——ET工业大脑,把阿里云的计算能力、深度学习的能力集成到平台上,让更多的工业企业把他们的能力集成到阿里云的平台上来,帮助越来越多的企业实行智能升级。
阿里云已经开始在江苏、广东、浙江尝试用人工智能技术帮助制造业转型升级。例如,去年在苏州投入很大的科研力量和技术力量,对苏州的制造业提升提供更大的帮助。其中有一家企业叫苏州协鑫,是一家太阳能光伏板的生产企业。
胡晓明在演讲中说:“我们希望通过这套平台,能够帮助中国制造提升1%的能力。1%意味着上万亿人民币的利润,因为中国是制造业的大国。”
你们都在说无人驾驶,阿里在说互联网汽车
除了人工智能平台,阿里巴巴去年和上海汽车共同宣布投入操作系统。胡晓明说:“在过去两年多时间里,我们在互联网汽车上投入了大量的研发力量。”去年7月份在杭州,上汽和阿里巴巴走到一块,共同发布首辆搭载YunOS Auto操作系统的互联网汽车。今年,上汽与阿里将推出70万辆互联网汽车。
在演讲的最后,胡晓明总结说,阿里云今年将集成阿里巴巴所有的技术,把飞天的智能呈现给市场,这是他们今年最重要的任务和未来几年最重要的征程。
峰会上,阿里云首席科学家周靖人宣布,正式发布机器学习平台PAI2.0。这被阿里官方定义为“NASA”首个重磅武器。
相比1.0版本,PAI 2.0有多项重大更新,除增加了100余种算法外,更重要的是对主流深度学习框架TensorFlow、Caffe和MXNet的全面兼容。
两年前,阿里云对外发布国内首个机器学习平台PAI,包括数据处理以及基础的回归、分类、聚类算法。
此次PAI2.0的重大升级主要包括以下方面:
1.全面拥抱开源
PAI2.0编程接口完全兼容深度学习框架:Tensorflow、Caffe以及MXNet,用户只需要将自己本地编写的代码文件上传至云端就可以执行。
Tensorflow、Caffe和MXNet是目前全球主流的深度学习开源框架。Tensorflow开源算法和模型最丰富;Caffe是经典的图形领域框架,使用简单;MXNet分布式性能优异。
对于底层计算资源,PAI2.0提供了强大的云端异构计算资源,包含CPU、GPU、FPGA。在GPU方面,PAI2.0可以灵活实现多卡调度。
借助这些框架以及强大的计算资源,用户能非常方便地就可以将计算任务下发到对应的分布式计算机群上,实现深度学习模型训练与预测。
2. 更丰富的算法库
PAI2.0提供100余种算法组件,涵盖了分类、回归、聚类等常用场景,还针对主流的算法应用场景,提供了偏向业务的算法,包含文本分析、关系分析、推荐3种类别。
“算法全部脱胎于阿里巴巴集团内部的业务实践,所有算法都经历过PB级数据和复杂业务场景的锤炼,具备成熟稳定的特点”,阿里云首席科学家周靖人说。
3. 支持更大规模的数据训练
PAI 2.0 新增了参数服务器(Parameter Server)架构的算法。不仅能进行数据并行,同时还可将模型分片,把大的模型分为多个子集,每个参数服务器只存一个子集,全部的参数服务器聚合在一起拼凑成一个完整的模型。
其创新点还在于失败重试的功能。在分布式系统上,成百上千个节点协同工作时,经常会出现一个或几个节点挂掉的情况,如果没有失败重试机制,任务就会有一定的几率失败,需要重新提交任务到集群调度。PS算法支持千亿特征、万亿模型和万亿样本直至PB级的数据训练,适合于电商、广告等数据规模巨大的推荐场景。
阿里云首席科学家周靖人说,在过去的一年时间里我们协助客户落地了多项重大的人工智能应用。但人工智能要想真正成为成为普惠科技,需要一款更加通用的生产工具。PAI2.0正是为此而生。
人工智能综合了多门学科的技术,对人才要求极其高,除了懂统计学中各种复杂的机器学习算法,还要懂实现逻辑以及分布式架构理论。PAI可以大幅的降低人工智能的门槛以及开发成本。
从操作界面来看,PAI没有繁琐的公式和复杂的代码逻辑,用户看到的是各种分门别类被封装好的算法组件。每一个实验步骤都提供可视化的监控页面。在深度学习黑箱透明化方面,PAI也同时集成了各种可视化工具。
PAI的基础设施和计算框架建立在阿里云飞天计算平台之上,通过云的模式大幅降低了计算成本,支持MR、SQL、MPI、PS、GRAPH等多种分布式计算框架,对于底层的CPU和GPU计算机群可以灵活调用。
两年时间里,PAI在阿里巴巴内部已经被广泛使用。以淘宝搜索为例,搜索结果会基于商品和用户的特征进行排序。通过使用参数服务器,淘宝可以把百亿个特征的模型,分散到数十个乃至于上百个参数服务器上,打破了规模的瓶颈。
在阿里云的客户当中,广东省气象局对PAI的使用最具代表性。他们使用PAI对临近预报(0-3小时内)的降雨量进行建模预测。通过拖拽操作就完成了数据清洗、特征工程,非线性机器学习算法训练以及结果评估的工作。
PAI还被应用在各种前沿科技领域。华大基因联合阿里云科学家,正使用PAI对肺腺癌患者基因进行分析,试图寻找到导致肺腺癌病发的关键基因突变。
29日上午峰会上,阿里云飞天研发负责人李津发布了一系列高性能计算产品。
他首先提到,云计算向在线迁徙,拐点已至、到2020年,人类所有的数据将达到44zb,这些数据需要的计算能力,超乎我们想象,这些都是工业4.0,人类未来发展的基础,如果没有计算力的进步,不可想像。
通用的x86服务器销售量连续3个季度持续下跌,在北美跌幅最高达5.9%,这背后隐藏了一个信息,越来越多的计算再向在线迁徙,迁徙到云计算平台。这表明越来越多的人认识到,云计算的效率远远高于原来的传统线下机房,这个拐点今天已经到来。
李津在会上发布的产品还包括:
基于高性能计算的ECS产品
数据库全产品栈升级
面向丰富场景的普惠存储方案
华北3开服:中国最高效的绿色数据中心、全栈VPC接入、GP《绿色2017》报告唯一提及的中国企业
视频云升级
高速通道发布:量子加密通道
“能听,会说,懂你”的智能语音交互发布
Atlas开源
apsara咖啡发布:懂代码的咖啡
Gaas平台 即将发布(3月31日)
大会上,阿里云宣布联合英特尔、linkdoc启动天池医疗AI系列赛,在这个汇集了6万多名AI算法科学家的平台上,寻找早期肺癌诊断的智能化判断最优算法,让机器可以通过原始CT影像图片协助医生进行诊断。