阿里云基础产品技术月刊 2019年3月-阿里云开发者社区

开发者社区> 弹性计算> 正文
登录阅读全文

阿里云基础产品技术月刊 2019年3月

简介: 3月20日阿里云在2019 NVIDIA GPU技术大会上发布了国内首个公共云上的轻量级GPU异构计算产品VGN5i实例。

一、商用产品技术
TOP 1 3月20日阿里云在2019 NVIDIA GPU技术大会上发布了国内首个公共云上的轻量级GPU异构计算产品VGN5i实例
VGN5i实例不仅打破了传统直通模式的局限,还可以让客户以更低成本、更高弹性开展业务!以云游戏为例,企业通常仅需要一颗物理GPU几分之一的计算能力即可流畅完成图形或视觉计算;人工智能领域也存在类似问题,深度学习推理场景对GPU的计算资源消耗可能仅仅是训练阶段的数十分之一,甚至更少。对于这类应用场景而言,轻量级计算异构产品可以提升系统灵活性,并大幅降低成本。而阿里云本次首家提供云上轻量级GPU实例,意味着用户可以用更细粒度的计算资源开启业务。该产品基于NVIDIA Tesla P4 GPU,支持多种规格,企业可以按需选择实例规格或者在云市场选择NVIDIA Quadro虚拟工作站,适用于云游戏、AR/VR以及图形处理等随需应变的GPU计算场景。
TOP 2 全新一代高性能企业级文件存储 CPFS 商业化
日前,阿里云全新一代高性能文件存储 CPFS 在经过近一年的公测,并完美通过国家天文台、自动驾驶行业多个大型客户的大规模高性能计算业务场景磨砺后,正式对外商业化。
相比于传统并行文件系统,阿里云文件存储 CPFS 具备弹性扩容、亿级文件容量、TB/s 级吞吐量、全托管等四大产品功能特性,广泛应用于基因计算、石油勘探、气象分析、机器学习、大数据分析和媒体文件处理等计算密集型的业务场景,提供中国首家云上高性能计算的并行存储服务,完美满足用户对于性能、安全的苛刻要求。
TOP 3 阿里云Kubernetes服务(ACK)版本升级,托管版新增四大开服区域
阿里云容器服务ACK Kubernetes版本全面升级到1.12.6。同时,开放IPVS,在大规模集群中会显著提高负载均衡的性能;Kubernetes集群模板上线,支持用户选择集群模板创建集群。
其中,容器服务托管版Kubernetes开服张家口、呼和浩特、美西、法兰克福。同时,支持SLS日志插件,用户可在创建集群时启用日志服务,快速采集Kubernetes集群的容器日志,包括容器的标准输出以及容器内的文本文件。
据悉,目前Windows控制台功能也已全面开放,用户可通过控制台或Open API创建Windows Kubernetes集群并部署Windows容器,目前已开放新加坡、吉隆坡等区域。详情参考《阿里云容器服务ACK发布Windows Container支持,让Windows应用快速上云》:https://yq.aliyun.com/articles/694721

  • 弹性伸缩推出目标追踪伸缩规则,让用户使用更精准、快速、易用的策略响应业务负载变化
    弹性伸缩服务在简单伸缩规则的基础上,通过与云监控深度合作,上线了目标追踪伸缩规则。相比于简单伸缩规则定义较模糊、调整粒度固定、调整过程缺少控制等不足之处,目标追踪伸缩规则重新定义了伸缩组动态调整的使用方式,用户只需要指定关心的监控指标目标值,弹性伸缩组基于对监控数据的感知能力自动计算需要调整的扩缩容实例数,并使用尽量少的调整过程趋近监控指标目标值,让用户在使用弹性伸缩过程中,不再操作“手动空调”,获得“自动空调”的轻松体验。
  • 阿里云发布业内首个公共云异构超算集群SCC-GN6
    3月21日,阿里云发布基于弹性裸金属服务器神龙X-Dragon的SCC-GN6,集群性能接近线性增长,将深度学习训练时间缩短至分钟级,可满足无人驾驶、智能推荐、机器翻译等人工智能场景的高性能计算需求。人工智能特别是深度学习,对算力的要求永无止境。但如果只是堆砌芯片,没有低延时网络、高速读写能力,大规模集群无法发挥出最大的计算性能,性能损耗通常在50%左右,且算力资源并不丰富。有研究显示,到2030年中国研究人员每人平均只能拥有1-2个GPU,大多数研究将受到计算能力的严重限制。SCC-GN6是首个基于X-Dragon架构的超算异构产品,神龙云服务器与阿里云ECS、GPU云服务器等一起,最多可达512个节点,计算性能依旧接近线性增长,提供堪比超算中心的并行计算资源。
  • Ali-Perseus:擎天统一深度学习分布式通信框架,增加资源性能,提升阿里云异构计算产品的性价比

    阿里云推出擎天统一深度学习分布式通信框架,业界首次统一支持Tensorflow、Caffe、MXNET、PyTorch 4个主流的深度学习框架的分布式性能加速,性能比优化的通信框架horovod提升2~5倍不等。统一深度学习分布式通信框架的实现,将各种深度学习框架的分布式优化与框架自身完全解除了耦合,可以在一个统一的框架之下进行阿里云基础设施的深度优化。持续基于阿里云VPC网络进行深度优化,直接让Tensorflow,MXNet,Pytorch和Caffe全面提升了在阿里云上的多机多卡扩展性,大大提升了阿里云异构计算优化的效率,也减轻了性能优化、开发和维护的工作量。客户A已经在使用Ali-Perseus+Tensorflow+Bert在生产环境中进行预训练,性能提升为horovod的2~5倍。客户B在评测Ali-Perseus+MXNet,目前反馈,与客户的自有MXNet框架整合顺利,检测模型的4机32卡性能提升10%以上,性能上限接近线形加速比,客户仍在进一步测试中。客户可以完全保留之前的开源训练框架不变的同时,享受到Ali-Perseus 通信框架的性能优势,对大部分客户来说,是比较容易接受的一种方案。对于客户购买的IaaS资源来说,会直接增加这些资源的性能,提升阿里云异构计算产品的性价比。
  • 弹性高性能计算E-HPC自动扩容新模式:按多种备选实例类型进行扩容
    E-HPC的自动扩容功能增加了一种新模式:每个调度器队列支持配置实例列表,自动扩容时如果一种实例库存不足,将根据当前队列的实例列表选择其他实例进行扩容,最大限度的确保用户自动扩容能够成功,保障用户作业业务连续性。
  • 为数据计算提供强力引擎,阿里云文件存储 HDFS 公测
    针对大数据和离线数据分析、机器学习场景,阿里云发布全球首个云原生文件存储 HDFS,无需关心和维护底层存储,降低 TCO,解决了传统自建 HDFS 系统计算存储耦合的问题,真正实现了计算存储分离,使得存储计算分离后分别拥有享受可线性扩展的吞吐能力和免运维的快速弹性伸缩能力。
  • 性能与容量兼具,文件存储 NAS 极速型发布
    随着信息化发展,存储性能和容量不断提升,并向互联网和分布式架构转型,而分布式架构存在网络路径过长、时延过高的问题。在此背景下,阿里云文件存储 NAS 极速型发布,它基于新一代盘古 2.0 基础架构,进行极致的网路优化,网络带宽翻倍,时延缩短 70% ,针对海量小文件场景提供百微妙级低时延和高 IOPS 访问,可以满足不同 workload 的业务需求。
  • 对象存储 OSS 全面支持“对象版本管理”特性
    阿里云对象存储 OSS 现已全面支持“对象版本管理”特性,提供“应用级”数据保护,可防止文件意外覆盖,当 Bucket 开启版本管理特性后,该 Bucket 内对象的每次修改、删除操作, OSS 都会生成对应的历史版本。借助该功能,可以充分保护和恢复误删除、误覆盖的数据。目前,该功能适用于所有的存储类型以及区域。
  • 对象存储OSS符合美国证券交易委员会(SEC)和金融业监管局(FINRA)合规要求
    阿里云对象存储 OSS 现已全面支持 WORM 特性,允许用户以“不可篡改、不可删除”的方式保存和使用数据。该特性拥有多种强合规策略类型,用户可针对 Bucket 设置基于时间的保留策略,在对象的过期时间到期之前,包括根账号在内的任何用户都无法直接删除对象和策略。同时, 也支持基于 LegalHold 的策略类型,用户可根据实际需求灵活选择策略类型。目前,广泛用于金融、保险、医疗、证券等行业。
  • 满足 I/O 密集型应用场景,全球首个百万级 IOPS 的企业级云盘商业化
    在数据库和实时业务分析场景下,阿里云推出全球百万级IOPS的企业级ESSD云盘,搭配ECS云服务器使用, ESSD可提供单盘高达 100万IOPS 的随机读写能力,相比SSD云盘分别提升了 40 倍性能上限和降低了 70% 读写时延。ESSD 单盘最大容量为32TB,为客户提供更高的性价比体验。在实际的业务场景测试下,以 MySQL 和PostgreSQL 为例,采用 ESSD 云盘可获得 3-4 倍的 TPS 性能提升。

此外,ESSD云盘支持不停机扩展容量、不停机提高IO读写性能上限、数据加密等高级数据服务功能,给客户在弹性、安全等方面带来了更多的技术红利。

  • 数据智能管理,阿里云日志服务 AIOps 功能发布
    2019年3月北京云栖大会上,阿里云日志服务发布面向 AIOps 分析功能。阿里云日志服务是面向日志类数据的智能化一站式平台,针对AIOps场景,新增面向趋势预测、异常发现、智能聚类、根因分析(推导)等4个高频场景系列函数,从异常的识别、分析的过程到最后的原因定位均有涉及,通过这些功能,提升DevOps分析与诊断的效率,协助运维人员进行更高效的企业 IT 运维。该功能已通过阿里巴巴双11十一实战验证。
  • 智能媒体管理视频型发布
    2019年3月,阿里云智能媒体管理视频型发布,支撑视频网盘、手机相册、社交图库、家庭监控等图片、视频应用场景,为云上图片、视频数据提供一站式数据处理、分析、检索等管控体验。智能媒体管理视频型针对不同的业务场景,拥有整合数据处理能力,让数据快速流转。它可与对象存储OSS 无缝对接,提供 Serverless 化服务,简化业务运维。此外,智能媒体管理视频型提供场景化一站式解决方案,面向场景的构建快捷的元数据管理,快速实现应用。
  • 《基于多vpc架构下的网络安全最佳实践》发布
    云防火墙在阿里云北京峰会发布了《基于多vpc架构下的网络安全最佳实践》,通过多vpc+云防火墙的隔离,帮助客户实现不同等级业务的安全隔离,如互联网业务和非互联网业务的隔离, 生产业务和测试业务的隔离。保证企业核心资产,特别是DB类核心资产的安全。
  • 基于云原生能力构建的云安全中心正式发布
    阿里云正式发布基于云原生能力构建的云安全中心,打破传统安全边界的防御模式,实现基于数据驱动的安全融合,定义了云时代企业上云的第一个安全基础设施,致力于帮助用户实现安全预防、威胁检测、调查响应、和主动防御为一体的安全运营闭环,解决云上安全十大威胁,全方位保障用户资产安全,为用户实现安全上云。
  • Serverless Kubernetes支持大规格弹性实例(ECI)
    当前新增大规格ECI(8c至64c),支持基因计算等场景,其规格最大64c256g,最小0.25c0.5g。阿里云Serverless Kubernetes旨在供一个规模化和高弹性的Serverless Container基础设施,让用户无需管理和维护集群与服务器,即可快速创建 Kubernetes 容器应用,并且根据应用实际使用的 CPU 和内存资源量进行按需付费。容器和无服务器的结合,极大降低容器的使用门槛,减少总体计算成本,也让用户摆脱了底层基础设施管理的复杂性。规格支持详情请参考:https://help.aliyun.com/document_detail/89138.html
  • 镜像服务企业版新开上海区域,共享版国际站全域开放
    容器镜像服务-企业版在3月21日阿里云峰会上正式亮相,企业版具备更强的安全及镜像分发能力:适合安全需求较高且拥有大规模节点的企业级客户。在镜像安全部分,提供独享的OSS加密存储,支持多网络环境下访问控制。在镜像分发部分,支持P2P镜像加速,提供上千节点并发拉取能力,保障业务极速部署,解决大镜像分发难、多节点拉取慢的难题。 而免费的共享版,支持阿里云的集成,同时也不强绑定阿里云。

详情参考:https://yq.aliyun.com/articles/693610

  • 产教结合、硬软一体,阿里云教育一体机发布
    3月13日,阿里云教育一体机召开发布会。产品旨在云计算搬进高校,配有理论课程及动手实验,软硬一体化交付。教育一体机,基于云原生开发服务(阿里云容器服务Kubernetes)和移动开发服务(EMAS),为高校学生量身定制了一系列课程及实验,将前沿科技的理论和最佳实践引入高校,以软件硬件于一体的交付方式为教育行业提供解决方案。产品旨在缩小高校在人才培养侧和市场需求侧在结构、质量、水平存在的差异。https://yq.aliyun.com/live/879
  • 阿里云区块链服务Hyperledger Fabric版本正式商业化,广邀合作伙伴共建生态
    阿里云BaaS目前支持三种主流区块链技术,其中,Hyperledger Fabric版本在3月20日正式进入商业化阶段,蚂蚁金服自研的蚂蚁区块链以及企业以太坊Quorum两种版本尚在免费公测阶段,同时,BaaS新增日本和澳洲区域上线。
  • 阿里云区块链召开正式商业化共创会
    3月29日,在阿里云区块链正式商业化共创会上,客户肾泰网健康科技及合作伙伴智链万源出席分享。阿里云区块链服务的定位是提供安全、稳定的技术平台,构建可信的企业协作网络,链接可信数据。基于这一平台,阿里云区块链服务将协同众多优秀行业合作伙伴,共创垂直领域的业务解决方案,布局区块链行业生态。
  • 阿里云区块链服务助力“未来医院”
    2019年3月27日上午,武汉市中心医院宣布联合阿里健康、支付宝共同打造的“未来医院”正式亮相。医院副院长杨国良说,“此次我们合作打造的未来医院的五大核心内容——就诊助手、区块链技术、全程刷脸就医、视频问诊、线上处方全流程应用就是双方合作的价值体现”。在互联网医院中引入阿里云区块链服务BaaS及蚂蚁区块链技术,通过区块链+电子处方的模式助力公民的在线就医服务。
  • EDAS Serverless 新版本上线,更轻的应用发布平台
    3月21日,在阿里云峰会·北京企业级互联网架构专场的现场,阿里云中间件 PaaS 平台的多项新功能重磅发布 ,覆盖应用服务管理、消息收发管理、全链路灰度管理和监控管理等应用场景,旨在降低云原生技术的使用门槛,帮助企业更快捷地构建云上业务。

详情:https://yq.aliyun.com/articles/694700

  • 消息队列发布新版本,提供更稳健的消息队列,构建企业的数字桥梁
    3月21日,在阿里云峰会·北京企业级互联网架构专场的现场,阿里云消息队列推出的多租户(实例化)和 Exactly-Once 消息幂等产品特性,可实现资源隔离、命名空间、访问控制、实例限流和消息同步等功能,并有效解决消息重复、幂等处理难的问题。其中,消息队列AMQP新增四种多语言SDK支持,包括Go、PHP、Python、Node.js,覆盖更多企业客户。

详情:https://yq.aliyun.com/articles/694700

  • 性能监控ARMS上线三大新特性,打造360度全方位的监控体系
    3月21日,在阿里云峰会·北京企业级互联网架构专场的现场,应用实时监控服务 ARMS 在原有应用监控、前端监控和自定义监控的场景下,上线三大新特性,支持小程序监控、PHP 应用性能监控和容器服务应用监控,细化了监控场景,为用户打造 360 度全方位的监控体系,免去运维过程中的后顾之忧。

详情:https://yq.aliyun.com/articles/694700

  • 消息队列 RocketMQ新零售项目发布上线,丰富新零售电商生态
    消息队列RocketMQ已经实现了交易消息在新零售云VPC内的安全隔离,新零售云用户可以从MQ消费到阿里的订单消息,用数据赋能客户构建更加丰富繁荣的新零售电商生态;此外,消息队列RocketMQ新增支持STOMP协议支持,提供更加简单和互操作性强的访问机制。截止目前,阿里云消息队列已经支持了AMQP、MQTT、STOMP等协议,满足Gartner魔力象限对于异步消息服务的多协议支持要求。另外,消息队列RocketMQ新增基于Raft协议的多副本特性,在社区已经发布。
  • 阿里云专有云敏捷PaaS产品在阿里云峰会-北京站正式发布
    专有云敏捷PaaS产品支持云原生应用的快速开发部署,可实现以应用为中心的混合管理,该版本作为混合云的新起点,将重塑企业应用架构。具体来看该产品:输出更轻量,可做到3台起步,满足各场景下的轻量化部署;可利旧,无需客户另外购买主机,最大化利用现有主机资源,提高业务效率、降低IT成本,更能使企业从繁杂的基础架构管理中解脱,更加专注于业务;部署更敏捷,客户可在小时级别内自主完成部署。
  • OpenMessaging Connector首个版本发布
    OpenMessaging Connector发布首个版本,支持MySQL Connector。截止本月,前30强中国云厂商中的40%已经加入OpenMessaging 社区,覆盖百家具备PAAS能力的主流厂商。
  • 弹性计算推出新付费模式:预留实例券
    预留实例券是一种抵扣券,可以提供按量实例账单抵扣及容量预留。相比预付费实例,预留实例券与按量付费实例这种组合模式可以兼顾灵活性和成本同时比标准月价格更优惠。目前Reserved Instance已全网开放邀测。
  • 大客户资源报备供应查询
    大客户在固定时间内的资源需求阿里云无法满足时,CBM 会在后台帮客户提交一个资源报备。改功能发布前,若资源状态有更新的时,需要CBM通知客户去购买。在该功能发布后,客户可以直接在buy页面查看供应情况,对于已交付可以直接购买完成交易。
  • AUTOSCALING新功能发布
    伸缩规则增加了minAdjustmentMagnitude参数,解决simpleScalingRule采用Percentage方式缩容时,存在无法将伸缩组全部实例释放完的情况。支持用户设置步进伸缩规则,通过不同的区间定义不同的扩容容策略。修复通过启动模板创建伸缩组全镜像未妥善处理,导致的多创建数据盘的问题。
  • ECI新功能发布
    ECI监控功能发布,支持ECI容器组及容器粒度的cpu, memory, network, load监控项,支持云监控查询,支持实时监控数据和汇聚查询,ECI RoleChain方式创建,支持Kubernetes格式yalm模板创建,并支持用户导出创建创建模板,支持HostAliases等功能,支持HostAliases允许用户自定义host映射,emptyDir的sizeLimit设置,,vk exec支持用户自定义命令数组,ECI Restart & Update功能发布,开放 8vCPU 及以上vCPU。
  • 网络产品发布PrivateLink beta版,提供更加弹性、安全的云服务接入服务
    阿里云智能北京峰会网络产品发布PrivateLink Beta版,支持云上用户更加简单,安全的访问云服务,根据访问带宽的差异,支持快速弹性能力,当前Beta版本提供给内部云服务使用,未来开放给生态伙伴。
  • 阿里巴巴代码平台缺陷检测技术PRECFIX发布
    3月 21 日阿里云智能北京峰会,阿里巴巴代码平台对外正式宣布缺陷检测及补丁推荐产品PRECFIX(Patch Recommendation by Empirically Clustering)。该产品集成了广大工程师的历史经验,帮助工程师在代码评审中发现规则检查和人工评审难以发现的缺陷,并提供对应的修复方案。目前在阿里内部数千公开代码公开库中扫描,发现问题种类800+,缺陷30000多个。

二、技术项目进展

  • Kubernetes 1.14发布,阿里一线专家发布深度解读
    Kubernetes 1.14.0 Release 已经于3月25日正式发布,阿里一线技术专家对Release Note 按照主题进行了重新归纳和梳理,按照类别对重要变更进行了技术剖析和讨论。分别重点剖析了:Windows Node 正式生产可用、本地持久化数据卷(Local PV) 正式可用、Pod 优先级与抢占机制稳定可用、 Pod Ready++、Kubernetes 原生应用管理能力、大规模场景下的性能提升与优化、用户友好度及稳定性的提升。 https://yq.aliyun.com/articles/695664
  • 安全组体验优化列表增加安全组还能加入多少IP的数据
    安全组体验优化列表使用新的接口,直接查询OpenAPI,不再反查实例提升性能。同时加入还可加入多少IP的数据,方便用户在安全组管理页面即可明确知道安全组的使用情况,提升运维效率。安全组相关功能是除实例外第二大使用率功能模块,本月针对头部用户需求做了一系列优化项:1.导入安全组规则去除100条规则的限制;2.实例加入和移出安全组支持模糊搜索,所有模糊搜索的endpoint切换至杭州3.创建规则时允许输入空格回车。
  • ROS支持查看已创建的stack的yaml格式的模板
    查询快照信息时加入创建截止时间,查询快照信息时如果按日期过滤,会将时间范围固定在指定时间前后1天内。发布功能:查询快照信息如果指定日期,隐含语义是查询该日期之后的所有快照,会引起歧义。用户会误认为仅查询当天的快照,导致删除了其它预期外的快照。
  • 网络产品稳定性建设,XGW无人值守发布系统上线
    XGW作为VPC的网关,承载了虚拟网络公网、专线、跨region通信的全部流量,XGW的稳定性直接影响阿里云虚拟网络的稳定性。本期网络产品稳定性建设项目,XGW无人值守发布系统上线,实现了发布自动化、全方位多维度探测监控、发布窗口约束、定时任务、发布效能报表等多种功能,不再依赖个人运维经验,并支持发布过程中出现异常自动停止并回滚能力,凌晨发布不再需要人肉熬夜盯屏监控,全面解放发布人力,降低发布导致的故障概率,提升发布效率和产品稳定性。
  • 网络产品anycast技术研发落地,支撑用户就近接入阿里云,提升访问体验
    阿里云网络产品团队和AIS物理网络团队实施海外anycast调度测试完成,在4个海外POP点(IN74,GB82,RU85,OE24)实现了anycast调度优化。通过就近接入POP点,多走内部专线,少走互联网,提高访问稳定性和优化部分地区跨国访问。全球各主要地区通过anycast访问阿里云,平均延时(80个地域探测)大幅降低,大大提升了用户访问体验。

三、学术、科研、技术成果
TOP 1 AIR项目使用CNN机器学习方法预测内存宕机项目论文被DAC-2019学术会议接收
AIR高校合作项目中,在与杜克昆山大学合作中的System Level Hardware Failure Prediction using Deep Learning的论文被DAC(Design Automation Conference)会议接收,预计2019-6正式发表。本项目在立项时就开始和基础设施事业部正一团队合作,其产出的内存故障预测模块目前已经部分部署在线上,已经开始采集数据。通过Blink实时流计算平台,已经在Blink平台上完成了内存故障预测模型的搭建,并打通数据反馈路径并将预测宕机的相关结果回流到阿里云日志服务(SLS)的日志中。后续计划和ECS的调度系统打通,增加系统中宕机风险的紧急性字段,从而推送对于的预测宕机告警通知和完成调度中的规避。
TOP 2 《阿里专有云等保合规白皮书》发布,阿里云实现首个一体化云原生安全架构
3月21日,2019阿里云峰会·北京,阿里云联合公安部信息安全等级保护评估中心发布了《阿里专有云等保合规白皮书》(以下简称《白皮书》),基于云等保合规技术框架,给出了阿里专有云多种交付场景下等保2.0合规的最佳实践,旨在为政府、企业、组织机构等相关单位满足等保合规要求提供行动指南,这也是全球首个专有云等保合规白皮书。《阿里专有云等保合规白皮书》从等保能力验证技术架构、阿里专有云等保2.0合规状况及白皮书使用建议等方面做了详细阐述。借助白皮书,客户能够快速获取多交付场景下的专有云平台侧的合规防护能力,同时结合客户侧的应用、安全管理、物理环境等方面的保护措施,共同构筑满足等保和客户需求的信息系统整体安全防御体系。针对等保2.0纵深防御的更高要求,阿里专有云平台提出了首个云原生安全架构,研发了基于可信技术的云平台入侵检测系统、用于强化网闸传输能力的负载均衡系统、基于国产硬件加密机的云平台密钥管理系统,结合云产品默认安全基线和安全策略动态配置能力,实现了即开即用、弹性伸缩、联动联防,默认合规的云时代安全防护。经评估中心评估,阿里专有云平台具备满足等保2.0第四级(可交付的最高等级)云安全要求的能力。
TOP 3 AIR项目使用FPGA对稀疏矩阵下的CNN算法进行硬件加速论文被FCCM-2019学术会议接收
AIR高校合作项目中,在与北京大学合作中的An Efficient Hardware Accelerator for Sparse Convolutional Neural Networks on FPGAs的论文被FCCM( Field-Programmable Custom Computing Machines)会议接收。本论文针对CNN算法的稀疏化矩阵形态,做出针对性的FPGA硬件层面的加速。实验结果显示,论文中使用的FPGA加速器在Xilinx ZCU102板卡上能达到223.4-309.0 GOP/s 的性能,比起之前未利用稀疏化矩阵形态的FPGA加速器在性能上提升了2.4-12.9倍(不同Benchmark)。

  • 阿里云获评全国信标委大数据标准工作组优秀成员单位
    在全国大数据标准化工作会议暨全国信标委大数据标准工作组第六次全会上,阿里云计算有限公司被评为2018年全国信标委大数据标准工作组优秀成员单位。阿里云在2018年牵头申请《城市数据治理能力成熟度模型》国标立项,得到众多成员单位支持和参与。
  • 《阿里云2018DDoS攻击态势报告》发布
    2018年,阿里云安全团队监测到云上DDoS攻击发生近百万次,日均攻击2000余次。目前阿里云承载着中国40%网站,为全球上百万客户提供基础安全防御。可以说,阿里云上的攻防态势是整个中国攻防态势的缩影。阿里云安全团队基于2018.1.1-12.31阿里云上的DDoS攻击数据,从DDoS攻击事件、僵尸网络中控、DDoS肉鸡等多个维度做了统计分析,希望为政府和企业客户提供参考价值。 

报告核心观点:

  1. TCP类型的攻击在DDoS攻击威胁中占据着更重要的比重。
  2. 应用层攻击对抗越来越激烈。
  3. 游戏等行业依然是攻击发生最频繁的区域。
  4. 攻击峰值已经以T为单位。
  5. DDoS攻击中,IoT设备的数量明显提升。
  • 阿里云北京峰会人工智能专场,异构计算集群加速技术解读
    介绍阿里云异构计算的弹性GPU计算服务,在AI算力需求爆发的时代,提供超大规模GPU集群算力,在高性能,高可靠性以及易用性几个关键点上为阿里云的AI客户提供GPU计算服务。着重介绍了几个新产品和服务,包括轻量级GPU实例用来满足众多轻量级的应用场景例如云游戏, AR VR, AI推理以及AI教学场景;以及Ali-Perseus 阿里云AI加速引擎--业界第一个统一四种主流框架Tensorflow,Pytorch,MXNet和Caffe的分布式训练的云上加速引擎,在VPC网络环境下,为客户带来显著的加速,Bert在2机16卡下,加速4倍左右,Insightface在4机32卡下加速超过2倍,显著的加速了客户和合作伙伴在人工智能领域的业务创新速度。
  • 阿里云北京峰会分论坛深度解析弹性计算技术和产品
    阿里云智能高级产品专家胡晓博从安全、稳定、弹性、提升性价比等方面深入解析了弹性计算ECS。在PAAS层产品陆续登台的今天,ECS更加需要为All-in-Cloud时代勤练内功、夯实计算基础。阿里云智能北京峰会,异构计算发布了多款产品,产品能力的提升,获得了客户的广泛关注。异构计算产品覆盖的应用场景,从单一的人工智能,开始向视频,VR/AR,游戏,工业设计等领域扩展。
  • Kubernetes & Cloud Native 北京站火爆闭幕
    Kubernetes & Cloud Native meetup 到场300余人。阿里云李响和张磊带来开场环节技术QA环节、江博分享Edge Kubernetes。还有图森、360、PingCAP、蚂蚁专家前来分享。沙龙资料及视频回顾:https://yq.aliyun.com/articles/694079。containerd从CNCF毕业,阿里云ACK团队做Sponsor,Pouch团队有两位维护者,将持续投入。
  • Apache RocketMQ Meetup城市站
    社区自发组织,类似Google GDG开发者沙龙的形式,首站苏州站,外部讲师占据60%。
  • AIR项目虚拟机安全隔离方案完成论文撰写和专利申请
    AIR高校合作项目中,与中科院计算所合作中的《H2O: Hypervisor as a Setter for Isolation Guarantee to Efficient Virtualized Network I/O in Cloud Computing》论文拟投在19年5、6月份的系统或云计算会议。同时输出两篇专利,《用于虚拟化系统的方法及虚拟化系统》和《一种虚拟化系统及其数据交换方法》初审已通过,将于5月公开。

本项目的研究目标(虚拟交换机的安全隔离性挑战)是来自云计算数据中心的实际问题,学术界已有的研究大都关注于虚拟交换机的性能问题,对安全隔离性的关注不够,该问题有很好的研究和落地实用价值。

  • 《CNCF x Alibaba 云原生技术公开课》重磅发布
    《CNCF x Alibaba 云原生技术公开课》于3月21日阿里云北京峰会正式发布,课程发布后在业界引起了广泛关注和订阅;阿里云和CNCF联合开发推出的免费公开课,讲解以Kubernetes主体的云原生技术知识。阿里云容器平台一线技术专家精心打造理论课程,并辅以动手实践。该课程希望以一种普惠大众的方式,为每一位开发者逐一回答关于“云原生”的每一个技术问题,揭示这场云计算革命背后的思想和本质。课程链接:https://edu.aliyun.com/roadmap/cloudnative

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:
+ 订阅

做技术领先、性能优异、稳如磐石的弹性计算!

官方博客
官网链接