对话戴金权:英特尔如何构建软硬件协同统一的大数据分析+AI平台?

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 抛开硬件,英特尔的软件能力也不容忽视。

雷锋网消息,在2019全球人工智能技术大会主论坛,英特尔高级首席工程师、大数据技术全球CTO戴金权发表了题为“如何构建统一的大数据分析+AI平台”的演讲,英特尔的硬件能力不必赘述,这次英特尔则着重展示了软硬协同能力,尤其是人工智能开源软件平台Analytics Zoo。

戴金权表示,英特尔致力于提供从设备端到边缘再到数据中心、云端完整的计算架构,比如在数据中心,英特尔至强系列服务器是AI应用分析的基础架构,同时也提供了多种神经网络处理器等硬件架构。

TB1bNoJaCWD3KVjSZSgXXcCxVXa.jpg

英特尔开源AI软件版图

如上图所示,这是英特尔使用开源AI软件加速开发的版图,他强调,英特尔致力于提供全栈的解决方案,从最底层的算法开源项目帮助用户更高效开发计算库,再到上层各种机器学习或者深度学习的框架,再到最上层,英特尔也提供了一些开源工具包,目的是帮助应用开发人员更高效的开发基于深度学习的应用。

趋势 | 大数据分析和AI平台融为一体

据雷锋网了解,业内大数据分析和AI平台产品并不少,英特尔这类将大数据分析和AI平台融为一体的模式正成为行业新趋势。

第一,对于大多数用户来说,尤其在生产系统当中,基于Apache Spark这样的大数据集群仍然是所有的生产数据以及包括大量硬件资源的聚集地,如何更高效利用生产数据以及硬件资源,能够将新的人工智能的应用支持起来成为新挑战。

第二,要构建一个工业级端到端的大数据分析+人工智能应用,并不是说训练一个模型就可以完成的事情,其是一个非常复杂的流水线或者工作流。从数据的收集、导入、处理、特征的提取、各种模型的构建训练,到最后的部署、推理等等,是一个非常复杂的工作流。

“我们能够帮助用户可以将这一个样端到端的大数据处理分析加上机器学习的工作流能够非常方便地构建出来,从而大大能够提高了用户的开发效率、部署效率和运维效率”,戴金权介绍道。

与过去数年相比,深度学习和人工智能应用场景更加广泛,要处理的数据也更加广泛,所以客观要求使用者构建端到端的大数据处理分析加上机器学习、深度学习的统一流水线。英特尔观察到,客户有越来越多的类似需求。

“我们有很多用户是来自于很多非常大的互联网公司或者是大的企业里面的传统实验室,他慢慢的也会发现,当构建了一些人工智能深度学习的框架和模型之后,怎么样能够很好的真正跑到生产系统上去,能将生产数据在上面跑起来。这是用户来使用英特尔Analytics Zoo一个很重要的出发点。”

此外,Analytics Zoo的用户也不乏硬件的OEM的厂商、软件提供商、公有云服务商等,英特尔现场展示出的客户包括浪潮、宝信、戴尔、阿里云和腾讯云等。

核心 | 端到端应用场景塑造

TB1jAMQarys3KVjSZFnXXXFzpXa.jpg

从深度学习模型到一个完整的工业级应用要多少步骤?如上戴金权在现场展示的PPT,黑色部分是核心的深度学习模型,但是周边有很多工作要完成,才能使之运行起来。

深度学习的模型只是整个流程的一部分,要构建和应用深度学习模型,还有数据的导入、数据清洗、特征提取、对整个集群的资源的管理和各个应用之间对这个资源的共享等,这些工作事实上占据了机器学习或者深度学习的一个工业级应用开发大部分的时间和资源。所以,数据处理、机器学习,以及算法必须很好地和现有的大数据处理的工作流整合在一起。

这也是构建一个端到端的应用场景所面临的问题,在没有一个统一的大数据分析+AI平台之前,需要人工把很多不同的框架拼凑起来。

另外很多用户开发一般都是从单机开始,当需要处理更多数据的时候,就需要跑到一个大规模分布式环境,甚至到一个生产环境里去。

从Analytics Zoo的角度,第一,英特尔能够将不同的框架无缝的集成到流水线里面去,通过在软件层上面各种新的支持或者功能,能够将TensorFlow、Spark能够非常无缝的集成在一个程序里面,在一个Spark程序里面直接嵌入TensorFlow的Code,然后一起运行起来,这其实对很多用户来说很有吸引力。

第二是在开发过程中,因为底层运行在Spark这样的引擎上,上面可以嵌入各种深度学习的功能,它可以运行在一个单机的环境,也可以跑到一个分布式环境里面去,用户也可以直接访问生产数据。

“很多用户之所以想用Analytics Zoo,就是它可以直接构建端到端的,跟生产系统几乎一致的原型。这是我们的一个主要出发点,可以帮助用户将整个的大数据分析+人工智能的应用很方便的将端到端的流水线构建出来,而且它可以很方便的从用户的笔记本运行到集群、运行到用户的生产环境当中去,这是英特尔在底层Analytics Zoo这个平台里所做的工作”,戴金权总结道。

Analytics Zoo是为了大数据平台所优化的,今天大数据平台基本都运行在非常大规模的英特尔至强处理器上,或许是几十、几百、几千个节点,但是英特尔使用了大量的底层优化的框架和库,像MKL-DNN、OpenVINO等等,将来会通过英特尔One API这样的生态系统输出。

戴金权提到,当在英特尔的生态系统上构建一个人工智能开发平台时,带来的好处就是底层能够支持英特尔各种硬件的加速,不管是至强服务器,包括像Movidius、FPGA,神经网络处理器,还有将来的独立显卡,都可以通过One API下面的底层生态系统来给上层的平台和应用所使用。

雷锋网(公众号:雷锋网)总结,Analytics Zoo能够将各种不同的模块不同的框架下统一到一个端到端流水线上,提高客户开发部署大数据分析和深度学习的能力,这在如今深度学习或者机器学习越泛化的背景下十分重要,英特尔的工作能够让用户减少人工智能应用的开发环节,快速推向现实场景。

相关文章:

英特尔首次向其投资者谈论一个不为人知的“秘密”

腾讯X英特尔:巨头联手如何掘金5G&MEC?

英特尔以数据为中心的竞争优势是什么?BATJ有个共同的观点

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
3天前
|
人工智能 Anolis
展示全栈式AI平台,探讨软硬件技术!英特尔分论坛议程来啦 | 2024 龙蜥大会
英特尔分论坛将依托英特尔云到端的全面产品组合,围绕至强可扩展处理器、AI 加速器、以及 oneAPI、OpenVINO 等软硬件技术展开探讨。
展示全栈式AI平台,探讨软硬件技术!英特尔分论坛议程来啦 | 2024 龙蜥大会
|
1天前
|
人工智能 监控 安全
ai换脸?分析一下双刃剑
随着技术进步,“换脸”技术在身份验证中的应用日益广泛,但也引发了一系列问题,如侵犯肖像权、隐私泄露、虚假信息传播及身份盗用等。尽管国家尚未全面禁止换脸软件,已出台多项法规加强监管,确保技术合法、安全应用。未来,平衡技术利弊与社会需求将是关键。换脸技术在影视娱乐、社交媒体和医学领域展现出巨大潜力,但仍需谨慎使用,避免滥用。
|
2天前
|
数据采集 人工智能 安全
AI大数据处理与分析实战--体育问卷分析
本文是关于使用AI进行大数据处理与分析的实战案例,详细记录了对深圳市义务教育阶段学校“每天一节体育课”网络问卷的分析过程,包括数据概览、交互Prompt、代码处理、年级和学校维度的深入分析,以及通过AI工具辅助得出的分析结果和结论。
|
9天前
|
人工智能 自然语言处理 搜索推荐
评测:AI客服接入钉钉与微信的对比分析
【8月更文第22天】随着人工智能技术的发展,越来越多的企业开始尝试将AI客服集成到自己的业务流程中。本文将基于《10分钟构建AI客服并应用到网站、钉钉或微信中》的解决方案,详细评测AI客服在钉钉和微信中的接入流程及实际应用效果,并结合个人体验分享一些心得。
9863 4
|
9天前
|
存储 人工智能 算法
AI与大数据的结合:案例分析与技术探讨
【8月更文挑战第22天】AI与大数据的结合为各行各业带来了前所未有的机遇和挑战。通过具体案例分析可以看出,AI与大数据在电商、智能驾驶、医疗等领域的应用已经取得了显著成效。未来,随着技术的不断进步和应用场景的不断拓展,AI与大数据的结合将继续推动各行业的创新与变革。
|
12天前
|
存储 人工智能 自然语言处理
无缝融入,即刻智能[二]:Dify-LLM平台(聊天智能助手、AI工作流)快速使用指南,42K+星标见证专属智能方案
【8月更文挑战第8天】无缝融入,即刻智能[二]:Dify-LLM平台(聊天智能助手、AI工作流)快速使用指南,42K+星标见证专属智能方案
无缝融入,即刻智能[二]:Dify-LLM平台(聊天智能助手、AI工作流)快速使用指南,42K+星标见证专属智能方案
|
3天前
|
人工智能 安全 Anolis
专访英特尔:开源与 AI 迅猛发展,龙蜥社区提供高效合作平台
龙蜥社区为开源技术、AI 技术提供了一个非常好的高效合作的平台。
|
10天前
|
人工智能
就AI 基础设施的演进与挑战问题之云效平台上进行代码的持续验证的问题如何解决
就AI 基础设施的演进与挑战问题之云效平台上进行代码的持续验证的问题如何解决
|
5天前
数据平台问题之在数据影响决策的过程中,如何实现“决策/行动”阶段
数据平台问题之在数据影响决策的过程中,如何实现“决策/行动”阶段
|
8天前
|
存储 监控 安全
大数据架构设计原则:构建高效、可扩展与安全的数据生态系统
【8月更文挑战第23天】大数据架构设计是一个复杂而系统的工程,需要综合考虑业务需求、技术选型、安全合规等多个方面。遵循上述设计原则,可以帮助企业构建出既高效又安全的大数据生态系统,为业务创新和决策支持提供强有力的支撑。随着技术的不断发展和业务需求的不断变化,持续优化和调整大数据架构也将成为一项持续的工作。

热门文章

最新文章

下一篇
云函数