对话戴金权:英特尔如何构建软硬件协同统一的大数据分析+AI平台?

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介: 抛开硬件,英特尔的软件能力也不容忽视。

雷锋网消息,在2019全球人工智能技术大会主论坛,英特尔高级首席工程师、大数据技术全球CTO戴金权发表了题为“如何构建统一的大数据分析+AI平台”的演讲,英特尔的硬件能力不必赘述,这次英特尔则着重展示了软硬协同能力,尤其是人工智能开源软件平台Analytics Zoo。

戴金权表示,英特尔致力于提供从设备端到边缘再到数据中心、云端完整的计算架构,比如在数据中心,英特尔至强系列服务器是AI应用分析的基础架构,同时也提供了多种神经网络处理器等硬件架构。

TB1bNoJaCWD3KVjSZSgXXcCxVXa.jpg

英特尔开源AI软件版图

如上图所示,这是英特尔使用开源AI软件加速开发的版图,他强调,英特尔致力于提供全栈的解决方案,从最底层的算法开源项目帮助用户更高效开发计算库,再到上层各种机器学习或者深度学习的框架,再到最上层,英特尔也提供了一些开源工具包,目的是帮助应用开发人员更高效的开发基于深度学习的应用。

趋势 | 大数据分析和AI平台融为一体

据雷锋网了解,业内大数据分析和AI平台产品并不少,英特尔这类将大数据分析和AI平台融为一体的模式正成为行业新趋势。

第一,对于大多数用户来说,尤其在生产系统当中,基于Apache Spark这样的大数据集群仍然是所有的生产数据以及包括大量硬件资源的聚集地,如何更高效利用生产数据以及硬件资源,能够将新的人工智能的应用支持起来成为新挑战。

第二,要构建一个工业级端到端的大数据分析+人工智能应用,并不是说训练一个模型就可以完成的事情,其是一个非常复杂的流水线或者工作流。从数据的收集、导入、处理、特征的提取、各种模型的构建训练,到最后的部署、推理等等,是一个非常复杂的工作流。

“我们能够帮助用户可以将这一个样端到端的大数据处理分析加上机器学习的工作流能够非常方便地构建出来,从而大大能够提高了用户的开发效率、部署效率和运维效率”,戴金权介绍道。

与过去数年相比,深度学习和人工智能应用场景更加广泛,要处理的数据也更加广泛,所以客观要求使用者构建端到端的大数据处理分析加上机器学习、深度学习的统一流水线。英特尔观察到,客户有越来越多的类似需求。

“我们有很多用户是来自于很多非常大的互联网公司或者是大的企业里面的传统实验室,他慢慢的也会发现,当构建了一些人工智能深度学习的框架和模型之后,怎么样能够很好的真正跑到生产系统上去,能将生产数据在上面跑起来。这是用户来使用英特尔Analytics Zoo一个很重要的出发点。”

此外,Analytics Zoo的用户也不乏硬件的OEM的厂商、软件提供商、公有云服务商等,英特尔现场展示出的客户包括浪潮、宝信、戴尔、阿里云和腾讯云等。

核心 | 端到端应用场景塑造

TB1jAMQarys3KVjSZFnXXXFzpXa.jpg

从深度学习模型到一个完整的工业级应用要多少步骤?如上戴金权在现场展示的PPT,黑色部分是核心的深度学习模型,但是周边有很多工作要完成,才能使之运行起来。

深度学习的模型只是整个流程的一部分,要构建和应用深度学习模型,还有数据的导入、数据清洗、特征提取、对整个集群的资源的管理和各个应用之间对这个资源的共享等,这些工作事实上占据了机器学习或者深度学习的一个工业级应用开发大部分的时间和资源。所以,数据处理、机器学习,以及算法必须很好地和现有的大数据处理的工作流整合在一起。

这也是构建一个端到端的应用场景所面临的问题,在没有一个统一的大数据分析+AI平台之前,需要人工把很多不同的框架拼凑起来。

另外很多用户开发一般都是从单机开始,当需要处理更多数据的时候,就需要跑到一个大规模分布式环境,甚至到一个生产环境里去。

从Analytics Zoo的角度,第一,英特尔能够将不同的框架无缝的集成到流水线里面去,通过在软件层上面各种新的支持或者功能,能够将TensorFlow、Spark能够非常无缝的集成在一个程序里面,在一个Spark程序里面直接嵌入TensorFlow的Code,然后一起运行起来,这其实对很多用户来说很有吸引力。

第二是在开发过程中,因为底层运行在Spark这样的引擎上,上面可以嵌入各种深度学习的功能,它可以运行在一个单机的环境,也可以跑到一个分布式环境里面去,用户也可以直接访问生产数据。

“很多用户之所以想用Analytics Zoo,就是它可以直接构建端到端的,跟生产系统几乎一致的原型。这是我们的一个主要出发点,可以帮助用户将整个的大数据分析+人工智能的应用很方便的将端到端的流水线构建出来,而且它可以很方便的从用户的笔记本运行到集群、运行到用户的生产环境当中去,这是英特尔在底层Analytics Zoo这个平台里所做的工作”,戴金权总结道。

Analytics Zoo是为了大数据平台所优化的,今天大数据平台基本都运行在非常大规模的英特尔至强处理器上,或许是几十、几百、几千个节点,但是英特尔使用了大量的底层优化的框架和库,像MKL-DNN、OpenVINO等等,将来会通过英特尔One API这样的生态系统输出。

戴金权提到,当在英特尔的生态系统上构建一个人工智能开发平台时,带来的好处就是底层能够支持英特尔各种硬件的加速,不管是至强服务器,包括像Movidius、FPGA,神经网络处理器,还有将来的独立显卡,都可以通过One API下面的底层生态系统来给上层的平台和应用所使用。

雷锋网(公众号:雷锋网)总结,Analytics Zoo能够将各种不同的模块不同的框架下统一到一个端到端流水线上,提高客户开发部署大数据分析和深度学习的能力,这在如今深度学习或者机器学习越泛化的背景下十分重要,英特尔的工作能够让用户减少人工智能应用的开发环节,快速推向现实场景。

相关文章:

英特尔首次向其投资者谈论一个不为人知的“秘密”

腾讯X英特尔:巨头联手如何掘金5G&MEC?

英特尔以数据为中心的竞争优势是什么?BATJ有个共同的观点

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
2月前
|
人工智能
巧妙构建歌词结构:写歌词的技巧和方法之关键,妙笔生词AI智能写歌词软件
在音乐世界里,歌词是灵魂的载体,构建其结构至关重要。优秀的歌词需有引人入胜的开头、条理清晰且富变化的主体,以及深刻难忘的结尾。《妙笔生词智能写歌词软件》提供多种功能,帮助创作者克服结构难题,激发灵感,助你写出打动人心的歌词,开启音乐创作的新篇章。
|
1月前
|
人工智能 前端开发 Java
基于开源框架Spring AI Alibaba快速构建Java应用
本文旨在帮助开发者快速掌握并应用 Spring AI Alibaba,提升基于 Java 的大模型应用开发效率和安全性。
基于开源框架Spring AI Alibaba快速构建Java应用
|
1月前
|
存储 人工智能 分布式计算
大数据& AI 产品月刊【2024年10月】
大数据& AI 产品技术月刊【2024年10月】,涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。
|
1月前
|
人工智能 运维 NoSQL
云栖大会|多模+一体化,构建更高效的AI应用
在2024年云栖大会「NoSQL数据库」专场,多位知名企业和阿里云瑶池数据库团队的技术专家,共同分享了阿里云Lindorm、Tair、MongoDB和MyBase的最新进展与实践。Tair推出Serverless KV服务,解决性能瓶颈和运维难题;Lindorm助力AI和具身智能时代的多模数据处理;MongoDB云原生化提升开发效率;MyBase One打破云边界,提供云边端一体化服务。这些技术进展和最佳实践,展示了阿里云在NoSQL数据库领域的创新能力和广泛应用前景。
|
29天前
|
机器学习/深度学习 人工智能 搜索推荐
AI与体育训练:运动表现分析
【10月更文挑战第31天】本文探讨了AI在体育训练中的应用,特别是在运动表现分析方面。通过数据收集与处理、深度分析与挖掘、实时反馈与调整三个环节,AI为运动员和教练提供了高效、个性化的训练计划和比赛策略,显著提升了训练效率和比赛成绩。未来,AI将在数据隐私、情感理解及跨学科合作等方面继续发展,为体育事业带来更多可能性。
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
探索AI驱动的个性化学习平台构建###
【10月更文挑战第29天】 本文将深入探讨如何利用人工智能技术,特别是机器学习与大数据分析,构建一个能够提供高度个性化学习体验的在线平台。我们将分析当前在线教育的挑战,提出通过智能算法实现内容定制、学习路径优化及实时反馈机制的技术方案,以期为不同背景和需求的学习者创造更加高效、互动的学习环境。 ###
58 3
|
2月前
|
机器学习/深度学习 人工智能 运维
智能运维:大数据与AI的融合之道###
【10月更文挑战第20天】 运维领域正经历一场静悄悄的变革,大数据与人工智能的深度融合正重塑着传统的运维模式。本文探讨了智能运维如何借助大数据分析和机器学习算法,实现从被动响应到主动预防的转变,提升系统稳定性和效率的同时,降低了运维成本。通过实例解析,揭示智能运维在现代IT架构中的核心价值,为读者提供一份关于未来运维趋势的深刻洞察。 ###
98 10
|
2月前
|
人工智能 API 决策智能
swarm Agent框架入门指南:构建与编排多智能体系统的利器 | AI应用开发
Swarm是OpenAI在2024年10月12日宣布开源的一个实验性质的多智能体编排框架。其核心目标是让智能体之间的协调和执行变得更轻量级、更容易控制和测试。Swarm框架的主要特性包括轻量化、易于使用和高度可定制性,非常适合处理大量独立的功能和指令。【10月更文挑战第15天】
290 6
|
2月前
|
人工智能
写歌词的技巧和方法:构建独特歌词结构的策略,妙笔生词AI智能写歌词软件
歌词创作如同搭建艺术殿堂,独特的歌词结构是其基石。掌握构建策略,让你的歌词脱颖而出。开头营造神秘氛围或出人意料的情感,主体部分采用倒叙、插叙或融合矛盾情感,结尾带来情感反转或深邃思考。《妙笔生词智能写歌词软件》提供 AI 智能写词、押韵优化等功能,助你轻松获取灵感,打造独特歌词结构。
|
2月前
|
人工智能 NoSQL 测试技术
使用 MongoDB 构建 AI:Patronus 如何自动进行大语言模型评估来增强对生成式 AI 的信心
若需了解更多MongoDB Atlas相关内容,可前往:https://www.mongodb.com/zh-cn/atlas
使用 MongoDB 构建 AI:Patronus 如何自动进行大语言模型评估来增强对生成式 AI 的信心