AI 工程化发展及趋势-AI 架构师成长计划(一)|学习笔记

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 快速学习 AI 工程化发展及趋势-AI 架构师成长计划(一)。

开发者学堂课程【PAL 平台学习路线:机器学习入门到应用AI 工程化发展及趋势-AI 架构师成长计划(一)】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/855/detail/14132


AI 工程化发展及趋势-AI 架构师成长计划(一)

 

内容介绍:

一、课程介绍

二、人工智能行业发展趋势

三、AI

 

一、课程介绍

Science 和 Intel 合办的架构师成长计划的 program。

扩展内容,其实大数据和 AI 的工程有它的相关性,这个也是为什么我们像我们这种做分布式大数据的。比如像 Jeff Dean 其实也是类似的一个趋势,先是做大规模的分布式系统以及存储系统,计算系统。慢慢演进到的 AI 系统。

1.目录

(1)首先我会讲一下人工智能的趋势,以及这个趋势背景下对于工程需求的要求。

(2)从深度学习和机器学习两个大方面来阐述在这两个大的板块上面,对于 AI 架构师的要求和思路。

(3)AI工程在阿里云上案例


二、人工智能行业发展趋势

1.人工智能发展史

 image.png

人工智能行业的发展趋势,其实人工智能已经从上个世纪50年代,从图灵测试起,大家都在想怎么样能够将智能赋能给机器。其实人工智能到今天有三波的热潮。

(1)第一次浪潮

最开始有一波热潮。是怎么做逻辑推理的理论。因为受限于算法及模型的局限。大家发现推理出来的机器人虽然能够做一些有趣的任务,但是他还是像儿童一样的,他的智能还是非常的弱。

(2)重整旗鼓

在上个世纪80年代到90年代。这个诞生了很多的仿生的算法,或者说很多的算法的创新。包括现在大家耳熟能详的像神经网络、遗传算法、模拟退火。在那个时代都已经诞生出来了,有非常多的各种各样的算法。但是因为这个算法很多情况下,如果希望他能够有很好的效果,往往需要非常大量的数据量,在那个时候其实数据量的积累非常有限,也需要很昂贵的计算资源。那时候也没有这样的的资源,就造成我们虽然有想法,但是这个算法迟迟不能够得到一个很好的效果,或者说能够战胜人类的一个效果。

(3)现代 AI 的曙光

在近50年,在最近的五年或者是十年是一个人工智能爆发的时代,是因为随着人类的工业的提高,摩尔定律不断的去推动硬件的能力的提高。使得我们拥有了海量的计算能力。

同时因为互联网的发展,大家都会在互联网上去做自己日常需要的事情,就像现在看到的,你已经离不开互联网了,因为在互联网上进行购物,会进行订餐,叫车,出行服务,旅游等等,这所有的数据其实都会在互联网上进行有效的积累,正是因为这么大的数据的积累,再加上算例使得我们有机会能够去训练更好的模型。而这个模型的结果在近十年已经开始在某些领域能够去战胜人类。包括视觉,包括有一些细分场景的语言类或是语音类的场景。语音类的场景。

(4) 所以人工智能在诞生60年后进入了一个快速增长的爆发期。现代科技大家非常耳熟能详的热词就是大数据以及 AI 。我们在 AI 上已经投射到各个行业。我们都在想怎么样利用 AI 革命这个行业,或者说充分的去加速行业效率的提升。包括我们在语音识别有一些人工智能、机器人、城市大脑、图像识别、智能家居、影像。有一些医学辅助、智能出行、翻译、无人机等等。

image.png 

2.人工智能行业要素

(1)三要素

这个背后因为人工智能的三要素在发挥作用,数据、计算力和算法,这是因为有了很大的数据以及计算算力。虽然在大类的算法上面,包括我们的神经网络、模拟退火,好像算法的大类没有太多的变化。

(2)创新发展

当然也有很多创新,但我们好像还是用着80年代,90年代的算法,但是我们在模型结构上面,包括神经网络,现在的深度学习非常热。但神经网络的结构上面我们其实有了大量的能力去进行各种探索,比如说我们可能在 CV 上面探索各种各样的网络,然后在 NLP 上面我们从 BiLSTM 有 sequence to sequence,以及现在的 BERT 模型等等。这是因为有计算力,使得算法工程师能够非常快速地尝试各种各样的想法,使得我们的算法的更新也非常快,所以使得人工智能行业得到快速的发展。

 

3.AI 发展方向

人工智能现在的发展的方向,正是因为我们刚刚说的那些前提条件使得现在的人工智能

 image.png

(1)应用

第一,他在应用上是无所不无处不在的,他有小型化,有大型化,所谓的小型化就是说,人工智能可以部署在非常多的端的设备上,我们一般叫做 IOT,你的手机其实是一个很 Powerful 的端,除了这个之外,其实还可以部署在很小的设备上面。比如说家里面的智能家居,这些东西都开始具有了一些智能化。但同时也有一些大型化,所谓的大型化,比如说城市有一个决策中心。这个中心我们称之为城市大脑,模型会非常的大,我们其实是因为硬件的提高。能够负担得起这么大型化的模型的,所以像现在大家可能会听到过  GTP-3这样的模型,已经达到了1750亿的参数的规模。应用其实是无处不在的。

(2)工程化

第二是工程化,正是因为人工智能的爆发,现在对于工程的要求其实是越来越高了。因为大家都希望自己的想法,自己的一些算法能够快速的进行落地。能够快速的去迭代,能够快速的推到我们的消费者端。如何把研究员的设想快速的变成可用状态。这个方面其实是 AI 工程起到很大的作用,大家可以看到随 AI 的爆发。

AI 工程诞生很多框架,框架的迭代也非常快。从早期的 Caffe 到中间有很多的深度学习框架。包括 Theano 、Kaldi 等等,到了后面非常流行的像 TensorFlow 的推出,去注重训推一体,训练和推理的联动,到后面像 PyTorch 注重研究性质,注重模型的开发的迭代效率等等。AI 的工程一直是在应用性上面以及自动化上面,去做很多的工作。在阿里我们会强调云其实对于 AI 也是非常重要的,我们刚刚说到其实在 AI 的爆发是因为海量大数据在支持,这个数据要存在哪,显然让存在你本地有的时候是很难的,你需要有一个分布式的存储。

云的平台给了大家这么一个很好的弹性的环境。使得你能够很好的做大规模的数据的处理分析,同时 AI 工程因为大量的用到了易购的机器这些东西,您可以通过它的弹性去帮助 AI 的企业。能够快速的去迭代自己的模型,能更快速的去引进自己的模型,所以平台的支持和云化也是 AI 工程的一个非常明显的趋势。

(3)模型的研发和迭代效率加快

第三是模型的研发和迭代效率在加快, CV 和 NLP 模型的迭代是非常快的,也是人类对于精度和性能的不断要求。因为应用场景都非常的大。所以模型的迭代和效率的提升,能够带来巨大的商业的价值。所以迭代的速度会快。

(4)算法和算力

算法和算力,因为算例能够推动创新。新算法的更新也非常快。实时化的要求也在增加。我等一下会说到更细分的场景。对于实时化的模型的需求,我们现在看到的一个趋势就是 Online learning,特别是对于所谓的搜索、推荐和广告行业是非常明显的需求。

(5)数据积累推动新算法的落地

数据的积累能够推动算法达到这样的高度的一个前提条件。我们一直都说其实数据才定义了模型的高度,而算法其实只是让这个模型去逼近数据能够定义的高度。

 

三、AI

1.AI 无处不在

其实就更多的展开了,应用无处不在,部署其实也是无处不在的,下面就需要我们有平台,需要有框架的支持。

不然你不可能支持这么多含量的业务,这么多含量的设备,如果还是按照原来的一种模式,算法的同学涉及到一个算法,我们根据这个算法的模型,手工的去写一套执行的框架。这样子完全不 scale,不能够在发展的行业上快速开展。工程的可复制性太差,不太 scale,所以我们必须要有很好的框架的支持。

image.png

2.技术易用性加速 AI 自动化发展

技术上面我们越来越强调 AI 的自动化,就会用很多的技术去提高自动化,包括通过编译优化,包括通过分布式的方式,甚至是更进一步的向 Auto machine learning 帮助我们的算法工程师,使得他们更加的 focus 聚焦业务的算法的本身,而由系统来去帮助他去做高校的执行。所以从 AI 的工程或者从 AI 架构师,至少我本人的愿景是我们需要去做很好的 AI 的自动化。

image.png

3.AI 自动化技术:编译优化

AI 的自动化的核心概念,就是希望把算法工程师从复杂的分布式环境以及从复杂的工程中解放出来。使得他去注重他要去做什么,而不要去注重他要怎么做,怎么去做由 AI 的工程系统去帮助他达到高可用。大规模的分布式训练,高性能的推理以及低成本的状态

image.png

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
1月前
|
人工智能 运维 安全
AI 安全架构概述
AI 安全架构涵盖数据采集、模型训练、推理部署等阶段,确保安全性、隐私与合规。其核心组件包括数据层、模型层、推理层、应用层和运维层,针对数据安全威胁(如数据投毒)、模型窃取、对抗攻击及系统漏洞等风险,提出数据加密、对抗训练、联邦学习等防御策略,并强调开发前、开发中和部署后的最佳实践,以降低 AI 解决方案的安全风险。
149 13
|
2天前
|
人工智能 Cloud Native Serverless
万字长文告诉你如何基于MCP实现AI应用架构新范式转型
本文介绍了企业如何利用MCP(Model Context Protocol)实现AI应用架构的新范式转型。
万字长文告诉你如何基于MCP实现AI应用架构新范式转型
|
13天前
|
机器学习/深度学习 人工智能 并行计算
AI部署架构:A100、H100、A800、H800、H20的差异以及如何选型?开发、测试、生产环境如何进行AI大模型部署架构?
AI部署架构:A100、H100、A800、H800、H20的差异以及如何选型?开发、测试、生产环境如何进行AI大模型部署架构?
AI部署架构:A100、H100、A800、H800、H20的差异以及如何选型?开发、测试、生产环境如何进行AI大模型部署架构?
|
3天前
|
人工智能 Cloud Native Serverless
从理论到落地:MCP 实战解锁 AI 应用架构新范式 | 免费领取 78 页完整 PPT
本文旨在从 MCP 的技术原理、降低 MCP Server 构建复杂度、提升 Server 运行稳定性等方面出发,分享我们的一些实践心得。
|
11天前
|
人工智能 计算机视觉 开发者
Meta开源多模态AI新王炸!Llama 4:MoE架构仅用17B参数碾压Gemma 3,支持1000万token上下文
Meta最新开源的Llama 4系列多模态AI模型,采用混合专家架构,支持200种语言处理,最高达2万亿参数规模,在语言理解、图像分析和代码生成等任务中展现突破性性能。
77 0
Meta开源多模态AI新王炸!Llama 4:MoE架构仅用17B参数碾压Gemma 3,支持1000万token上下文
|
21天前
|
人工智能 架构师 前端开发
手把手体验通义灵码2.0:AI程序员如何让我从“调参侠”进阶“架构师”?
通义灵码2.0是一款强大的AI编程工具,帮助开发者从“调参侠”进阶为“架构师”。它通过跨语言开发支持、智能单元测试生成和图生代码等功能,大幅提升开发效率。例如,将Python数据处理函数一键转为React+ECharts组件,自动生成单元测试用例,甚至通过草图生成前端布局代码。此外,新增的QwQ模型具备“代码脑补”能力,可推荐性能优化策略。尽管功能强大,但仍需注意环境隔离与代码审查,避免过度依赖。通义灵码2.0不仅是工具,更是开发者的“外接大脑”。
78 8
|
22天前
|
机器学习/深度学习 人工智能 自然语言处理
AI训练师入行指南(三):机器学习算法和模型架构选择
从淘金到雕琢,将原始数据炼成智能珠宝!本文带您走进数字珠宝工坊,用算法工具打磨数据金砂。从基础的经典算法到精密的深度学习模型,结合电商、医疗、金融等场景实战,手把手教您选择合适工具,打造价值连城的智能应用。掌握AutoML改装套件与模型蒸馏术,让复杂问题迎刃而解。握紧算法刻刀,为数字世界雕刻文明!
69 6
|
27天前
|
人工智能 前端开发 Java
DDD四层架构和MVC三层架构的个人理解和学习笔记
领域驱动设计(DDD)是一种以业务为核心的设计方法,与传统MVC架构不同,DDD将业务逻辑拆分为应用层和领域层,更关注业务领域而非数据库设计。其四层架构包括:Interface(接口层)、Application(应用层)、Domain(领域层)和Infrastructure(基础层)。各层职责分明,避免跨层调用,确保业务逻辑清晰。代码实现中,通过DTO、Entity、DO等对象的转换,结合ProtoBuf协议,完成请求与响应的处理流程。为提高复用性,实际项目中可增加Common层存放公共依赖。DDD强调从业务出发设计软件,适应复杂业务场景,是微服务架构的重要设计思想。
|
4月前
|
自然语言处理 JavaScript Java
《鸿蒙HarmonyOS应用开发从入门到精通(第2版)》学习笔记——HarmonyOS架构介绍
HarmonyOS采用分层架构设计,从下至上分为内核层、系统服务层、框架层和应用层。内核层支持多内核设计与硬件驱动;系统服务层提供核心能力和服务;框架层支持多语言开发;应用层包括系统及第三方应用,支持跨设备调度,确保一致的用户体验。
253 81
|
1月前
|
人工智能 运维 监控
领先AI企业经验谈:探究AI分布式推理网络架构实践
当前,AI行业正处于快速发展的关键时期。继DeepSeek大放异彩之后,又一款备受瞩目的AI智能体产品Manus横空出世。Manus具备独立思考、规划和执行复杂任务的能力,其多智能体架构能够自主调用工具。在GAIA基准测试中,Manus的性能超越了OpenAI同层次的大模型,展现出卓越的技术实力。

热门文章

最新文章