AI 工程化发展及趋势-AI 架构师成长计划(一)|学习笔记

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 快速学习 AI 工程化发展及趋势-AI 架构师成长计划(一)。

开发者学堂课程【PAL 平台学习路线:机器学习入门到应用AI 工程化发展及趋势-AI 架构师成长计划(一)】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/855/detail/14132


AI 工程化发展及趋势-AI 架构师成长计划(一)

 

内容介绍:

一、课程介绍

二、人工智能行业发展趋势

三、AI

 

一、课程介绍

Science 和 Intel 合办的架构师成长计划的 program。

扩展内容,其实大数据和 AI 的工程有它的相关性,这个也是为什么我们像我们这种做分布式大数据的。比如像 Jeff Dean 其实也是类似的一个趋势,先是做大规模的分布式系统以及存储系统,计算系统。慢慢演进到的 AI 系统。

1.目录

(1)首先我会讲一下人工智能的趋势,以及这个趋势背景下对于工程需求的要求。

(2)从深度学习和机器学习两个大方面来阐述在这两个大的板块上面,对于 AI 架构师的要求和思路。

(3)AI工程在阿里云上案例


二、人工智能行业发展趋势

1.人工智能发展史

 image.png

人工智能行业的发展趋势,其实人工智能已经从上个世纪50年代,从图灵测试起,大家都在想怎么样能够将智能赋能给机器。其实人工智能到今天有三波的热潮。

(1)第一次浪潮

最开始有一波热潮。是怎么做逻辑推理的理论。因为受限于算法及模型的局限。大家发现推理出来的机器人虽然能够做一些有趣的任务,但是他还是像儿童一样的,他的智能还是非常的弱。

(2)重整旗鼓

在上个世纪80年代到90年代。这个诞生了很多的仿生的算法,或者说很多的算法的创新。包括现在大家耳熟能详的像神经网络、遗传算法、模拟退火。在那个时代都已经诞生出来了,有非常多的各种各样的算法。但是因为这个算法很多情况下,如果希望他能够有很好的效果,往往需要非常大量的数据量,在那个时候其实数据量的积累非常有限,也需要很昂贵的计算资源。那时候也没有这样的的资源,就造成我们虽然有想法,但是这个算法迟迟不能够得到一个很好的效果,或者说能够战胜人类的一个效果。

(3)现代 AI 的曙光

在近50年,在最近的五年或者是十年是一个人工智能爆发的时代,是因为随着人类的工业的提高,摩尔定律不断的去推动硬件的能力的提高。使得我们拥有了海量的计算能力。

同时因为互联网的发展,大家都会在互联网上去做自己日常需要的事情,就像现在看到的,你已经离不开互联网了,因为在互联网上进行购物,会进行订餐,叫车,出行服务,旅游等等,这所有的数据其实都会在互联网上进行有效的积累,正是因为这么大的数据的积累,再加上算例使得我们有机会能够去训练更好的模型。而这个模型的结果在近十年已经开始在某些领域能够去战胜人类。包括视觉,包括有一些细分场景的语言类或是语音类的场景。语音类的场景。

(4) 所以人工智能在诞生60年后进入了一个快速增长的爆发期。现代科技大家非常耳熟能详的热词就是大数据以及 AI 。我们在 AI 上已经投射到各个行业。我们都在想怎么样利用 AI 革命这个行业,或者说充分的去加速行业效率的提升。包括我们在语音识别有一些人工智能、机器人、城市大脑、图像识别、智能家居、影像。有一些医学辅助、智能出行、翻译、无人机等等。

image.png 

2.人工智能行业要素

(1)三要素

这个背后因为人工智能的三要素在发挥作用,数据、计算力和算法,这是因为有了很大的数据以及计算算力。虽然在大类的算法上面,包括我们的神经网络、模拟退火,好像算法的大类没有太多的变化。

(2)创新发展

当然也有很多创新,但我们好像还是用着80年代,90年代的算法,但是我们在模型结构上面,包括神经网络,现在的深度学习非常热。但神经网络的结构上面我们其实有了大量的能力去进行各种探索,比如说我们可能在 CV 上面探索各种各样的网络,然后在 NLP 上面我们从 BiLSTM 有 sequence to sequence,以及现在的 BERT 模型等等。这是因为有计算力,使得算法工程师能够非常快速地尝试各种各样的想法,使得我们的算法的更新也非常快,所以使得人工智能行业得到快速的发展。

 

3.AI 发展方向

人工智能现在的发展的方向,正是因为我们刚刚说的那些前提条件使得现在的人工智能

 image.png

(1)应用

第一,他在应用上是无所不无处不在的,他有小型化,有大型化,所谓的小型化就是说,人工智能可以部署在非常多的端的设备上,我们一般叫做 IOT,你的手机其实是一个很 Powerful 的端,除了这个之外,其实还可以部署在很小的设备上面。比如说家里面的智能家居,这些东西都开始具有了一些智能化。但同时也有一些大型化,所谓的大型化,比如说城市有一个决策中心。这个中心我们称之为城市大脑,模型会非常的大,我们其实是因为硬件的提高。能够负担得起这么大型化的模型的,所以像现在大家可能会听到过  GTP-3这样的模型,已经达到了1750亿的参数的规模。应用其实是无处不在的。

(2)工程化

第二是工程化,正是因为人工智能的爆发,现在对于工程的要求其实是越来越高了。因为大家都希望自己的想法,自己的一些算法能够快速的进行落地。能够快速的去迭代,能够快速的推到我们的消费者端。如何把研究员的设想快速的变成可用状态。这个方面其实是 AI 工程起到很大的作用,大家可以看到随 AI 的爆发。

AI 工程诞生很多框架,框架的迭代也非常快。从早期的 Caffe 到中间有很多的深度学习框架。包括 Theano 、Kaldi 等等,到了后面非常流行的像 TensorFlow 的推出,去注重训推一体,训练和推理的联动,到后面像 PyTorch 注重研究性质,注重模型的开发的迭代效率等等。AI 的工程一直是在应用性上面以及自动化上面,去做很多的工作。在阿里我们会强调云其实对于 AI 也是非常重要的,我们刚刚说到其实在 AI 的爆发是因为海量大数据在支持,这个数据要存在哪,显然让存在你本地有的时候是很难的,你需要有一个分布式的存储。

云的平台给了大家这么一个很好的弹性的环境。使得你能够很好的做大规模的数据的处理分析,同时 AI 工程因为大量的用到了易购的机器这些东西,您可以通过它的弹性去帮助 AI 的企业。能够快速的去迭代自己的模型,能更快速的去引进自己的模型,所以平台的支持和云化也是 AI 工程的一个非常明显的趋势。

(3)模型的研发和迭代效率加快

第三是模型的研发和迭代效率在加快, CV 和 NLP 模型的迭代是非常快的,也是人类对于精度和性能的不断要求。因为应用场景都非常的大。所以模型的迭代和效率的提升,能够带来巨大的商业的价值。所以迭代的速度会快。

(4)算法和算力

算法和算力,因为算例能够推动创新。新算法的更新也非常快。实时化的要求也在增加。我等一下会说到更细分的场景。对于实时化的模型的需求,我们现在看到的一个趋势就是 Online learning,特别是对于所谓的搜索、推荐和广告行业是非常明显的需求。

(5)数据积累推动新算法的落地

数据的积累能够推动算法达到这样的高度的一个前提条件。我们一直都说其实数据才定义了模型的高度,而算法其实只是让这个模型去逼近数据能够定义的高度。

 

三、AI

1.AI 无处不在

其实就更多的展开了,应用无处不在,部署其实也是无处不在的,下面就需要我们有平台,需要有框架的支持。

不然你不可能支持这么多含量的业务,这么多含量的设备,如果还是按照原来的一种模式,算法的同学涉及到一个算法,我们根据这个算法的模型,手工的去写一套执行的框架。这样子完全不 scale,不能够在发展的行业上快速开展。工程的可复制性太差,不太 scale,所以我们必须要有很好的框架的支持。

image.png

2.技术易用性加速 AI 自动化发展

技术上面我们越来越强调 AI 的自动化,就会用很多的技术去提高自动化,包括通过编译优化,包括通过分布式的方式,甚至是更进一步的向 Auto machine learning 帮助我们的算法工程师,使得他们更加的 focus 聚焦业务的算法的本身,而由系统来去帮助他去做高校的执行。所以从 AI 的工程或者从 AI 架构师,至少我本人的愿景是我们需要去做很好的 AI 的自动化。

image.png

3.AI 自动化技术:编译优化

AI 的自动化的核心概念,就是希望把算法工程师从复杂的分布式环境以及从复杂的工程中解放出来。使得他去注重他要去做什么,而不要去注重他要怎么做,怎么去做由 AI 的工程系统去帮助他达到高可用。大规模的分布式训练,高性能的推理以及低成本的状态

image.png

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
2月前
|
人工智能 监控 前端开发
支付宝 AI 出行助手高效研发指南:4 人团队的架构迁移与提效实战
支付宝「AI 出行助手」是一款集成公交、地铁、火车票、机票、打车等多项功能的智能出行产品。
369 21
支付宝 AI 出行助手高效研发指南:4 人团队的架构迁移与提效实战
|
2月前
|
存储 弹性计算 运维
AI时代下阿里云基础设施的稳定性架构揭秘
计算、存储、网络作为云计算基础 IaaS 服务,一直是阿里云的核心产品,承载着百万客户的 IT 基础设施。曾经我们认为应用高可用、服务分布式可以满足客户对 IaaS 所有的稳定性诉求。
357 2
AI时代下阿里云基础设施的稳定性架构揭秘
|
2月前
|
机器学习/深度学习 人工智能 监控
大型动作模型LAM:让企业重复任务实现80%效率提升的AI技术架构与实现方案
大型动作模型(LAMs)作为人工智能新架构,融合神经网络与符号逻辑,实现企业重复任务的自动化处理。通过神经符号集成、动作执行管道、模式学习、任务分解等核心技术,系统可高效解析用户意图并执行复杂操作,显著提升企业运营效率并降低人工成本。其自适应学习能力与上下文感知机制,使自动化流程更智能、灵活,为企业数字化转型提供坚实支撑。
193 0
大型动作模型LAM:让企业重复任务实现80%效率提升的AI技术架构与实现方案
|
3月前
|
存储 设计模式 人工智能
AI Agent安全架构实战:基于LangGraph的Human-in-the-Loop系统设计​
本文深入解析Human-in-the-Loop(HIL)架构在AI Agent中的核心应用,探讨其在高风险场景下的断点控制、状态恢复与安全管控机制,并结合LangGraph的创新设计与金融交易实战案例,展示如何实现效率与安全的平衡。
447 0
|
9天前
|
人工智能 自然语言处理 安全
AI助教系统:基于大模型与智能体架构的新一代教育技术引擎
AI助教系统融合大语言模型、教育知识图谱、多模态交互与智能体架构,实现精准学情诊断、个性化辅导与主动教学。支持图文语音输入,本地化部署保障隐私,重构“教、学、评、辅”全链路,推动因材施教落地,助力教育数字化转型。(238字)
|
5天前
|
人工智能 JavaScript 前端开发
GenSX (不一样的AI应用框架)架构学习指南
GenSX 是一个基于 TypeScript 的函数式 AI 工作流框架,以“函数组合替代图编排”为核心理念。它通过纯函数组件、自动追踪与断点恢复等特性,让开发者用自然代码构建可追溯、易测试的 LLM 应用。支持多模型集成与插件化扩展,兼具灵活性与工程化优势。
48 6
|
16天前
|
设计模式 人工智能 API
AI智能体开发实战:17种核心架构模式详解与Python代码实现
本文系统解析17种智能体架构设计模式,涵盖多智能体协作、思维树、反思优化与工具调用等核心范式,结合LangChain与LangGraph实现代码工作流,并通过真实案例验证效果,助力构建高效AI系统。
210 7

热门文章

最新文章