写在前面的话
大模型时代,算法工程师的发展趋势和技术拓展呈现出令人瞩目的前景。随着人工智能领域的迅猛发展和大规模模型的广泛应用,算法工程师也正处于一个充满机遇和挑战的时代,他们将在多领域交叉中发挥作用,担负着推动人工智能技术前进的重要使命。那么在下面的博客中,洲洲将结合合合信息一些直播内容与核心企业思想探讨几个关键点,窥探算法工程师在大模型时代的未来走向。
一、人工智能算法工程师的每个阶段是怎么样的?
阶段一:模式识别阶段
在深度学习大规模应用前的2000年至2012年期间,被称为模式识别阶段的时期,人工智能领域正处于一个探索和发展的初级阶段。在这个时期,深度学习尚未出现,而对于人工智能的定义也没有达成明确共识。这一阶段着重于研究和应用各种模式识别技术,旨在解决不同专业方向中的特定问题。然而,由于技术水平和数据资源的限制,每个领域的模式识别都存在着显著的差异,例如在文字识别和人脸识别等方面,门槛普遍非常高。
在这个早期阶段,模式识别的研究主要集中在传统机器学习方法上,如支持向量机、隐马尔可夫模型和决策树等。虽然这些方法在某些任务上取得了一定的成果,但对于复杂的现实世界问题,其表现往往不尽如人意。这个阶段缺乏深度学习这样能够端到端人工智能算法模型,导致了在大规模应用和跨领域的挑战中遇到了瓶颈。
(1)传统机器学习--支持向量机
在机器学习中,向量机(SVM,Support Vector Machine)通常指的是一种用于分类和回归问题的监督学习算法。SVM 是由Vladimir Vapnik和Alexey Chervonenkis于1970年代末至1990年代末开发的。它在处理高维数据和复杂特征之间表现出色,并在许多实际问题中取得了显著的成功。
SVM 的基本原理是在高维空间中找到一个最优的超平面(或者说决策边界),将不同类别的样本点分隔开。在二分类问题中,这个超平面的目标是使两个类别中距离超平面最近的样本点之间的间隔最大化。这些距离最近的样本点被称为支持向量(Support Vectors),因此 SVM 的名称就是由此而来。
(2)传统机器学习--隐马尔可夫模型
隐马尔可夫模型(Hidden Markov Model,HMM)是一种用于建模序列数据的概率图模型。HMM主要用于描述随时间变化的状态序列和与之相对应的观测序列之间的概率关系。在HMM中,状态是不可观测的(隐藏的),而观测序列是可见的。模型假设存在一个隐藏的马尔可夫过程,该过程在一系列离散的时间步骤中演化,并根据状态生成对应的观测。
(3)新的开始!--AlexNet
2006年,一项重要的研究为深度学习的发展打开了新的大门。Geoffrey Hinton等人提出了深度置信网络(DBN)的概念,这是一种多层神经网络结构,能够自动从数据中提取特征。DBN的提出对于解决传统机器学习方法在处理复杂数据时的局限性具有重要意义。它为构建深度神经网络提供了理论支持和方法指导,为第二阶段深度学习的出现与兴起奠定了基础。
随后,在2012年,Hinton的学生Alex Krizhevsky等人在ImageNet图像分类竞赛中的惊人表现彻底改变了人工智能中算法模型的格局。Alex通过利用图形处理单元(GPU)等硬件加速技术,他们构建了一个深度卷积神经网络(CNN-AlexNet),在国际性人工智能大赛ImageNet比赛中打败了一众优秀知名的对手并最终斩获了冠军。
AlexNet是由Alex Krizhevsky 提出的首个应用于图像分类的深层卷积神经网络,该网络在2012年ILSVRC(ImageNet Large Scale Visual Recognition Competition)图像分类竞赛中以15.3%的top-5测试错误率赢得第一名。也是在那年之后,越来越多的神经网络模型被提出,比如优秀的VGG 、GoogLeNet。
AlexNet这一突破性成果引起了全球科学界和产业界对深度学习的广泛关注。CNN的出现不仅使得计算机能够高效处理图像识别任务,还显示出深度学习在处理复杂数据和实现人工智能的巨大潜力。这次胜利标志着深度学习时代的开启。从此以后,深度学习成为人工智能领域的热点话题,吸引了大量研究者的关注和投入。
深度学习的崛起不仅得益于算法和模型的改进,还依赖于计算硬件和海量数据的支持。随着计算机硬件性能的不断提升,特别是GPU等并行计算设备的发展,深度学习模型的训练速度得到了显著提升。此外,互联网和物联网的普及使得数据爆炸式增长,为深度学习提供了大量的训练数据,有助于模型的学习和泛化能力的提升。
阶段二:深度学习炼丹阶段
通过阶段一的积累与一些比赛中深度学习大放异彩,导致在2012年至2022年这个时期,深度学习的大规模应用掀起了一股浪潮,使得人工智能领域的算法研究门槛有了显著的降低。
这个时代被形象地称为“深度学习炼丹时期”,因为深度学习模型的广泛应用就像炼丹一样,在不断探索和优化中开创了人工智能的新纪元。随着开源数据集和算法的普及,更多的人可以参与到人工智能的研究中,而关注点也逐渐从模型的开发转向了如何更好地调参和充分利用算法的应用上。
深度学习与阶段一的传统机器学习模式识别阶段如下的一些差异性:
- 特征表示的学习
- 处理大规模数据
- 处理复杂问题
- 端到端学习
(1)深度学习模型--卷积神经网络CNN
卷积神经网络是一种用于图像处理和计算机视觉任务的深度学习模型。它通过多层卷积层和池化层来提取图像的局部特征,并通过全连接层和Softmax层进行分类。CNN在图像分类、目标检测、图像分割等领域取得了显著的成就,例如AlexNet、VGG、ResNet和Inception等模型。
(2)深度学习模型--循环神经网络RNN
循环神经网络是一种用于处理序列数据的深度学习模型。它在网络中引入循环连接,使得网络具有记忆性,可以处理变长序列数据。RNN在自然语言处理(NLP)和语音识别等任务中表现出色,例如用于机器翻译的Seq2Seq模型和用于文本生成的LSTM(Long Short-Term Memory)模型。
阶段三:大模型时代
从2022年开始,人工智能进入了一个全新的阶段,ChatGPT这样的大模型的出现彻底改变了人工智能算法的格局。这个时期可以被称为“人工智能大迸发时代”。在这个时代,各行各业开始迅速拥抱人工智能技术,算力和模型的不断提升为人工智能的应用带来了前所未有的机遇。
(1)GPT-4多模态模型
在今年ChatGPT元年起,微软在多模态模型领域持续发力,2月28日发表论文推出了全能型人工智能模型——Kosmos-1,和局限于纯文本内容(LLM)的ChatGPT相比,Kosmos-1主干基于Transformer的因果语言模型,属于多模态大型语言模型(MLLM),除了自然语言任务,能同时理解文字与图像内容,未来会整合更多的输入模式,如音频、视频。
(2)多元化应用落地
今年3月微软开源的了ChatGPT AI交互应用Visual ChatGPT,通过调用ChatGPT以及一系列视觉基础模型,实现了聊天过程中发送和接收图像,以及动态对图像进行处理,在ChatGPT的基础上拥有了 VQA 视觉问答 和AI作画的能力。Visual ChatGPT发布后短短一天,在Github就达到了4K+星。
三个不同阶段的工程师们差异点与共性
就上面三个阶段来说差异性如下:
• 在第一阶段,由于深度学习尚未普及,计算资源相对有限,算法工程师们训练大规模模型非常困难。算法工程师可能主要侧重于传统机器学习方法,如支持向量机、决策树等。技术背景相对较为传统。
• 到了第二阶段,随着深度学习的兴起,开源数据集和开源算法的普及使得算法工程师可以更轻松地获取数据和算法,并有更多机会进行实验和研究。算法工程师开始掌握深度学习技术,对神经网络和大模型的搭建和调参有更深入的了解。
• 在第三阶段,由于算力和模型的大迸发,云计算和分布式计算技术的普及为算法工程师提供了强大的支持。随着ChatGPT等大模型的出现,算法工程师需要具备更高级的自然语言处理技术和对大规模模型的训练和部署有更深刻的理解。
相应的,算法工程师们不变的共性我觉得是算法工程能力与持续学习能力,在三个阶段中,算法工程师们都需要保持持续学习的态度,算法工程师最必备的创新精神和解决问题的能力都是推动人工智能技术发展的关键。
人工智能领域中的优秀知名企业合合信息在其发展历程中也经历了上述三个阶段,这些阶段是其不断成长和壮大的过程。首先是垂直领域的研究阶段,这时企业需要专注于自身所处领域的提升与深入研究。在早期,合合信息专注于特定领域的解决方案,如图像处理与文字识别处理。通过集中资源和专业知识,公司积累了在特定领域的优势,为行业的发展做出了贡献。
随着神经网络与深度学习的出现,合合信息也率先对数据和算法展开持续性、深入性的理解与研究。这一时期,公司加大了对研究团队的投入,开展更深入的学术研究,探索更加复杂的算法和模型。对数据的收集、处理和标注变得至关重要,而深度学习等新兴算法的引入也帮助合合信息在行业市场领域上取得了重要突破。
大规模模型的出现使得算法工程师需要关注更高效的训练和推理策略,而丰富的数据源也为模型的泛化性能和稳定性提供了支撑。在这个阶段,合合信息也十分重视对算法工程师和工程团队的培养,着力于技术落地和实际应用。
合合信息作为人工智能领域的优秀企业,经历了垂直领域的研究、对数据和算法的持续性深入研究,以及大模型阶段的工程能力和数据源需求的深入研究。在每个阶段,公司都不断适应技术发展的脉搏,不断探索新的可能性,为人工智能的进步和应用做出了积极的贡献。随着人工智能领域不断发展,合合信息将继续引领科技创新的浪潮,为推动人工智能技术的进步和社会的发展做出更多努力。
当下除了算法工程师,还能从事哪些相关工作?
在大模型时代下,算法专业的学生们确实会面临一些焦虑,担心只有成为算法工程师这一条路,而且在大模型如此强大的情况下,是否能在算法领域找到自己的价值。
合合信息针对学生们普遍性的焦虑给出了如下建设性的回答:若我们从更宽的视角来看待算法的应用,就会发现,我们可以在算法周边开展的工作实际上非常广泛,能够拓宽我们的职业边界。
在大模型时代,如何将技术突破产业化成为一个重要的问题。我们可以从以下几个方面来优化和拓展算法专业学生的职业选择:首先,大模型的出现带来了对算法模型的理解和调参技巧的需求,提示工程师成为一个炙手可热的职业。在美国,已经有招聘提示工程师。提示工程师必须对大模型机理有深刻的理解,这样才能发挥出对应的价值。如下图中近期大火的AI人工智能工程师。
大模型时代下的产品经理也成为非常重要的角色。产品经理需要理解大模型算法原理,基于大模型从用户和市场的角度设计满足需求的产品。当前时代的一个产品设计范式的变化是将复杂的流程简化为只有一个对话框,这需要产品经理对大模型技术的了解和应用。
同时,在大模型时代,售前和市场团队负责解释和宣传算法产品,这样才能更好地向客户解释产品的功能和优势,扩大产品的影响力。数据工程师在收集和处理数据方面也扮演着重要角色,保证模型训练和优化的顺利进行。
除了以上几个例子,大模型的广泛应用还带来了诸如模型监测与解释专家、模型安全专家、模型可解释性研究者等新的职业机会。
二、大模型时代下,算法工程师及转型需要具备什么能力?
大模型时代下优秀的算法工程师应该具备的优秀特质
合合信息认为,算法工程师应当具备如下几个主要的优秀特质!~
对算法理解的能力:算法工程师需要深刻理解不同类型的算法,包括传统机器学习算法和深度学习算法,了解其原理和适用场景。对于大模型,必须掌握复杂的神经网络结构、激活函数、损失函数等,以及参数调优和优化方法。只有深刻理解算法的本质,才能在实际应用中灵活选择和调整算法,使其发挥最佳性能。
对数据理解的能力:在大模型时代,数据是算法的基石。算法工程师需要具备对数据的深刻理解和处理能力。这包括对数据的质量、规模、特征的认知,能够进行数据预处理、特征工程等,以提升模型性能和泛化能力。同时,对于大规模数据的处理,算法工程师需要掌握分布式计算和存储技术,以高效处理海量数据。
算法工程能力:算法工程师需要具备高效的算法实现和工程化能力。这包括熟悉常用的深度学习框架和库,能够灵活搭建、训练和优化大模型。同时,要熟悉分布式计算环境和GPU加速等技术,以提高模型训练和推理的效率。此外,算法工程师还需掌握模型监测与解释、模型可解释性等技术,确保模型的可靠性和可解释性。
转型时怎么进行已有算法知识能力迁移?
首先关于这个问题,合合信息指出在大模型时代下,已有的算法知识和能力是非常宝贵的资源。除了在纯粹的算法工程师角色中发挥作用,这些知识和能力还可以通过迁移技术理解和解释能力在多个领域得到应用。在大模型产品设计中,深入理解并清晰解释算法工作原理和应用是确保产品成功的前提。售前和市场推广过程中,对算法进行解释能够向客户展示产品的价值和优势,提高产品的认可度。
其次数据在大模型时代的地位越发重要,迁移数据驱动决策能力也成为一项关键技能。算法工程师对数据的敏感性和驱动决策的思维方式可以迁移到产品经理、运营等多个角色中。在这些职能中,数据的感知帮助更好地理解用户需求,优化产品性能,并制定有效的市场策略。
三、大模型时代下,算法及相关工作者提升与拓展
算法工程师转型需要学习哪些?
在大模型时代下,算法工程师转型所需整合和学习的内容与专业主要取决于他们的目标岗位。首先,他们应该全面融入大模型技术,真正将其应用于学习和工作中。其次,转型的目标岗位将决定需要掌握的岗位技能:
产品相关能力:对于转型为产品经理,理解产品的整个生命周期至关重要。这包括市场研究、需求收集、产品设计、项目管理以及产品推广等。具备商业意识,了解用户需求,掌握产品设计和管理的基本方法是必备技能。
技术支持和市场营销:如果转型为售前工程师或市场营销角色,需要学习客户服务技巧,了解市场营销策略,掌握公众演讲和客户服务技能。
数据科学:计划转型为数据工程师的人可能需要加强对统计学、预测模型、机器学习等方面的学习,并熟悉如何使用相关的工具和平台进行数据分析。
合合信息对算法新人有什么样的培养呢?
合合信息相关负责人表示,首先,在人才选拔阶段公司会非常慎重,选能力足够匹配的,因为进来会配备将近三年的成长期。其次,公司创始人及高层都非常重视fresh的成长,期望新人在三年左右成为有核心竞争力的成员,希望大家,有所得,有所乐,合成长。
应届生加入合合,未来市场竞争下有什么优势?
首先,合合信息当前的算法人员稳定性非常高,这主要有两点原因:首先,每个人有足够的机会去发挥自己的能力,在某个领域他就是专家,我相信算法人才心中是有梦的,而梦需要土壤去发芽。公司追求先进技术,纯粹的技术基因让这个土壤非常肥沃。二是因为从合合成长起来后离开的算法人员在社会上是被认可的,甚至是被抢的。
其次,大家可以认真思考一个问题,个人如何保持在算法技术上的领先性和竞争力?
互联网时代,信息很多很杂。如果把这些信息比做一阵风,其中的职场人可以是蝴蝶也可以是纸片,他们的区别是:蝴蝶可以顺着大风越飞越远,但是也有能力微微抵抗风向,朝自己的方向飞。而纸片只有一条路走,顺风前进。
在合合信息,你将成为那只蝴蝶。