大模型时代的到来,将算法工程师的职业发展带入了全新的境地。在这个浩瀚的数据海洋中,算法工程师们面临着前所未有的挑战和机遇。
不久前,合合信息举办了一场《大模型时代下,算法工程师发展趋势与技术拓展》的直播活动,智能技术平台事业部副总经理、高级工程师丁凯博士分享了大模型时代对算法工程师的影响以及应对之道。
这段深度探讨不仅让我对算法工程师的未来有了更清晰的认识,也启发了我对自身职业发展的思考。接下来,我将分享这次讨论的精彩内容,希望能够为同学们提供一些有益的启示与思考。
一、大模型时代的罪与罚
1.1、快速演进的大模型技术
从今年年初,OpenAI
发布的ChatGPT
以摧枯拉朽之势席卷全球。3月15日 OpenAI
发布多模态大模型GPT-4
,其不仅在语言处理能力上显著提高,还具备对图像的理解和分析能力。 GPT-4
商业化进程加快,开放API的同时还发布了在6个不同商业场景的应用落地。随后微软发布了震撼的微软365 Copilot
, 极大提升office的生产力和交互方式。随着技术的快速进步,大模型极大地解放了生产力,其广阔的应用场景及市场价值推动着其商业化的快速发展,在文字创造、人机交互、教育、影音、零售 等多场景已经有很多落地应用。
1.2、模型表现出的惊人创造力
从ChatGPT
到OpenAI
最近提出的GPT-4
,GPT
模型的迅猛发展表明,AI正在向着“类人化”方向迅速发展。而经过GPT-4
具备深度阅读和识图能力,能够出色地通过专业考试并完成复杂指令,向人类引以为傲的“创造力”发起挑战。
讲到多模态大语言模型的优势,一般首先要提到这类模型的涌现能力和思维链。这两者是大语言模型不断接近人类的关键特征。
- 涌现能力
(Emergent Abilities)
:指模型具有从原始训练数据中自动学习并发现新的、更高层次的特征和模式的能力。涌现能力基于深度学习模型的分层结构和权重学习机制而实现,涌现出来的能力可以是基于文本的,也可以是多模态的。 - 思维链
(Chain of Thought)
:大语言模型涌现出来的核心能力之一。其实之所以现在各类GPT研究火爆,也与模型训练出的思维链可进入产品应用有密切关系。思维链形成机制可以解释为模型通过学习大量的语言数据来构建一个关于语言结构和意义的内在表示,通过一系列中间自然语言推理步骤来完成最终输出。
对于此,OpenAI
曾在GPT4
技术报告中提到他们在一系列不同的基准上测试了GPT-4
。下表是实验结果。 可以看到,测试中包括了为人类设计的各种模拟考试(如词汇、写作、历史、数学、法律、代码),考试结果显示其能够处理文本、图像两种模态的输入信息, 单次处理文本量是ChatGPT
的8倍,表现大大优于目前最好的语言模型,这意味着GPT-4
不仅在学术层面上实现了模型优化与突破,同时也展现出了成为部分领域专家的能力。
1.3、大模型AI对算法工程师的威胁性
随着技术的迅猛发展,大模型人工智能(AI)在众多领域中已经展现了其优越的能力和潜力。然而,与此同时,大模型AI也已经对算法工程师工作产生了相当的威胁性。
- 大模型可以在短时间内处理大量数据,能够迅速处理大规模的数据并进行准确的分析和预测。这使得大模型在一些任务上能够胜过人类,例如机器翻译、文本生成、信息检索等。相比之下,传统的算法工程师需要投入大量时间和精力来设计和实现复杂的算法模型,其效率显然无法与大模型AI相提并论。
- 其次,大模型AI的自主学习能力使其能够从海量的数据中提取出有用的特征和模式,不再依赖人工进行特征工程。这也就意味着,算法工程师在特征设计和算法优化方面的专业知识和技能可能会逐渐被边缘化,并面临就业岗位的竞争压力。
由GitHub
开发的AI辅助编程工具GitHub Copilot
,使用了一种通用预训练语言OpenAI Codex
技术,其可以根据用户提供的代码输入和上下文,利用机器学习技术和大量的开源代码库进行训练,生成Python
、JavaScript
、TypeScript
、Ruby
、Go
和其他语言的代码片段,帮助开发人员提高效率,并通过GitHub Codespaces
集成到了GitHub
编辑器中,使得开发人员可以轻松地使用它来编码。
此外,大模型AI的出现也给算法工程师带来了一定的职业风险。随着大模型AI在多个领域的应用不断扩大,许多传统的工作岗位可能会被取代或转变。一些简单重复性的任务,特别是那些只需要基本的模式匹配和分类的工作,可能会被大模型AI自动化替代。这将迫使算法工程师不断转型和学习新的技能,以适应这一变化的职业环境。
二、算法工程师的破与发
2.1、破——大模型时代给算法工程师带来的新机遇
之后丁凯博士讲到在大模型时代下,作为一名算法工程师该何去何从的问题。他提到,尽管大模型AI对算法工程师带来了诸多挑战和威胁,但我们不能忽视算法工程师的价值和重要性。
虽然大模型AI可以通过自主学习提供很多有效的解决方案,但算法工程师的专业知识和创造力仍然不可替代的。在大模型时代,虽然算法模型的开发变得越来越自动化,但算法知识和能力的重要性并没有降低。相反,正是由于这种发展,使得算法知识和能力可以在更广泛的领域发挥作用。
在大模型时代下,算法工程师需要整合和学习的内容与专业,学习把大模型融入到自己的学习和工作中。不断提高自身的技能和知识,以适应新的挑战和机遇,作为算法工程师,想要破局,掌握以下能力置为关键:
- 迁移技术理解和解释能力:更好地理解和解释技术产品。无论是在大模型产品设计,还是在售前和市场推广中,能够深入理解并清晰解释算法工作原理和应用的能力都是工作的前提。
- 迁移数据驱动决策能力:大模型时代下数据的重要性越来越高,甚至高于算法。数据敏感性、数据驱动的决策思维、数据的感知可以迁移到产品经理或者运营等多个角色中,帮助你更好地理解用户需求,优化产品性能,以及制定有效的市场策略。
- 迁移问题解决能力:算法研究具备解决复杂问题的能力,这种思维模式可以迁移到任何工作中。这个属于软能力,我们也都很清楚这种解决复杂问题能力的价值。
- 迁移学习能力:算法领域的快速发展需要工程师持续学习和掌握新的知识和技能,这种学习能力对于转型任何职业都是非常有用的。
2.2、发——算法工程师如何适应大模型时代的变革
当前时代也是一个产品设计范式的变化,以往复杂的流程,变成只有一个对话框。比如,售前和市场团队负责解释和宣传算法产品,才能更好地向客户解释产品的功能和优势,扩大产品的影响力。数据工程师在收集和处理数据,保证模型训练和优化方面也扮演着重要角色等等。
而算法专业也拓展了一些更多的周边职业,如AI绘图工程师、AIGC工程师、数据挖掘工程师,目前已经有国外提示工程师岗位,开到了33万美元,即年薪可以达到两百万人民币以上。提示工程师就是为客户或企业基于复杂的任务需求和示例需求,提供标准化提示方案,主要负责深入了解机器学习和人工智能领域的最新理论和方法,开发和优化复杂模型的训练和推理过程。
总的来说,大模型的出现并没有使得算法专业的就业方向变得单一,反而由于其广泛的应用,产生了更多周边的职业机会。这需要我们站在更广阔的角度去思考,积极拓宽我们的知识领域,才能在这个时代找到自己的价值。而作为一名算法工程师,如何适应大模型时代的变革,他提到以下几点来适应大模型时代的变革:
- 关注算法产品的用户体验:随着复杂流程的简化,算法产品的用户体验变得更加重要。算法工程师需要关注算法产品的用户体验,并加以改进和优化,以提高产品的使用体验。
- 了解产品相关能力:理解产品的整个生命周期,包括市场研究、需求收集、产品设计、项目管理以及产品推广等,掌握和具备商业意识,了解用户需求,掌握产品设计和管理的基本方法。
- 深入理解业务场景需求:大模型的应用场景很广泛,而不同的业务场景需要不同的算法和模型。因此,作为算法工程师,需要深入理解业务场景需求,为不同场景提供定制化的算法解决方案。
- 加强与其他团队的协作:在大模型时代,算法工程师需要更多地与其他团队协作,例如售前和市场团队、数据工程师、产品设计师等,以确保产品的顺利研发和落地。
总之,作为一名算法工程师,在大模型时代的变革中,需要加强与其他团队的协作、深入理解业务场景需求、关注算法产品的用户体验以及学习工程化和生产力工具,以适应时代变革,不断提高自身的专业能力和价值。
三、大模型时代下人才发展洞察
在大模型时代,人才发展的关键在于与人工智能的协同工作。通过充分利用和应用AI技术,我们可以提高工作效率、拓宽职业发展路径,同时也需要不断提升自己的综合素质,与AI形成互补,共同创造更美好的未来。应该积极适应变革,不断学习和掌握新的知识和技能,做好准备迎接未来的挑战和机遇。只有这样,我们才能在大模型时代中保持竞争力,并实现个人和社会的可持续发展。
人才发展的道路会发生巨大的变化,社会的生产方式快速提升也将为我们带来新的行业和岗位机会。如何在这个时代中保持竞争力和领先性呢?我们可以借用合合信息的一句话来说:
“在信息很多很杂的互联网时代,职场人可以是蝴蝶也可以是纸片,蝴蝶可以顺着大风越飞越远,但是也有能力微微抵抗风向,朝自己的方向飞。而纸片只有一条路走,顺风前进。”
所以,合合信息注重人才发展,积极让员工参与内部培训和人才发展计划,不断提高专业素养和创新能力,推动“学习型组织”建设,打造专项教学、分享平台,鼓励成员将工作成果分享出来,帮助大家紧跟技术发展的步伐,在体系化的学习和有价值的项目实践中不断吸收和巩固经验。
另外,丁凯博士还提到,在合合信息中,算法人员的稳定性非常高,这主要有两点原因:
首先,每个人有充分的机会去发挥自己的能力,在某个领域成为专家。其次,合合信息在追求先进技术方面具有纯粹的技术基因,为算法人员提供了肥沃的土壤。
作为行业领先的人工智能及大数据科技企业,合合信息专注于智能文字识别和商业大数据服务行业,深耕十余年,扫描全能王、名片全能王、启信宝这些耳熟能详的产品已经覆盖了全球百余个国家和地区的亿级用户,以智能文字识别服务、商业大数据服务为核心的B端服务也形成了相当规模的业务矩阵。加入这个充满激情和活力的合合信息团队,一起创造更多的机遇和成就。