浅谈AI大语言模型的企业落地(二)- AI狂潮下企业的机遇和挑战

本文涉及的产品
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
实时计算 Flink 版,5000CU*H 3个月
简介: AI狂潮下企业的机遇和挑战

接下来的文字小马尽量做到通俗易懂,老少皆宜,相对科研更注重应用。说起来小马也只是站在巨人肩膀上的学习者,斗胆花拳绣腿,班门弄斧一番。以下文章可能会有些许观点,仅代表个人观点,欢迎互相交流学习。

一、江湖

上一篇我们聊到chatgpt掀起了AI狂潮。就在这股狂潮下大家都纷纷涌进风口,国内大模型正在紧锣密鼓研发中,半年多时间国内出现了“百模大战”的局面,BAT等头部互联网公司和人工智能公司基本都对外宣布了自己的大模型。细心的同学会发现光听名字就很博大精深,如百度的文心一言,百川智能的百川,科大讯飞的星火,阿里的通义千问,腾讯的混元,华为的盘古,哈工大的chatGLM,等等。具体名录也可参看这里:中国大模型,如果对大模型不了解的小伙伴还可以点击里面的链接进行体验。

江湖再起,几乎大家都想对标gpt,都号称能媲美80%效果等云云。但实际效果其实大家都有目共睹,前路漫漫吾将上下而求索,也许未来的路任重而道远。

大公司都在研究大模型,那普通企业也研究大模型?显然不是那么回事,有稍微了解过chatgpt的小伙伴应该都知道,训练一个大模型的成本是多少。可以说训练成本和人力成本都不是很适合普通企业。那有小伙伴问了,chatgpt很牛X,那不训练出一个类似的大模型还能有啥搞头呢?AI这波红利说什么也是不能放过的呀。今年下半年,国内陆陆续续很多公司都在研究AI的应用,相信不久就会有各种AI产品如雨后春笋般问世。

随着chatgpt概念的普及和国内大语言模型平台的开放,大语言模型已经进入了第二阶段--应用落地阶段。这一革命性技术的发展为企业带来无限可能,大语言模型的应用落地离不开核心基础,包括大模型服务平台、开源模型和生态发展,大模型企业应用的成功需要与实际应用场景相结合进行个性化微调并采用灵活的接入方式。在解决企业需求时,大模型应用可能涉及多种模型和技术组合,因此需要灵活接入各类模型和技术。作为强人工智能的代表,大模型的接入方式多样化,除了目前常用的文字交流外,智能语言和数字人也将成为大模型接入的重要入口。随着大模型应用的推广,未来每个业务后台都将配备一个机器人bot为用户提供智能服务,这些bot将无处不在,为企业和用户带来更便捷、高效的体验。大语言模型的应用落地标志着人工智能的新篇章。企业可以借助这一革命性技术来提升服务质量、提高效率,并为用户提供更个性化、智能化的体验,让我们期待大语言模型为各行各业带来更多惊喜和变革吧。

二、揭开面纱

好了,我们的第一波概念来了,什么是AI,什么是大语言模型,什么是AIGC。
image.png

AI

人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是新一轮科技革命和产业变革的重要驱动力量。

人工智能是智能学科重要的组成部分,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器人,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大,可以设想,未来人工智能带来的科技产品,将会是人类智慧的“容器”。人工智能可以对人的意识、思维的信息过程的模拟。人工智能不是人的智能,但能像人那样思考、也可能超过人的智能。【百度百科】

我们看到AI的领域其实是非常广泛的,我们所说的chatgpt只是属于其中的一种领域——自然语言处理。鉴于chatgpt是本次浪潮的引爆者,我们本次系列文章也正是主要针对该领域展开。

自然语言处理( Natural Language Processing, NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。简单说就是NLP是一种专业分析人类语言的人工智能。

大语言模型(LLM)

大语言模型(LLM)是指使用大量文本数据训练的深度学习模型,可以生成自然语言文本或理解语言文本的含义。大语言模型可以处理多种自然语言任务,如文本分类、问答、对话等,是通向人工智能的一条重要途径。LLM属于NLP领域中的一类模型。NLP领域的模型还有Word2vec, Fasttext, Glove, Elmo, Bert, Flair pre-train Word Embedding等等。

为什么会有大模型和小模型之分呢?这是根据参数级别划分的。在深度学习领域,大模型通常是指具有数百万到数十亿参数的神经网络模型。在chatgpt涌现惊人的能力之前,其实业界是很不看好大模型的。那个时候bert还是王者的存在,因为并没有人相信大力能出奇迹,而chatgpt见证了一种可能,因此具有类比蒸汽机诞生的意义。

AIGC

生成式人工智能——AIGC(Artificial Intelligence Generated Content),是指基于生成对抗网络、大型预训练模型等人工智能的技术方法,通过已有数据的学习和识别,以适当的泛化能力生成相关内容的技术。AIGC技术的核心思想是利用人工智能算法生成具有一定创意和质量的内容。通过训练模型和大量数据的学习,AIGC可以根据输入的条件或指导,生成与之相关的内容。例如,通过输入关键词、描述或样本,AIGC可以生成与之相匹配的文章、图像、音频等。【百度百科】

上一篇文章中我们谈到的Midjourney生成图片,GPT-4生成图片,chatgpt生成文字内容,都是属于AIGC技术。相应的AIGC应用场景还有文字创作、音频创作、视频创作、绘画创作、代码生成、游戏开发(智能NPC、辅助设计工具、自己产出游戏世界观 )、3D制作等等领域。

三、机遇

概念一波回来,我们回到正题。不妨先来看看科大讯飞如何在产品上结合的大模型。如果进入官网,你会发现基本的能力都已经帮你罗列了,多模交互、代码能力、文本生成、数学能力、语言理解、知识问答、逻辑推理,这里的每一个能力都足以颠覆传统行业。这些能力能用在什么业务应用场景呢,如何结合到产品如何落地到业务?对的,这部分可能就是大家最关心的,如图。

image.png

落地应用场景


大家各取所需,比如服务行业可以借助问答来支持客服工作,写手可以借助文本创作来产出内容等等,如果你需要营销文案它也可以瞬间代劳,效率加倍。最直接的体验就是最近某音上出现的AI直播机器人。我们会看到AI的提效与创新能力正在给各行各业带来莫大的机遇。

那问题来了,前面说了普通企业直接自己训练大模型是不大合适的,那只能购买人家提供的服务吗?比如付费讯飞开放的api或者chatgpt开放的api?其实也未尝不可,只不过费用这块要稍加斟酌,而且如果是openai的api还需要考虑接口的稳定性,毕竟境外接口有风险。

任何问题都难不倒我们的智慧。我们还可以用开源大模型。对的,开源免费是中小型企业的福音。借助开源模型的微调和逻辑实现大多数就能符合垂直领域的业务需求。比如医疗领域的智能问答,我们就可以借助对开源大模型chatGLM的微调来使大模型具有医疗垂直领域的知识,如果觉得微调的路径太长也可以借助langchain框架本地知识库匹配结合大模型的方式来快速实现垂直领域的知识问答;再比如平面设计师可以借助对Midjourney的模型微调让模型达到自己想要的创作效果。

一切似乎又开始因为AI存在着无限的可能。

四、挑战

引用以前课本里的一句话说就是,AI既是机遇也是挑战。尽管我们不打算深耕大模型的训练,但是算力仍然是各个企业的最大难点,再者就是人才资源,这些都是需要面对的挑战。

因为要做这些,首选要具备基本的AI基础,要掌握基本的机器学习知识,否则微调的参数调整都可能够喝一壶了。而且微调也是一个“炼丹”工作,路径也会有点长,时间成本不可忽视。其中的坑不计其数,小到挑选适合业务的大模型大到模型C端部署,从机器选购、模型部署、数据集选择规范、微调、逻辑调整、云平台部署等到最终达成效果,哪一个不是一门学问(罪孽深重)。如果面对C端部署,那和训练又是另外一回事了,训练的时候我们注重的是模型的能力,部署我们注重的则是模型的性能和体验,就要考虑到模型的压缩优化,诸如量化、蒸馏、剪枝,没有两把刷子哪一个是好惹的?尽管优化如斯,大模型目前所呈现出的推理速度和部分单线程排队阻塞处理请求的性质直接决定着部署成本还是不容小觑。假设需要部署的大模型推理需要的配置为26G,那么以部署腾讯云为例,部署单个模型(非集群)需要采购机器型号:GN10Xp.5XLARGE80,GPU 32G,1TB存储,10M带宽,费用大约13000元/月。小马整理了一份目前主流大模型分别需要的硬件资源配置的表格供参考(如下图),以及不同配置云部署所需的机器成本参看连接:云服务器定价。对成本比较关心的小伙伴可以参看这里以对成本能有基本的认知。

image.png

模型推理配置要求


话又说回来,如果AI带来的提效和创新的价值远大于成本投入,谁还会选择丢掉这块肥肉呢?如果不能大胆尝试拥抱AI变革必将落后于时代并逐渐被新的生产力所取代。

接下来的文章小马将以简单例子详细介绍具体如何实现AI到业务应用的落地,希望能抛砖引玉。

相关文章
|
8天前
|
机器学习/深度学习 人工智能 自动驾驶
企业内训|AI大模型在汽车行业的前沿应用研修-某汽车集团
本课程是TsingtaoAI为某汽车集团高级项目经理设计研发,课程全面系统地解析AI的发展历程、技术基础及其在汽车行业的深度应用。通过深入浅出的理论讲解、丰富的行业案例分析以及实战项目训练,学员将全面掌握机器学习、深度学习、NLP与CV等核心技术,了解自动驾驶、智能制造、车联网与智能营销等关键应用场景,洞悉AI技术对企业战略布局的深远影响。
139 97
|
18天前
|
机器学习/深度学习 人工智能 安全
CCF-CV企业交流会:打造大模型时代的可信AI,探索AI安全治理新路径
近日,由中国计算机学会计算机视觉专委会主办的《打造大模型时代的可信AI》论坛顺利举行。论坛邀请了来自上海交通大学、中国科学技术大学等机构的专家,从立法、监管、前沿研究等多角度探讨AI安全治理。合合信息等企业展示了图像篡改检测等技术,助力AI向善发展。
59 11
CCF-CV企业交流会:打造大模型时代的可信AI,探索AI安全治理新路径
|
27天前
|
机器学习/深度学习 人工智能 自然语言处理
Llama 3.3:Meta AI 开源新的纯文本语言模型,专注于多语言对话优化
Meta AI推出的Llama 3.3是一款70B参数的纯文本语言模型,支持多语言对话,具备高效、低成本的特点,适用于多种应用场景,如聊天机器人、客户服务自动化、语言翻译等。
77 13
Llama 3.3:Meta AI 开源新的纯文本语言模型,专注于多语言对话优化
|
2天前
|
人工智能 运维 监控
云卓越架构:企业稳定性架构体系和AI业务场景探秘
本次分享由阿里云智能集团公共云技术服务部上海零售技术服务高级经理路志华主讲,主题为“云卓越架构:企业稳定性架构体系和AI业务场景探秘”。内容涵盖四个部分:1) 稳定性架构设计,强调高可用、可扩展性、安全性和可维护性;2) 稳定性保障体系和应急体系的建立,确保快速响应和恢复;3) 重大活动时的稳定重宝策略,如大促或新业务上线;4) AI在企业中的应用场景,包括智能编码、知识库问答、创意广告生成等。通过这些内容,帮助企业在云计算环境中构建更加稳定和高效的架构,并探索AI技术带来的创新机会。
|
23天前
|
数据采集 人工智能 编解码
书生·万象InternVL 2.5:上海 AI Lab 开源的多模态大语言模型,超越了目前许多商业模型
书生·万象InternVL 2.5是由上海AI实验室OpenGVLab团队推出的开源多模态大语言模型系列。该模型在多模态理解基准(MMMU)上表现优异,超越了许多商业模型,适用于图像和视频分析、视觉问答、文档理解和多语言处理等多个领域。
75 7
书生·万象InternVL 2.5:上海 AI Lab 开源的多模态大语言模型,超越了目前许多商业模型
|
22小时前
|
人工智能 搜索推荐
SoulChat2.0:低成本构建 AI 心理咨询师,华南理工开源心理咨询师数字孪生大语言模型
SoulChat2.0 是华南理工大学推出的心理咨询师数字孪生大语言模型,能够低成本、快速构建个性化咨询风格的心理健康大模型,辅助心理咨询师工作。
15 7
SoulChat2.0:低成本构建 AI 心理咨询师,华南理工开源心理咨询师数字孪生大语言模型
|
5天前
|
存储 人工智能 物联网
工业公辅车间数智化节能头部企业,蘑菇物联选择 TDengine 升级 AI 云智控
在工业节能和智能化转型的浪潮中,蘑菇物联凭借其自研的灵知 AI 大模型走在行业前沿,为高能耗设备和公辅能源车间提供先进的 AI 解决方案。此次采访聚焦于蘑菇物联与 TDengine 的合作项目,通过 AI 云智控平台的建设,双方携手推动制造工厂的能源数智化管理,助力企业实现节能降碳。在本文中,我们将深入探讨蘑菇物联选择 TDengine 的原因、项目实施中的挑战与解决方案,以及合作视角下双方的未来愿景。
14 2
|
16天前
|
人工智能 Serverless API
尽享红利,Serverless构建企业AI应用方案与实践
本次课程由阿里云云原生架构师计缘分享,主题为“尽享红利,Serverless构建企业AI应用方案与实践”。课程分为四个部分:1) Serverless技术价值,介绍其发展趋势及优势;2) Serverless函数计算与AI的结合,探讨两者融合的应用场景;3) Serverless函数计算AIGC应用方案,展示具体的技术实现和客户案例;4) 业务初期如何降低使用门槛,提供新用户权益和免费资源。通过这些内容,帮助企业和开发者快速构建高效、低成本的AI应用。
60 12
|
10天前
|
人工智能 安全 搜索推荐
到2028年,30%的财富500强企业将使用仅支持AI的服务渠道
到2028年,30%的财富500强企业将使用仅支持AI的服务渠道
|
20天前
|
人工智能 自然语言处理 数据挖掘
从行业痛点到AI前沿:揭秘AGI时代企业培训的终极之选
近几年接触到的各类培训合作方越来越多,从国际咨询巨头、互联网科技培训平台,到本土独角兽型的专业培训公司;从专攻新技术与创新场景的培训团队,到深谙传统行业痛点的咨询顾问。作为一名在央企、国企、上市公司人力资源培训条线深耕多年的HR负责人,深知在这片竞争激烈的培训服务蓝海中,寻找高质、高效的合作伙伴并不简单,因为企业培训的逻辑正在悄然改变。