通用VS垂直,讯飞星火与网易子曰不同的“大模型解法”

简介: 随着大模型商业化应用的提速,全世界各国都开始孵化和孕育各自的行业大模型。

随着大模型商业化应用的提速,全世界各国都开始孵化和孕育各自的行业大模型。在此背景下,国内各个细分行业的垂直大模型,日益受到产业界的关注和重视。

相比通用大模型,垂直大模型具有门槛较低、数据质量较好且靠近落地场景的优势,因而伴随着大模型产业化的深入,其发展空间进一步打开,正在成为下一阶段行业竞争的焦点。事实上,一些受大模型影响特别明显的垂直行业如教育行业,已经率先掀起了大模型竞赛。

大模型成教育领域新变量

今年以来,教育领域包括网易有道、好未来、科大讯飞等行业巨头,先后公布了自己在AI大模型领域的布局和进展,由此大模型之风迅速席卷教育行业。而在教育领域纷纷刮起大模型之风的背后,则与多方面的因素有关。

首先,教育领域和AI大模型有很高的契合度,因而具备更好的落地条件。当前AI大模型大都具备自然语音处理、语音识别、图像识别等诸多能力,其为智能教育在视、听、音等多模态下,实现教育场景全覆盖提供了可能,成为“AI+教育”的核心引擎。此外,随着多模态生成技术的成熟,多模态生成模型的深度融合,将进一步使AI教学、AI虚拟互动趋于立体化,打破扁平的文本式结构,通过图像、视频、数字人生成等技术为教辅产品提供丰富的教学素材和内容呈现形式,打造全新的智能教育生态。

其次,用户对于教育智能产品的接受度日渐提升,AI大模型能够为用户带去更加智能的教育体验。目前AI教育已经发展一段时间了,用户对于智能化的教育产品,也有了相应的认知与了解,而AI大模型的应用,则能为智能教育的发展增添新动能。比如,智能硬件接入AI大模型之后,硬件的交互体验得到了加强,产品智能化也有了“质”的飞跃。

最后,AI大模型可以同时在B端和C端发力,在撬动庞大教育市场的同时,可以做到最小成本实现“因材施教”的教学目标,非常契合当下教育市场的阶段需求。一般而言,教育的投入来源有二:一方面是C端的教育培训消费,另一方面是B端的教育信息化投入,而这两方面都可以构筑起规模相当庞大的市场。如在C端,AI有望成为学生的“智能老师”,为孩子提供作文批改和英语对话等个性化场景学习服务,实现因材施教;在B端,则可以聚焦相对标准化的考场阅卷、在线教学等场景,大幅度提升考试阅卷的效率和准确率。基于此,大模型正在成为教育领域全新变量。

不同路线、不同思路

从整个行业来看,由于参与玩家的背景不同,其所走的路线也存在显著差异。目前来看,发力教育领域的大模型厂商主要分为两类:一是以百度文心一言、科大讯飞星火大模型为代表的通用大模型厂商,其面向的是包括教育在内的泛行业企业;二是以网易有道、学而思等为代表的垂直大模型厂商,其主要专注教育细分领域。结合各个厂商的情况来看,不同路线的背后,实际上对应着厂商的不同思路。

对于大厂而言,由于它们总体综合实力较强,具备构建大模型的一些底层技术能力,因而其更倾向于走通用大模型路线,后期借助大模型与场景结合,快速搭建起服务生态。目前业内包括百度、腾讯、阿里、科大讯飞等厂商,都纷纷依托自身的技术优势、团队优势和资金支持,在通用大模型领域实现了抢跑。比如阿里发布了通义千问大模型、华为发布了盘古大模型、百度发布了文心一言、科大讯飞发布了星火大模型等,在抢夺市场机会的同时,其直面产业的“倾向”也越来越明显。

比如,百度就宣称与超过300家企业成为生态伙伴;4月阿里云也宣布与七家企业推动大模型在油气、电力、交通等行业落地;华为早前也发布了盘古金融、电力、药物分子三个垂直领域大模型;而刚刚公布MaaS解决方案的腾讯,已和数十个行业的22家企业达成大模型共建合作;科大讯飞更是宣布,星火大模型首批接入36个行业3000余家企业……可见,当下推动大模型场景落地、打通服务生态,依然是通用大模型厂商的核心任务。

对于垂直行业厂商而言,其在行业深耕已久,对用户的需求理解和场景落地具备更强的洞察能力,又综合了专家经验、组织能力、工程能力的knowhow优势,具备高质量触达用户场景的竞争力。与通用大模型厂商不同,一些重要的行业玩家如新华三、京东、网易有道、携程等,则聚焦大模型与产业的融合机会,紧盯垂直赛道。比如,京东发布了言犀大模型、京医千询大模型,携程发布了携程问道大模型,网易有道发布了基于教育的子曰大模型。相比通用大模型厂商而言,垂直大模型厂商在相关行业深耕已久,因而在寻找产业机会方面往往走得更加深入。

以网易有道为例,网易有道早在2016年就开始构建AI协同基础能力,同步组建语音、视觉、声音等团队,积累了四大底层技术:有道神经网络翻译(NMT)、计算机视觉、智能语音AI技术、高性能计算等,同时网易有道深耕在线教育多年,已经在名师、线上网课、用户体量等方面构建起了比较优势,这让网易有道相比行业外的厂商更了解教育,相比教育行业内的友商更懂AI。基于这种优势,网易有道更容易抓住大模型在教育领域的落地机会,并借助它打造差异化的智能硬件,以及差异化的服务和用户体验,夯实其行业竞争力。

从这个角度来看,通用大模型厂商与垂直大模型厂商只是分工不同,并没有绝对优劣之分。

有道打响教育大模型应用第一枪

作为国内首个自研教育大模型,网易“子曰”大模型的发布,正式打响了教育领域垂直大模型应用第一枪,其现实意义不言而喻。

一方面,相比底层技术,靠近前端应用的垂直大模型的技术价值、商业价值更具想象空间。正如前文所述,随着大模型逐步深入产业,其应用价值愈加凸显。以7月26日网易有道推出的子曰大模型为例,其基于大模型成功推出了6个已经落地,或者即将落地的应用,分别是虚拟人口语教练、中文作文指导、英语语法精讲、AIBOX、文档问答和LLM翻译。

以表现最为出彩的虚拟人口语教练为例,它已经在应用层面无限接近真人口语老师的水平了。比如,它在跟你互动过程中,会根据你的回答做出类似人类的评价,例如它问你“Can you tell me what you know about Chinese history?”你回答:“more than 5000 years,I learned”,它会跟一句:“yes,that is great,do you know about the Han Dynasty ……”形成联系上下文的有来有往的对话文本,全程虚拟人表情生动、发音地道,突破了以往“教条”的剧本式交流局限。

另外,它还具备很强的即时反馈机制和纠错能力。比如,笔者在跟它对话过程中,它能够根据笔者的发音和文字,生成练习报告给笔者以即时反馈,帮助笔者快速锁定语言卡点,覆盖8个话题场景和68个话题的内容储备,让其口语表达更精准,交流体验更接近真人水平。

而在虚拟人口语教练良好用户体验的背后,离不开其强大的底层“黑科技”实力。比如,虚拟人口语教练在语音识别能力方面进行了巨大的革新,它支持多语种的流式低延迟语音识别技术,让虚拟人Echo在中式英语、英语、中英混合等场景下游刃有余;声学降噪、回声消除、自动语音检测、自动断句等技术,则让它像一个真正的倾听者和交流者。在AI虚拟人的驱动方面,有道基于自主研发的情感识别算法和实时渲染驱动引擎,对播放的语音数据进行深度分析,使其面部表情更接近真人。

在其他应用方面,它的表现也毫不逊色。比如,在AI作文指导方面,它不仅能够批改,还能够像老师一样作指导;另外,它在语法精讲、LLM翻译、AIbox、文档问答等方面,都已经在落地或者正在落地,正在成为一个“全能的AI语言文字助手”。预计未来随着更多AI应用的落地,它将会在更多方面对用户生产力提升产生重大影响。

另一方面,网易有道子曰教育大模型的发布,也标志着网易有道多年深耕AI,在通用AI能力上走向了成熟,具备了产生应用的强大实力。前文提到,好的垂直大模型需要深厚的AI通用能力作为底座才能够走的更远,作为教育行业首个垂直大模型厂商,网易子曰大模型的推出,实际上正是建构在网易有道多年的AI通用技术能力之上。

作为国内NLP能力领先的公司,有道多年来一直致力于基于Transformer模型的创新和应用,还积累了OCR、ASR、TTS、CAPT等几大核心技术,正是这些技术的有效整合,打开了新的想象空间,让有道成为国内率先将AIGC技术落地教育场景内的企业。

如今,有道正在多个业务场景推进“子曰”大模型应用落地,探索AI个性化教学的前沿阵地,将以技术创新和产品研发的优势,实现更广维度的突破(如有道纵横以及有道智慧体育等),为整个教育行业赋能。

产业需要探路先锋

在垂直大模型持续升温之下,包括京东、携程、网易有道等在内的厂商,已经开始扮演起“探路先锋”的角色,开始在零售、旅游和教育领域探索落地场景,并对产业发挥直接引领作用。

一来,当前大模型进展虽然激烈,但还处于初级阶段,属于垂直大模型的机会窗口尚未关闭,垂直厂商迫切需要利用自己掌握的高质量数据集,将数字化延伸到产业的“神经末梢”处,但其所面临的内外部挑战很大,因此各产业迫切需要破局者。

当前国内大模型这个赛道,依旧处于早期阶段,相比国外的GPT-4和Bard、LLaMA等厂商已经展开竞争来说,国内的通用大模型厂商尚未展开直接较量。在国内通用大模型还处于“懵懂”状态之下,国内的垂直大模型厂商也不存在太多的竞争,其依旧面临众多的机会。对于垂直大模型厂商而言,只需要紧跟潮流、精准解决用户痛点,就有机会脱颖而出。

当然,挑战同样存在。比如通用大模型厂商参与行业竞争,核心关卡突破面临挑战,数据安全问题需要解决等等,都需要有像携程、京东、网易有道,这样引领性的行业巨头参与其中,加速垂直大模型产业化的落地进程。

二来,从整个行业来说,无论是通用大模型还是垂直大模型,最终的商业化都需要落地产业,但如何将大模型能力与产业应用结合,从而创造出商业价值没有先例可循,同样需要一批探路者去开辟。前文提到,当前国内大模型无论是通用大模型还是垂直大模型,都还处于早期阶段,产业落地和技术商业化尚无先例可循。而不论是通用大模型还是垂直大模型,其商业化最终都指向产业和场景,因此诸如子曰大模型这样的垂直大模型落地,对于AI大模型产业化、商业化落地具有现实意义。

作为业内首个教育类垂直大模型,网易子曰大模型的发布,标志着教育领域的大模型开始进入实质应用阶段,其也或将引领全新的产业浪潮。而作为参与者与推动者,网易有道也将成为这场浪潮的受益者。

目录
相关文章
|
2月前
|
人工智能 数据处理 异构计算
LongRAG:智谱联合清华和中科院推出的双视角鲁棒检索框架
LongRAG是由智谱、清华大学和中国科学院联合推出的双视角鲁棒检索增强生成框架,专为长文本问答设计。该框架通过混合检索器、LLM增强信息提取器、CoT引导过滤器和LLM增强生成器等组件,有效解决了长文本问答中的全局上下文理解和事实细节识别难题。LongRAG在多个数据集上表现优异,提供了自动化微调数据构建管道,增强了系统的“指令跟随”能力和领域适应性。
78 1
LongRAG:智谱联合清华和中科院推出的双视角鲁棒检索框架
|
3月前
|
前端开发 算法 测试技术
前端大模型应用笔记(五):大模型基础能力大比拼-计数篇-通义千文 vs 文心一言 vs 智谱 vs 讯飞vsGPT
本文对比测试了通义千文、文心一言、智谱和讯飞等多个国产大模型在处理基础计数问题上的表现,特别是通过链式推理(COT)提示的效果。结果显示,GPTo1-mini、文心一言3.5和讯飞4.0Ultra在首轮测试中表现优秀,而其他模型在COT提示后也能显著提升正确率,唯有讯飞4.0-Lite表现不佳。测试强调了COT在提升模型逻辑推理能力中的重要性,并指出免费版本中智谱GLM较为可靠。
前端大模型应用笔记(五):大模型基础能力大比拼-计数篇-通义千文 vs 文心一言 vs 智谱 vs 讯飞vsGPT
|
5月前
|
自然语言处理 语音技术
|
5月前
|
数据采集 人工智能 监控
赌你一定想要!OpenDataLab首款大模型多模态标注平台Label-LLM正式开源
Label-LLM 是一款专为大模型训练设计的多模态文本对话标注工具,支持团队协作,让标注工作变得简单高效。它不仅涵盖丰富的任务类型,如回答采集、偏好收集和内容评估等,还支持多模态数据标注,包括图像、视频和音频。Label-LLM具备预标注载入功能,能大幅提升工作效率,并提供全方位的任务管理与可视化分析,确保标注质量。快来体验这款强大的标注平台吧![部署文档](https://github.com/opendatalab/LabelLLM)
1055 0
赌你一定想要!OpenDataLab首款大模型多模态标注平台Label-LLM正式开源
|
5月前
|
数据采集 人工智能 物联网
我们给大模型去掉了“AI味”-大模型微调全链路实战
本文档旨在概述使用ModelScope生态进行LLM训练的全链路最佳实践,涵盖数据下载、数据预处理、模型训练、模型评估完整流程。
|
8月前
|
编解码 人工智能 自然语言处理
贾佳亚团队新模型对标ChatGPT+DALL-E 3王炸组合!
【4月更文挑战第15天】贾佳亚团队推出Mini-Gemini模型,旨在缩小与GPT-4和Gemini的性能差距。该模型采用双视觉编码器处理高分辨率图像,提升视觉对话和推理准确性。搭配高质量数据集,增强图像理解和推理能力。Mini-Gemini在零样本基准测试中表现出色,尤其在高分辨率图像处理上。不过,模型在复杂视觉推理和计数能力上仍有改进空间。
48 1
贾佳亚团队新模型对标ChatGPT+DALL-E 3王炸组合!
|
8月前
|
人工智能 异构计算 Python
字节跳动最新研究AI项目:一张图片组合一组动作就可以生成毫无违和感的视频!
字节跳动最新研究AI项目:一张图片组合一组动作就可以生成毫无违和感的视频!
175 0
|
人工智能 自然语言处理 算法
|
机器学习/深度学习 人工智能 算法
智源「悟道3.0」大模型系列问世,这次不拼参数,开源开放成为主角(2)
智源「悟道3.0」大模型系列问世,这次不拼参数,开源开放成为主角
346 0
|
数据采集 机器学习/深度学习 人工智能
智源「悟道3.0」大模型系列问世,这次不拼参数,开源开放成为主角(1)
智源「悟道3.0」大模型系列问世,这次不拼参数,开源开放成为主角
364 0