通用大模型VS垂直大模型

简介: 【7月更文挑战第16天】通用大模型VS垂直大模型

在人工智能领域,关于通用大模型VS垂直大模型,在选择上我并不倾向于任何一方,而是会根据实际的场景来选择具体的大模型。

通用大模型

通用大模型是指那些设计用来处理多种任务和数据类型的大型人工智能模型。它们通常在大规模的多领域数据集上进行训练,以学习到广泛的知识和技能,从而具备跨领域的泛化能力。通用大模型通常参数量巨大,在百万到数十亿级别,这使得它们能够捕捉和学习数据中的复杂模式和细微差别。同时能够处理多种数据类型,包括文本、图像、声音等多种模态的数据,实现跨模态的理解和生成。通用大模型能够应用于各种不同的场景和任务,如自然语言处理、计算机视觉、语音识别等。因此对于通用大模型而言,主打的一个就是跨行业、跨专业、上知天文下知地理、无所不能这样的一个角色。不管你问通用大模型什么问题,他总能给到你他认为符合你要求的答案,就比如我们日常会用到的通义千问、文心一言等。在广度上,通用大模型更具优势,当你对于当前所需模型的专业领域边界不是很清晰的时候,选择通用大模型无疑是一个正确的选择。

垂直大模型

再来说说垂直大模型,垂直大模型顾名思义就是在一个行业或者一个领域垂直深挖,指针对特定行业或领域定制的大型人工智能模型。它们通常基于对该领域有深入理解的专家设计和训练,以确保模型能够满足该领域的特殊需求。那么带来的往往就是能提供更专业的回答或者解决方案。比如在医药领域的垂直大模型深耕医疗领域,提供专业解答。或者是法律行业的垂直大模型,比如通义法睿,可以为用户提供更专业的咨询服务。当然也不是说通用大模型就不能提供这些场景的咨询服务,而是说垂直大模型基于当前行业的训练内容更丰富,提供的专业咨询也更精准一些。


因此,对于通用大模型或者垂直大模型,更倾向于哪一方不取决于个人想法,而是取决于用户需要。

相关文章
|
4月前
|
人工智能 搜索推荐
未来多种模型组合是AIGC更可能的方向
【1月更文挑战第10天】未来多种模型组合是AIGC更可能的方向
78 1
未来多种模型组合是AIGC更可能的方向
|
2月前
|
人工智能 自然语言处理 语音技术
通用模型和垂直模型的比较
通用模型和垂直模型的比较
|
2月前
|
自然语言处理 C++
通用大模型VS垂直大模型对比
通用大模型VS垂直大模型对比
|
4月前
|
测试技术 网络架构 C++
使用MergeKit创建自己的专家混合模型:将多个模型组合成单个MoE
MoE架构通过MergeKit实现新突破,允许整合预训练模型创建frankenMoEs,如FrankenMoE,区别于头开始训练的MoEs。MergeKit工具支持选择专家模型,定义正负提示,并生成MoE配置。
190 2
|
4月前
|
机器学习/深度学习 搜索推荐 物联网
微软开源创新LoRA组合方法,增强文生图复杂细节控制
微软研究团队推出Multi-LoRA Composition技术,改善文本到图像模型的细节控制。利用低秩适应(LoRA)提升图像生成精度,通过LORA SWITCH和LORA COMPOSITE解决组合复杂图像的挑战。新方法在ComposLoRA平台上测试,性能优于基线,为图像生成和个性化内容创作开辟新途径。尽管有学习曲线和定制需求优化的问题,但该研究仍为领域带来显著进步。
377 3
微软开源创新LoRA组合方法,增强文生图复杂细节控制
|
4月前
|
数据可视化 网络可视化
混合图形模型MGM的网络可预测性分析
混合图形模型MGM的网络可预测性分析
|
4月前
|
自然语言处理
多模态混合大模型将成为标配
【1月更文挑战第22天】多模态混合大模型将成为标配
42 1
多模态混合大模型将成为标配
|
4月前
|
人工智能 文字识别 算法
垂直领域大模型——文档图像大模型的思考与探索
12月1日,2023中国图象图形学学会青年科学家会议在广州召开。超1400名研究人员齐聚一堂,进行学术交流与研讨,共同探索促进图象图形领域“产学研”交流合作。
|
机器学习/深度学习 数据采集 人工智能
ONE-PEACE:探索通往无限模态的通用表征模型
过去几年里,表征模型在自然语言处理、计算机视觉、语音处理等领域取得了巨大的成功。经过大量数据学习的表征模型,不仅可以在各种下游任务上取得良好的效果,还可以作为大规模语言模型(LLM)的基座模型,为LLM提供多模态理解能力。随着多模态技术的发展,尤其CLIP[1]之后大家都意识到一个好的多模态表征模型在很多单模态任务上都会发挥着至关重要的基础模型的作用。学习了大量模态alignment的数据之后的模型逐渐在学会去理解各个模态和模态间蕴含的知识,甚至通过对大量模态的学习促进对其它模态的理解。
21830 7
|
人工智能 自然语言处理 算法
LLM as Controller—无限拓展LLM的能力边界(1)
LLM as Controller—无限拓展LLM的能力边界
下一篇
云函数