AI智能体研发之路-模型篇(三):中文大模型开、闭源之争

简介: AI智能体研发之路-模型篇(三):中文大模型开、闭源之争

一、引言

周日休息在家,只有码字才能缓解焦虑哈哈哈,闲逛CSDN发现又出新的话题活动啦——《开源大模型和闭源大模型,你怎么看》。“我怎么看?我坐着看,或者躺着看”。OpenAI变成CloseAI,你会发现,虚伪,是全世界的通病。扯远了哈哈,我认为,开源可以短时间让自家的大模型快速得到传播,构建影响力以及让行业内更多的人参与建设,完善技术栈。闭源可以维护较为健康的商业模式,高薪招聘更多优秀的人才继续进行迭代升级。存在即合理,从ios vs android,打到GPT4 vs LLama3,可能永远不会有胜负。今天我们详细聊聊中文大模型开闭源的那些事。

二、中文开/闭源大模型概览

大家先看《2024年中文大模型全景图》,对国内中文大模型开闭源情况有个概念。

Tips:图片引自SuperCLUE中文大模型基准测评2024年4月报告,国内领先的大模型评测公司,高中室友创办的,没想到毕业多年,兜兜转转进入到了一个行业,如需合作需要可以联系我哈

闭源大模型:主要有文心一言、通义千问、腾讯混元、字节云雀、MINIMAX、GLM-4、Baichuan4、Moonshot月之暗面等。

开源大模型:主要有baichuan2-13B-Chat、ChatGLM3-6B、Qwen1.5、Chinese-LLaMA-Alpaca-3等。

从商业模式上讲,又可以分为3类。

  • 以百度、MINIMAX为代表的完全闭源大模型:只提供商业化接口,高版本收费、低版本免费。
  • 以阿里为代表的部分开源、部分闭源:既提供商业化接口,又提供开源模型,两条腿走路,并驾齐驱都在升级迭代。
  • 以百川为代表的前期低版本开源、后期高版本闭源:前期通过baichuan-13B、baichuan2-13B快速打出名气,后来更高版本的baichuan3、baichuan4只提供商业化接口。

目前国内大模型发展可以用“兵荒马乱”来形容,谁能在最后杀出重围,还需要时间去考量,下面针对开、闭源的优缺点,谈一谈个人想法。

三、开源大模型

3.1 优点

1、创新和灵活性:开源模型鼓励创新,研究人员和开发者可以自由探索和改进模型,推动技术的发展。

2、社区协作:开源社区的力量不可忽视,众多开发者共同参与,能够快速发现和解决问题,加速模型的优化和完善。

3、低成本和可访问性:开源模型通常是免费的,降低了使用门槛,使更多人能够受益于先进的技术。

4、透明度和可解释性:源代码公开,有助于更好地理解模型的工作原理,提高模型的可解释性和可信度。

5、适应多样化需求:开源模型可以根据不同的应用场景和需求进行定制和扩展,满足个性化的要求。

3.2 缺点

1、质量和稳定性:由于开源模型的开发和维护分散,质量和稳定性可能存在一定的差异。

2、缺乏商业支持:开源模型通常没有商业公司提供的专业支持和服务,在遇到问题时可能需要自己解决。

3、训练和部署难度:对于一些复杂的大模型,训练和部署可能需要较高的技术水平和计算资源。

4、数据隐私和安全:开源模型可能涉及数据的共享和使用,需要注意数据隐私和安全问题。

5、知识产权风险:在使用开源模型时,需要注意遵守相关的开源协议,避免知识产权纠纷。

四、闭源大模型

4.1 优点

1、质量和稳定性保障:闭源模型通常由专业的团队开发和维护,经过严格的测试和验证,质量和稳定性相对较高。

2、商业支持和服务:商业公司提供闭源模型时,通常会附带专业的支持和服务,包括培训、技术支持等。

3、易于使用和集成:闭源模型通常提供了友好的用户界面和 API,便于开发者使用和集成到自己的系统中。

4、数据隐私和安全保护:商业公司通常会采取措施保护用户的数据隐私和安全。

5、持续更新和改进:商业公司会不断对闭源模型进行更新和改进,以提供更好的性能和功能。

4.2 缺点

1、成本较高:闭源模型通常需要用户购买许可证或订阅服务,成本相对较高。

2、缺乏透明度:用户无法直接查看模型的源代码,对模型的工作原理和内部机制了解有限。

3、定制和扩展性受限:闭源模型的定制和扩展性可能受到一定的限制,无法完全满足个性化需求。

4、社区参与度低:相比开源模型,闭源模型的社区参与度较低,开发者之间的交流和合作相对较少。

5、依赖供应商:用户对闭源模型的使用和发展较为依赖供应商,一旦供应商出现问题,可能会影响用户的使用。

五、总结

可以看到,开源和闭源模型各有其优缺点,选择适合自己需求的模型需要综合考虑多方面因素。在实际应用中,可以根据具体情况权衡利弊,并结合自身的技术能力和资源来做出决策。此外,随着技术的不断发展,开源和闭源模型的界限也在逐渐模糊,一些商业公司也开始采用开源的模式来推动技术的进步。

对于AI智能体开发而言,个人实际工作中,既使用闭源商业化接口,首先是省心,不用自己申请机器、部署、维护模型服务;其次是省钱,相较于购买GPU显卡,价格战下的商业接口便宜的可怕;最后是真的很好用,一般商业化的接口模型尺寸都要高于开源版,Agent开发过程中调用一些Tools就能达到极好的效果。又使用开源微调私有化部署模型,首先是安全,考量到数据安全,业务数据轻易不能外漏,安全意识很重要,如果外泄未来可能是雷区;其次是可微调,使用较大尺寸的模型,配以精选后的微调数据,画风上明显会有一定提升;最后是杀鸡焉用牛刀,对于一些简单任务,比如任务判断、工具选择、文本处理等一些简单但重复度高的工作,使用私有化部署的模型,长期看是可以节约成本的。

本文首先对国内中文大模型开闭源情况进行概述,其次区分开源、闭源分析优缺点,最后谈了谈工作中的感想,期待您的关注与互动噢,

目录
相关文章
|
2天前
|
存储 人工智能 数据可视化
高效率,低成本!且看阿里云AI大模型如何帮助企业提升客服质量和销售转化率
在数字化时代,企业面临海量客户对话数据处理的挑战。阿里云推出的“AI大模型助力客户对话分析”解决方案,通过先进的AI技术和智能化分析,帮助企业精准识别客户意图、发现服务质量问题,并生成详尽的分析报告和可视化数据。该方案采用按需付费模式,有效降低企业运营成本,提升客服质量和销售转化率。
高效率,低成本!且看阿里云AI大模型如何帮助企业提升客服质量和销售转化率
|
2天前
|
人工智能 并行计算 安全
从零到一,打造专属AI王国!大模型私有化部署全攻略,手把手教你搭建、优化与安全设置
【10月更文挑战第24天】本文详细介绍从零开始的大模型私有化部署流程,涵盖需求分析、环境搭建、模型准备、模型部署、性能优化和安全设置六个关键步骤,并提供相应的示例代码,确保企业能够高效、安全地将大型AI模型部署在本地或私有云上。
22 7
|
2天前
|
人工智能 安全 网络安全
揭秘!大模型私有化部署的全方位安全攻略与优化秘籍,让你的AI项目稳如磐石,数据安全无忧!
【10月更文挑战第24天】本文探讨了大模型私有化部署的安全性考量与优化策略,涵盖数据安全、防火墙配置、性能优化、容器化部署、模型更新和数据备份等方面,提供了实用的示例代码,旨在为企业提供全面的技术参考。
15 6
|
3天前
|
人工智能 自然语言处理 监控
函数计算玩转 AI 大模型
本文总结了对一个基于函数计算和AI大模型的解决方案的理解和实践体验。整体而言,方案描述详细、逻辑清晰,易于理解。但在技术细节和部署引导方面还有提升空间,如增加示例代码和常见错误解决方案。函数计算的优势在部署过程中得到了有效体现,特别是在弹性扩展和按需计费方面。然而,针对高并发场景的优化建议仍需进一步补充。总体评价认为,该解决方案框架良好,但需在文档和细节方面继续优化。
|
1天前
|
人工智能 Serverless API
电销行业的福音|AI大模型助力客户对话分析
本文介绍了如何利用AI大模型助力电销行业的客户对话分析,通过对象存储、智能对话分析技术和通义千问大模型,实现从客户语音和聊天互动中识别意图、发现服务质量问题,提升用户体验。方案部署简单,按量计费,帮助企业快速从海量对话数据中提取有价值的信息。
|
4天前
|
人工智能 API 决策智能
swarm Agent框架入门指南:构建与编排多智能体系统的利器 | AI应用开发
Swarm是OpenAI在2024年10月12日宣布开源的一个实验性质的多智能体编排框架。其核心目标是让智能体之间的协调和执行变得更轻量级、更容易控制和测试。Swarm框架的主要特性包括轻量化、易于使用和高度可定制性,非常适合处理大量独立的功能和指令。【10月更文挑战第15天】
41 6
|
4天前
|
人工智能
AI科学家太多,谁靠谱一试便知!普林斯顿新基准CORE-Bench:最强模型仅有21%准确率
【10月更文挑战第21天】普林斯顿大学研究人员提出了CORE-Bench,一个基于计算可重复性的AI代理基准,涵盖计算机科学、社会科学和医学领域的270个任务。该基准旨在评估AI代理在科学研究中的准确性,具有多样性、难度级别和现实相关性等特点,有助于推动AI代理的发展并提高计算可重复性。
14 4
|
5天前
|
机器学习/深度学习 人工智能 自然语言处理
评测:AI 大模型助力客户对话分析
该评测报告详细介绍了Al大模型在客户对话分析中的应用,涵盖了实践原理、实施方法、部署体验、示例代码及业务适应性。报告指出,该方案利用NLP和机器学习技术,深度解析对话内容,精准识别用户意图,显著提升服务质量与客户体验。实施方法清晰明了,文档详尽,部署体验顺畅,提供了丰富的引导和支持。示例代码实用性强,但在依赖库安装和资源限制方面需注意调整。整体上,该方案能够满足基本对话分析需求,但在特定行业场景中还需进一步定制化开发。
|
5天前
|
人工智能
热门 新 1024 云上见 AI大模型助力客户对话分析 2000个智能台灯等你来领
热门 新 1024 云上见 AI大模型助力客户对话分析 2000个智能台灯等你来领
24 4
|
5天前
|
人工智能 弹性计算 监控
触手可及,函数计算玩转 AI 大模型解决方案
阿里云推出的“触手可及,函数计算玩转 AI 大模型”解决方案,利用无服务器架构,实现AI大模型的高效部署和弹性伸缩。本文从实践原理、部署体验、优势展现及应用场景等方面全面评估该方案,指出其在快速部署、成本优化和运维简化方面的显著优势,同时也提出在性能监控、资源管理和安全性等方面的改进建议。
30 5

热门文章

最新文章