《百炼成金-大金融模型新篇章》––04.问题2:“开源模型vs商业模型”,左右互搏的自建大模型之路

简介: 百炼必定成金,新质生产力会催生新质劳动力,谨以此文抛砖引玉,希望与业内的各位朋友一同探讨如何积极拥抱并运用大模型技术,以应对和驾驭不断变化的市场环境,实现科技金融持续稳定的提质增效和创新发展,携手开启金融大模型未来新篇章。

本文来源于阿里云社区电子书《百炼成金-大金融模型新篇章》


问题 2: “开源模型 vs 商业模型”,左右互搏的自建大模型之路


在大模型选型之路上,是选择开源模型还是商业模型?开源大模型和开源软件是一回事吗?


成熟开源软件与当下开源模型区别:


1、成熟开源软件通常是技术和能力相对成熟和稳定的软件应用和系统,分享的是完整的代码库和文档,用户可以自由地对与自身业务有关的代码进行修改,一般以使用核心能力为主定制为辅,版本迭代周期相对比较慢,同时也会规定了用户使用软件的权利和限制条件。


2、当下开源模型是专注于数据科学、人工智能和相关领域,作为数据处理和分析的关键组件,正处于技术迭代的高速发展期,一般以月或季度为单位进行新版本发布,并且技术和能力持续性攀升,一般版本开源是有限的,无法按照客户业务进行深度的定制,并且全局能力一般不建议调整。


开源模型与商业模型的优势与不足:


1、开源模型:通常允许用户审查和验证模型的代码和架构,不需要支付额外的许可费用,能够通过社区迭代升级。但需要专业人才研究和业务磨合尝试,周期长见效慢,缺少专门维护和支持,不包含商业产品中的安全和稳定性,文档和易用性支持较弱,模型升级迭代周期一般6-12 个月,业务集成应用的时间会更长。我们不应该拘泥于对种类繁多参数的基础模型进行训练或微调,模型能力比对和测评,应该把更多精力放在如何让模型在业务中产生价值,因为不同的模型因训练数据的差别,业务适配能力又有不同。


2、商业模型:提供商虽然提供全面的客户支持和服务,附带明确的服务等级协议(SLA),模型迭代升级非常快,公有云以月为单位小版本迭代,线下以季度订阅更新,并提供对兼容性、稳定性和安全性的保证,能够满足金融行业的法规和遵从性要求,也提供完整的解决方案,软硬件产品的良好整合,降低业务场景落地的风险。但技术透明性较差,长期依赖特定的商业模型和平台可能导致供应商锁定,降低切换供应商的灵活性。

目录
打赏
0
0
0
0
68
分享
相关文章
阿里云百炼已上线超强推理开源模型QwQ-32B,尺寸更小,性能比肩DeepSeek满血版
通义千问团队推出了320亿参数的QwQ-32B模型,通过大规模强化学习和多阶段训练,在数学、编程及通用能力上达到或超越了DeepSeek-R1等先进模型。QwQ-32B模型已在阿里云百炼上线,支持API调用,用户可通过官方文档了解详细使用方法。未来,团队将继续探索智能体与RL集成,推动人工通用智能的发展。
DeepSeek全尺寸模型上线阿里云百炼!
DeepSeek全尺寸模型上线阿里云百炼!
90 4
【最佳实践系列】零基础上手百炼语音AI模型
阿里云百炼语音AI服务提供了丰富的功能,包括语音识别、语音合成、实时翻译等。通过`alibabacloud-bailian-speech-demo`项目,可以一键调用这些服务,体验语音及大模型的魅力,降低接入门槛。该项目支持Python和Java,涵盖从简单的一句话合成到复杂的同声传译等多个示例,助力开发者快速上手并进行二次开发。
DeepSeek全尺寸模型上线阿里云百炼!
阿里云百炼平台近日上线了DeepSeek-V3、DeepSeek-R1及其蒸馏版本等六款全尺寸AI模型,参数量达671B,提供高达100万免费tokens。这些模型在数学、代码、自然语言推理等任务上表现出色,支持灵活调用和经济高效的解决方案,助力开发者和企业加速创新与数字化转型。示例代码展示了如何通过API使用DeepSeek-R1模型进行推理,用户可轻松获取思考过程和最终答案。
通义万相2.1视频/图像模型新升级!可在阿里云百炼直接体验
通义万相2.1模型推出新特征,包括复杂人物运动的稳定展现、现实物理规律的逼真还原及中英文视频特效的绚丽呈现。通过自研的高效VAE和DiT架构,增强时空上下文建模能力,支持无限长1080P视频的高效编解码,并首次实现中文文字视频生成功能。升级后的通义万相荣登VBench榜单第一,提供电影级分镜效果、四格漫画故事速览及情侣头像创意定制等多种玩法,满足多样化的视觉创作需求。可直接在阿里云百炼平台调用API体验这些功能。
【最佳实践系列】阿里云百炼「音视频实时互动」功能上线:几分钟实现模型到应用!
阿里云百炼推出「音视频实时互动」功能,支持0代码搭建并集成到Web、iOS和安卓应用。用户可轻松创建AI应用并分享。具体步骤包括新建智能体应用、配置模型(如通义千问-VL)、编写提示词、设置API-KEY及发布应用。平台提供多种渠道支持,如API、网页、小程序等,帮助用户快速构建成熟的AI应用。欢迎体验并在评论区交流反馈。
百炼-千问模型通过openai接口构建assistant 等 go语言
由于阿里百炼平台通义千问大模型没有完善的go语言兼容openapi示例,并且官方答复assistant是不兼容openapi sdk的。 实际使用中发现是能够支持的,所以自己写了一个demo test示例,给大家做一个参考。
通义千问开源的QwQ模型,一个会思考的AI,百炼邀您第一时间体验
Qwen团队推出新成员QwQ-32B-Preview,专注于增强AI推理能力。通过深入探索和试验,该模型在数学和编程领域展现了卓越的理解力,但仍在学习和完善中。目前,QwQ-32B-Preview已上线阿里云百炼平台,提供免费体验。
重磅!阿里云百炼上线Qwen百万长文本模型
重磅!阿里云百炼上线Qwen百万长文本模型
225 11

热门文章

最新文章

AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等