本文来源于阿里云社区电子书《百炼成金-大金融模型新篇章》
问题 2: “开源模型 vs 商业模型”,左右互搏的自建大模型之路
在大模型选型之路上,是选择开源模型还是商业模型?开源大模型和开源软件是一回事吗?
成熟开源软件与当下开源模型区别:
1、成熟开源软件通常是技术和能力相对成熟和稳定的软件应用和系统,分享的是完整的代码库和文档,用户可以自由地对与自身业务有关的代码进行修改,一般以使用核心能力为主定制为辅,版本迭代周期相对比较慢,同时也会规定了用户使用软件的权利和限制条件。
2、当下开源模型是专注于数据科学、人工智能和相关领域,作为数据处理和分析的关键组件,正处于技术迭代的高速发展期,一般以月或季度为单位进行新版本发布,并且技术和能力持续性攀升,一般版本开源是有限的,无法按照客户业务进行深度的定制,并且全局能力一般不建议调整。
开源模型与商业模型的优势与不足:
1、开源模型:通常允许用户审查和验证模型的代码和架构,不需要支付额外的许可费用,能够通过社区迭代升级。但需要专业人才研究和业务磨合尝试,周期长见效慢,缺少专门维护和支持,不包含商业产品中的安全和稳定性,文档和易用性支持较弱,模型升级迭代周期一般6-12 个月,业务集成应用的时间会更长。我们不应该拘泥于对种类繁多参数的基础模型进行训练或微调,模型能力比对和测评,应该把更多精力放在如何让模型在业务中产生价值,因为不同的模型因训练数据的差别,业务适配能力又有不同。
2、商业模型:提供商虽然提供全面的客户支持和服务,附带明确的服务等级协议(SLA),模型迭代升级非常快,公有云以月为单位小版本迭代,线下以季度订阅更新,并提供对兼容性、稳定性和安全性的保证,能够满足金融行业的法规和遵从性要求,也提供完整的解决方案,软硬件产品的良好整合,降低业务场景落地的风险。但技术透明性较差,长期依赖特定的商业模型和平台可能导致供应商锁定,降低切换供应商的灵活性。