《百炼成金-大金融模型新篇章》––04.问题2:“开源模型vs商业模型”,左右互搏的自建大模型之路

简介: 百炼必定成金,新质生产力会催生新质劳动力,谨以此文抛砖引玉,希望与业内的各位朋友一同探讨如何积极拥抱并运用大模型技术,以应对和驾驭不断变化的市场环境,实现科技金融持续稳定的提质增效和创新发展,携手开启金融大模型未来新篇章。

本文来源于阿里云社区电子书《百炼成金-大金融模型新篇章》


问题 2: “开源模型 vs 商业模型”,左右互搏的自建大模型之路


在大模型选型之路上,是选择开源模型还是商业模型?开源大模型和开源软件是一回事吗?


成熟开源软件与当下开源模型区别:


1、成熟开源软件通常是技术和能力相对成熟和稳定的软件应用和系统,分享的是完整的代码库和文档,用户可以自由地对与自身业务有关的代码进行修改,一般以使用核心能力为主定制为辅,版本迭代周期相对比较慢,同时也会规定了用户使用软件的权利和限制条件。


2、当下开源模型是专注于数据科学、人工智能和相关领域,作为数据处理和分析的关键组件,正处于技术迭代的高速发展期,一般以月或季度为单位进行新版本发布,并且技术和能力持续性攀升,一般版本开源是有限的,无法按照客户业务进行深度的定制,并且全局能力一般不建议调整。


开源模型与商业模型的优势与不足:


1、开源模型:通常允许用户审查和验证模型的代码和架构,不需要支付额外的许可费用,能够通过社区迭代升级。但需要专业人才研究和业务磨合尝试,周期长见效慢,缺少专门维护和支持,不包含商业产品中的安全和稳定性,文档和易用性支持较弱,模型升级迭代周期一般6-12 个月,业务集成应用的时间会更长。我们不应该拘泥于对种类繁多参数的基础模型进行训练或微调,模型能力比对和测评,应该把更多精力放在如何让模型在业务中产生价值,因为不同的模型因训练数据的差别,业务适配能力又有不同。


2、商业模型:提供商虽然提供全面的客户支持和服务,附带明确的服务等级协议(SLA),模型迭代升级非常快,公有云以月为单位小版本迭代,线下以季度订阅更新,并提供对兼容性、稳定性和安全性的保证,能够满足金融行业的法规和遵从性要求,也提供完整的解决方案,软硬件产品的良好整合,降低业务场景落地的风险。但技术透明性较差,长期依赖特定的商业模型和平台可能导致供应商锁定,降低切换供应商的灵活性。

相关文章
|
15天前
|
Go 开发工具
百炼-千问模型通过openai接口构建assistant 等 go语言
由于阿里百炼平台通义千问大模型没有完善的go语言兼容openapi示例,并且官方答复assistant是不兼容openapi sdk的。 实际使用中发现是能够支持的,所以自己写了一个demo test示例,给大家做一个参考。
|
24天前
|
机器学习/深度学习 API
重磅!阿里云百炼上线Qwen百万长文本模型
重磅!阿里云百炼上线Qwen百万长文本模型
72 11
重磅!阿里云百炼上线Qwen百万长文本模型
|
21天前
|
机器学习/深度学习 人工智能 安全
通义千问开源的QwQ模型,一个会思考的AI,百炼邀您第一时间体验
Qwen团队推出新成员QwQ-32B-Preview,专注于增强AI推理能力。通过深入探索和试验,该模型在数学和编程领域展现了卓越的理解力,但仍在学习和完善中。目前,QwQ-32B-Preview已上线阿里云百炼平台,提供免费体验。
|
29天前
|
机器学习/深度学习 API Python
阿里云百炼上线Qwen2.5-Turbo模型,可支持100万超长上下文
Qwen2.5-Turbo已上线,支持100万超长上下文,相当于100万个英文单词或150万个汉字。该模型在多个长文本任务评测集中表现出色,超越GPT-4,同时在推理速度上实现4.3倍提升。限时免费赠送1000万tokens额度,欢迎体验。
|
28天前
|
JSON 数据可视化 知识图谱
基于百炼 qwen plus 、开源qwen2.5 7B Instruct 建非schema限定的图谱 用于agent tool的图谱形式结构化 文本资料方案
基于百炼 qwen plus 的上市企业ESG图谱构建工作,通过调用阿里云的 OpenAI 服务,从 Excel 文件读取上市公司 ESG 报告数据,逐条处理并生成知识图谱,最终以 YAML 格式输出。该过程包括数据读取、API 调用、结果处理和文件保存等步骤,确保生成的知识图谱全面、动态且结构清晰。此外,还提供了基于 Pyvis 的可视化工具,将生成的图谱以交互式图形展示,便于进一步分析和应用。
353 3
|
4月前
|
人工智能 自然语言处理 API
阿里云百炼平台上线首个最新文生图模型FLUX中文优化版
由Stable Diffusion团队推出的开源文生图模型FLUX风靡全球,其生成质量媲美Midjourney,被誉为“开源王者”。阿里云百炼平台首发FLUX中文优化版,提升了中文指令的理解与执行能力。开发者可直接在平台上体验并调用FLUX模型,且享有1000张图像的免费生成额度,有效期180天。无需额外部署,即可轻松利用这一先进模型创造高质量图像。
|
4月前
|
人工智能 自然语言处理 API
阿里云百炼上线FLUX文生图模型中文优化版,可免费调用!
阿里云百炼上线FLUX文生图模型中文优化版,可免费调用!
511 6
|
5月前
|
人工智能 API 开发者
阿里云CTO周靖人:通义开源模型下载量破2000万,百炼实现150%增长!
阿里云CTO周靖人:通义开源模型下载量破2000万,百炼实现150%增长!
824 1
|
5月前
|
自然语言处理 开发者
通用文本向量模型全新升级至V3,开通百炼速来体验~~
阿里云新推出通用文本向量模型text-embedding-v3,基于LLM,支持50+语言,包括新增的意大利语等。模型升级亮点:8K长文本支持、可变向量维度、Sparse向量及不分Query/Document类型。现在提供50万免费tokens,有效期180天,计费0.0007元/1000 tokens。体验请访问[阿里云百炼官网](https://bailian.console.aliyun.com/?spm=a2c6h.13046898.publish-article.6.63066ffaL32qHM)
|
6月前
|
C++ 异构计算
《百炼成金-大金融模型新篇章》––05.问题3:“大模型vs越来越大的模型”,模型sIzE的军备竞赛
百炼必定成金,新质生产力会催生新质劳动力,谨以此文抛砖引玉,希望与业内的各位朋友一同探讨如何积极拥抱并运用大模型技术,以应对和驾驭不断变化的市场环境,实现科技金融持续稳定的提质增效和创新发展,携手开启金融大模型未来新篇章。