本文来源于阿里云社区电子书《百炼成金-大金融模型新篇章》
问题 5: “杀手级通用大模型 vs 百花齐放专属大模型”,企业级 AI 应用的价值自证?
企业在利用大模型进行业务升级改造时,选择使用一个杀手级通用大模型,还是百花齐放的专属大模型,取决于您具体的业务需求、战略目标和资源限制。无论选择哪种模式,都会面临挑战和价值自证。
杀手级通用大模型:选择大参数的基础模型,结合企业的数据进行微调,构建企业级的杀手级通用大模型。其优势在于能快速处理多样化的任务和应用场景,更快的带来直接的业务价值和经济收益;其挑战在于越大参数的模型微调需要的数据量就越大,算力消耗也更大,而且也较难应对特殊的高并发低延时场景。
百花齐放的专属大模型:根据不同知识域的业务需要,选择适合参数的大模型微调业务专属大模型,能够吸引和满足更广泛的客户群体和个性化定制服务的需要。通常情况越小参数的大模型,微调的效果越好,越大参数的模型微调的效果越难保障。多样化的模型和应用需求,可以快速推动企业在不同领域进行技术和业务创新。但多样化专属大模型,贵在精不在多,如何决策需要构建哪些专属大模型呢?又如何解决多个专属大模型统一运维管理的挑战?
无论选择哪种方式,都要确保大模型构建的 AI 应用能够与企业的长期战略相契合,并在实现业务目标的同时,提升客户体验和企业运营效率。因企业的自身特有数据量有限,大模型的微调需量力而行,比如当前千亿参数以上的大模型就不适合微调,不仅成本消耗大且能力提升有限,有可能还会影响原有大模型的推理能力。更为重要的是要建立收集反馈和定期评估应用的机制,推动大模型和业务应用的优化,在不断调整和完善中体现出 AI 大模型的价值。