上周,阿里云在武汉AI峰会上宣布阿里云通义千问大模型通义9款主力大模型大幅降价。其中,通义千问GPT-4级主力模型Qwen-Long 的 API输入价格低至1块钱可以买200万tokens。
距离大降价不到一周,企业和开发者用自己的积极响应表示了对通义大模型的支持。近日在阿里云青岛AI峰会上,阿里云智能集团副总裁、公共云华北大区总经理高飞表示已有头部企业调用量翻了100倍,并列举了通义大模型降价后的一周的三大变化。
公共云+API,直接调用大模型更便捷
一家制造业龙头企业,降价前基于开源模型做私有化部署,降价后CTO决定调整公司策略,以公共云+API调用通义的形式为主,进一步提效降本。
不管是开源模型还是商业化模型,公共云+API都将成为企业使用大模型的主流方式。最近的一份调查显示,70%的组织正在使用这种方式。
为了更好的支持生成式人工智能的创新,阿里云已经建立了“以模型为中心”的完整技术栈,进一步发挥公共云的成本和性能优势。自研的异构芯片互联、高性能网络HPN7.0、高性能存储CPFS、人工智能平台PAI等核心技术和产品,构建了极致弹性的AI算力调度系统。同时,百炼分布式推理加速引擎,也压缩了模型推理成本,并加快模型推理速度。
投入产出比更好,大规模应用更轻松
降价后,一家头部招聘企业将大模型从简历筛查推广到更多创新业务场景。以往,人工和智能的成本难分高下,降价后高下立判。一周内,该企业的大模型调用量翻了100倍,但数百万调用量的成本不到200元,成本大幅下降。
即便是同样的开源模型,在公共云上的调用价格也远远低于私有化部署。以使用Qwen-72B开源模型、每月1亿tokens用量为例,在阿里云百炼上直接调用API每月仅需600元,私有化部署的成本平均每月超1万元。
未来,相较于模型的私有化部署,公共云上调用的成本优势会持续扩大,这是由公共云的规模化优势决定的。
调用接近“免费”,“先跑起来”更容易
用大模型做业务创新,对中小企业和开发者来说,是非常友好的方式。没有很高的技术门槛,也没有很重的技术投入,接近“免费”的使用成本,打消了他们最后的顾虑——不用考虑先算钱,还是先做应用。
同时,阿里云百炼平台还内置了大模型定制与应用开发工具链,开发者可以便捷地测试比较不同模型,开发专属大模型,并轻松搭建RAG等应用。从调模型、搭应用到对外服务,一站式搞定。
/ END /