降价后!有头部企业调用量翻了100倍

简介: 降价后!有头部企业调用量翻了100倍


上周,阿里云在武汉AI峰会上宣布阿里云通义千问大模型通义9款主力大模型大幅降价。其中,通义千问GPT-4级主力模型Qwen-Long 的 API输入价格低至1块钱可以买200万tokens。


距离大降价不到一周,企业和开发者用自己的积极响应表示了对通义大模型的支持。近日在阿里云青岛AI峰会上,阿里云智能集团副总裁、公共云华北大区总经理高飞表示已有头部企业调用量翻了100倍,并列举了通义大模型降价后的一周的三大变化。



公共云+API,直接调用大模型更便捷


一家制造业龙头企业,降价前基于开源模型做私有化部署,降价后CTO决定调整公司策略,以公共云+API调用通义的形式为主,进一步提效降本。


不管是开源模型还是商业化模型,公共云+API都将成为企业使用大模型的主流方式。最近的一份调查显示,70%的组织正在使用这种方式。


为了更好的支持生成式人工智能的创新,阿里云已经建立了“以模型为中心”的完整技术栈,进一步发挥公共云的成本和性能优势。自研的异构芯片互联、高性能网络HPN7.0、高性能存储CPFS、人工智能平台PAI等核心技术和产品,构建了极致弹性的AI算力调度系统。同时,百炼分布式推理加速引擎,也压缩了模型推理成本,并加快模型推理速度。


投入产出比更好,大规模应用更轻松

降价后,一家头部招聘企业将大模型从简历筛查推广到更多创新业务场景。以往,人工和智能的成本难分高下,降价后高下立判。一周内,该企业的大模型调用量翻了100倍,但数百万调用量的成本不到200元,成本大幅下降。


即便是同样的开源模型,在公共云上的调用价格也远远低于私有化部署。以使用Qwen-72B开源模型、每月1亿tokens用量为例,在阿里云百炼上直接调用API每月仅需600元,私有化部署的成本平均每月超1万元。


未来,相较于模型的私有化部署,公共云上调用的成本优势会持续扩大,这是由公共云的规模化优势决定的。


调用接近“免费”,“先跑起来”更容易


用大模型做业务创新,对中小企业和开发者来说,是非常友好的方式。没有很高的技术门槛,也没有很重的技术投入,接近“免费”的使用成本,打消了他们最后的顾虑——不用考虑先算钱,还是先做应用。


同时,阿里云百炼平台还内置了大模型定制与应用开发工具链,开发者可以便捷地测试比较不同模型,开发专属大模型,并轻松搭建RAG等应用。从调模型、搭应用到对外服务,一站式搞定。


/ END /


目录
相关文章
|
19小时前
|
Python
如何将代码量迅速提升到一万行
如何将代码量迅速提升到一万行
|
7月前
|
小程序 vr&ar
一个小动作,点击量上涨17倍,有小程序就能用!
一个小动作,点击量上涨17倍,有小程序就能用!
69 11
|
vr&ar 开发工具 图形学
Unity引擎更新收费模式:从收入分成转向游戏安装量,将会有哪些影响呢
Unity引擎更新收费模式:从收入分成转向游戏安装量,将会有哪些影响呢
|
存储 Cloud Native 前端开发
12-如何抗住双11一天几十亿的订单量?JVM该如何设置内存?
通过之前相关JVM的基础知识学习我们可以结合一些实际生产案例来进行结合巩固和说明,我们在上线一个生产系统的时候,针对预估的并发压力,到底应该如何合理的给出一个未经过调优的比较合理的初始值。 另外我们会分析各种参数在设置的时候有哪些考虑的点,Java堆内存到底需要多大?新生代和老年代的内存分别需要多大?永久代和虚拟机栈分别需要多大?这些我们都会结合案例来一步一步的分析。 注意:JVM参数到底该如何设置,一定是根据不同的业务系统具体的一些场景来调整的,不是说有一个通用的配置和模板,照着设就没问题了,这个思路是肯定不对的,一定要结合案例和业务场景来分析。
160 0
12-如何抗住双11一天几十亿的订单量?JVM该如何设置内存?
|
存储 算法 数据可视化
将330亿参数大模型「塞进」单个消费级GPU,加速15%、性能不减
将330亿参数大模型「塞进」单个消费级GPU,加速15%、性能不减
196 0
|
Python
三年前写的文章,阅读量暴涨了6.8万。。。
三年前写的文章,阅读量暴涨了6.8万。。。
108 0
|
编解码 运维 监控
轻松处理高于平常10倍的视频需求,还能节省60%的IT成本,蓝墨做对了什么?
如果说Serverless到底解决了什么问题,核心就是节约成本、节省精力。
3342 13
轻松处理高于平常10倍的视频需求,还能节省60%的IT成本,蓝墨做对了什么?
|
存储 缓存 分布式计算
腾讯自选股如何实现单位小时内完成千万级数据运算
腾讯自选股 App 在增加了综合得分序的 Feed 流排序方式:需要每天把(将近 1000W 数据量)的 feed 流信息进行算分计算更新后回写到数据层。目前手上的批跑物理机器是 16 核(因为混部,无法独享 CPU),同时剩下可用内存仅 4-8G。显而易见的是:我们可以申请机器,多机部署,分片计算或者通过现有的大数据平台 Hadoop 进行运算都看似可以解决问题。但是由于更新 feed 流的操作需要依赖下游服务(这里暂且叫 A,后续文中提到下游服务均可称 A 服务),而下游的服务 A-Server 本身是个 DB 强绑定的关系,也就说明了下游的服务瓶颈在于 DB 的 QPS
466 0
腾讯自选股如何实现单位小时内完成千万级数据运算
|
SQL 缓存 搜索推荐
数据层缓存(网站性能翻10倍)
缓存是一把尖刀,合理使用可大大提升吞吐率!
128 0
|
运维 Kubernetes 负载均衡
节省 58% IT 成本,调用函数计算超过 30 亿次,石墨文档的 Serverless 实践
云原生时代,逐渐完善的 IT 基础设施,让企业能更高效地进行数字化创新。