官方博客-第36页-阿里云开发者社区

ModelScope

2024-05-15

1121

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,121

澄潭董艺荃

2024-05-16

88519

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

这篇文章介绍了使用开源工具NextChat和Higress搭建的一个模拟ChatGPT和通义千问对话PK的测试场景。

澄潭董艺荃

88,519

朱坪刘松伟赵世振

2024-07-01

22630

阿里云 SAE 助力修正商城 3 周内提升系统承载能力 20 倍，轻松应对春晚流量

在 2024 年春节前夕，修正电商事业部面临了前所未有的技术挑战，修正将参与春晚的全民健康好礼派发的活动，且在央视及各大平台进行广告投放，预计流量激增至 16 亿，系统需要承载保底 5 万 QPS，目标 10 万 QPS。修正技术团队迫切需要升级 APP 架构以应对即将到来的超高并发场景。这一挑战不仅是对技术的考验，更是对修正品牌实力的一次展示。为了应对这次巨大的技术挑战，修正技术团队选择与阿里云云原生团队合作，进行 APP 架构的升级。

朱坪刘松伟赵世振等

22,630

龙蜥社区OpenAnolis

2024-07-05

690

重新定义 AI 部署效率与性能，ZOLOZ 借助 AC2 实现低成本高性能的提优的方式｜ AI 案例推荐

ZOLOZ，视觉 AI 推理的算力和成本问题求解。

龙蜥社区OpenAnolis

690

和君

2024-08-06

1357

AnalyticDB for MySQL：AI时代实时数据分析的最佳选择

阿里云云原生数据仓库AnalyticDB MySQL（ADB-M)与被OpenAI收购的实时分析数据库Rockset对比，两者在架构设计上有诸多相似点，例如存算分离、实时写入等，但ADB-M在多个方面展现出了更为成熟和先进的特性。ADB-M支持更丰富的弹性能力、强一致实时数据读写、全面的索引类型、高吞吐写入、完备的DML和Online DDL操作、智能的数据生命周期管理。在向量检索与分析上，ADB-M提供更高检索精度。ADB-M设计原理包括分布式表、基于Raft协议的同步层、支持DML和DDL的引擎层、高性能低成本的持久化层，这些共同确保了ADB-M在AI时代作为实时数据仓库的高性能与高性价比

和君

1,357

百潼

2024-08-12

8129

敦煌智旅：Serverless 初探，运维提效 60%

SAE 提供了一个开箱即用的 Serverless PaaS 平台，提供了微服务、监控等能力，帮助敦煌智旅很好地解决了发版困难、运维困难、弹性能力不足和资源利用率低等痛点问题。成功实现轻松应对 10 倍突增流量洪峰，运维效率大幅提升。

百潼

8,129

易霏夏花

2024-08-16

7798

PolarDB-X 存储引擎核心技术 | Lizard B+tree 优化

PolarDB-X 分布式数据库，采用集中式和分布式一体化的架构，为了能够灵活应对混合负载业务，作为数据存储的 Data Node 节点采用了多种数据结构，其中使用行存的结构来提供在线事务处理能力，作为 100% 兼容 MySQL 生态的数据库，DN 在 InnoDB 的存储结构基础上，进行了深度优化，大幅提高了数据访问的效率。

易霏夏花

7,798

阿里云云原生

2024-09-02

653

西游再现，一键部署 Flux 文生图大模型生成西游人物

从花果山的灵石出世，到取经路上的九九八十一难，再到大闹天宫的惊心动魄……这些耳熟能详的西游场景，如今都能通过 Flux 模型，以超乎想象的细节和真实感呈现在你眼前。本次实验在函数计算中内置的 flux.1-dev-fp8 大模型，搭配 Lora 模型，无需复杂的配置，一键部署，你就能成为这场视觉盛宴的创造者。

阿里云云原生

653

寻剑

2024-09-11

319

表格存储低成本向量检索服务助力 AI 检索

本文阐述了阿里云表格存储（Tablestore）如何通过其向量检索服务应对大规模数据检索的需求，尤其是在成本、规模和召回率这三个关键挑战方面。

寻剑

319

官方博客-第36页-阿里云开发者社区

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

阿里云 SAE 助力修正商城 3 周内提升系统承载能力 20 倍，轻松应对春晚流量

重新定义 AI 部署效率与性能，ZOLOZ 借助 AC2 实现低成本高性能的提优的方式｜ AI 案例推荐

AnalyticDB for MySQL：AI时代实时数据分析的最佳选择

敦煌智旅：Serverless 初探，运维提效 60%

PolarDB-X 存储引擎核心技术 | Lizard B+tree 优化

西游再现，一键部署 Flux 文生图大模型生成西游人物

表格存储低成本向量检索服务助力 AI 检索

官方博客-第36页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

阿里云 SAE 助力修正商城 3 周内提升系统承载能力 20 倍，轻松应对春晚流量

重新定义 AI 部署效率与性能，ZOLOZ 借助 AC2 实现低成本高性能的提优的方式｜ AI 案例推荐

AnalyticDB for MySQL：AI时代实时数据分析的最佳选择

敦煌智旅：Serverless 初探，运维提效 60%

PolarDB-X 存储引擎核心技术 | Lizard B+tree 优化

西游再现，一键部署 Flux 文生图大模型生成西游人物

表格存储低成本向量检索服务助力 AI 检索