官方博客-第29页-阿里云开发者社区

ModelScope

2024-05-15

1138

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,138

ModelScope

2024-05-15

104687

手把手教你捏一个自己的Agent

Modelscope AgentFabric是一个基于ModelScope-Agent的交互式智能体应用，用于方便地创建针对各种现实应用量身定制智能体，目前已经在生产级别落地。

ModelScope

104,687

涯海

2024-05-15

533

链路追踪（Tracing）其实很简单——链路拓扑

最近一年，小玉所在的业务部门发起了轰轰烈烈的微服务化运动，大量业务中台应用被拆分成更细粒度的微服务应用。为了迎接即将到来的双十一大促重保活动，小玉的主管让她在一周内梳理出订单中心的全局关键上下游依赖，提前拉...

涯海

533

阿里云云原生

2024-05-15

57337

低成本、高稳定性 | 满帮集团 Eureka 和 ZooKeeper 的上云实践

业务体量增大后，日益凸显的架构稳定性问题该如何解决？满帮集团选择了上阿里云，采用阿里云 MSE Nacos，MSE ZooKeeper 产品替换原先的 Eureka 和 Zookeeper 集群，做到了低成本快速的架构升级，以及上云期间业务流量的无损平滑迁移。

阿里云云原生

57,337

澄潭董艺荃

2024-05-16

88535

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

这篇文章介绍了使用开源工具NextChat和Higress搭建的一个模拟ChatGPT和通义千问对话PK的测试场景。

澄潭董艺荃

88,535

陈浩章颖强

2024-05-29

55712

ICDE’24｜中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

PolarDB Serverless如何在0.5秒内实现跨机迁移？

陈浩章颖强

55,712

阿里云瑶池数据库

2024-06-18

707

内附原文｜SIGMOD’24：百万核的智能调度，云数仓如何结合AI处理用户混合负载

论文提出的Flux通过使用AI技术将短时和长时查询解耦进行自动弹性，解决了云数据仓库的性能瓶颈，同时支持了资源按需预留。Flux优于传统的方法，查询响应时间 (RT) 最多可减少75%，资源利用率提高19.0%，成本开销降低77.8%。

阿里云瑶池数据库

707

阿里云瑶池数据库

2024-07-11

537

OpenAI的选择，实时数仓成为企业AI深度布局赛道

AnalyticDB：数据智能化先驱者

阿里云瑶池数据库

537

阿里云云原生

2024-08-12

476

5 大场景上手通义灵码企业知识库 RAG

大家好，我是通义灵码，你的智能编程助手！今天就跟大家分享下企业知识库能帮开发者做些什么。

阿里云云原生

476

官方博客-第29页-阿里云开发者社区

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

手把手教你捏一个自己的Agent

链路追踪（Tracing）其实很简单——链路拓扑

低成本、高稳定性 | 满帮集团 Eureka 和 ZooKeeper 的上云实践

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

ICDE’24｜中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

内附原文｜SIGMOD’24：百万核的智能调度，云数仓如何结合AI处理用户混合负载

OpenAI的选择，实时数仓成为企业AI深度布局赛道

5 大场景上手通义灵码企业知识库 RAG

官方博客-第29页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

手把手教你捏一个自己的Agent

链路追踪（Tracing）其实很简单——链路拓扑

低成本、高稳定性 | 满帮集团 Eureka 和 ZooKeeper 的上云实践

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

ICDE’24｜中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

内附原文｜SIGMOD’24：百万核的智能调度，云数仓如何结合AI处理用户混合负载

OpenAI的选择，实时数仓成为企业AI深度布局赛道

5 大场景上手通义灵码企业知识库 RAG