官方博客-第25页-阿里云开发者社区

ModelScope

2024-05-15

1138

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,138

ModelScope

2024-05-15

104687

手把手教你捏一个自己的Agent

Modelscope AgentFabric是一个基于ModelScope-Agent的交互式智能体应用，用于方便地创建针对各种现实应用量身定制智能体，目前已经在生产级别落地。

ModelScope

104,687

探索云世界

2024-05-15

1041

阿里妈妈展示广告引擎新探索：迈向全局最优算力分配

在绿色计算的大背景下，算力分配将朝着更加高效和智能的方向持续演进。本文将介绍阿里妈妈展示广告引擎在全局视角下优化算力分配的新探索，让在线引擎像变形金刚一样灵活强悍。算力在提倡节能减排，降本增效，追求绿色技术的大趋势下，充分利用好算力资源，尤其是在阿里妈妈展示广告引擎这种使用近百万core机器资源的业...

探索云世界

1,041

阿里云云原生

2024-05-15

79768

让研发规范管得住，在流水线之上做研发流程

研发规范的目标，是为了解决或降低出现软件危机的风险。但传统流水线受限于工具的定位，无法解决研发规范的落地问题，需要在更高的层面来解决。阿里云云效团队经过内部启发后推出的新产品：云效应用交付平台 AppStack 给出了解决方案，快来使用体验吧！

阿里云云原生

79,768

澄潭董艺荃

2024-05-16

88535

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

这篇文章介绍了使用开源工具NextChat和Higress搭建的一个模拟ChatGPT和通义千问对话PK的测试场景。

澄潭董艺荃

88,535

陈浩章颖强

2024-05-29

55712

ICDE’24｜中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

PolarDB Serverless如何在0.5秒内实现跨机迁移？

陈浩章颖强

55,712

阿里云瑶池数据库

2024-06-18

707

内附原文｜SIGMOD’24：百万核的智能调度，云数仓如何结合AI处理用户混合负载

论文提出的Flux通过使用AI技术将短时和长时查询解耦进行自动弹性，解决了云数据仓库的性能瓶颈，同时支持了资源按需预留。Flux优于传统的方法，查询响应时间 (RT) 最多可减少75%，资源利用率提高19.0%，成本开销降低77.8%。

阿里云瑶池数据库

707

资源编排ROS

2024-06-25

824

ROS CDK魔法书：点亮博客上云新技能（JavaScript篇）

ROS CDK提供Asset类，将本地文件转化为云资源，通过ROS CDK部署时，自动上传到指定的OSS Bucket。ROS CDK简化了基础设施即代码的流程，通过TypeScript、JavaScript等编程语言代替JSON或YAML模板，提高了效率和安全性。在实际应用中，通过ROS CDK和OSS，可以将本地博客项目打包并部署到阿里云OSS，实现静态网站的云托管。整个过程包括初始化项目、配置凭证、打包博客内容、通过CDK将内容部署到OSS Bucket，以及配置静态网站托管和自定义域名。

资源编排ROS

824

阿里云瑶池数据库

2024-07-11

537

OpenAI的选择，实时数仓成为企业AI深度布局赛道

AnalyticDB：数据智能化先驱者

阿里云瑶池数据库

537

官方博客-第25页-阿里云开发者社区

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

手把手教你捏一个自己的Agent

阿里妈妈展示广告引擎新探索：迈向全局最优算力分配

让研发规范管得住，在流水线之上做研发流程

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

ICDE’24｜中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

内附原文｜SIGMOD’24：百万核的智能调度，云数仓如何结合AI处理用户混合负载

ROS CDK魔法书：点亮博客上云新技能（JavaScript篇）

OpenAI的选择，实时数仓成为企业AI深度布局赛道

官方博客-第25页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

手把手教你捏一个自己的Agent

阿里妈妈展示广告引擎新探索：迈向全局最优算力分配

让研发规范管得住，在流水线之上做研发流程

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

ICDE’24｜中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

内附原文｜SIGMOD’24：百万核的智能调度，云数仓如何结合AI处理用户混合负载

ROS CDK魔法书：点亮博客上云新技能（JavaScript篇）

OpenAI的选择，实时数仓成为企业AI深度布局赛道