官方博客-第26页-阿里云开发者社区

阿里云云原生

2024-11-01

963

Serverless GPU：助力 AI 推理加速

近年来，AI 技术发展迅猛，企业纷纷寻求将 AI 能力转化为商业价值，然而，在部署 AI 模型推理服务时，却遭遇成本高昂、弹性不足及运维复杂等挑战。本文将探讨云原生 Serverless GPU 如何从根本上解决这些问题，以实现 AI 技术的高效落地。

阿里云云原生

963

邹星宇刘尧

2024-12-04

577

C5GAME 游戏饰品交易平台借助 RocketMQ Serverless 保障千万级玩家流畅体验

游戏行业蓬勃发展，作为国内领先的 STEAM 游戏饰品交易的服务平台，看 C5GAME 如何利用 RocketMQ Serverless 技术，为千万级玩家提供流畅的游戏体验，同时降低成本并提升运维效率。

邹星宇刘尧

577

阿里云云原生

2024-12-17

827

10 分钟打造你的专属 AI 客服

在这个数字化时代，提供卓越的客户服务已成为企业脱颖而出的关键。为了满足这一需求，越来越多的企业开始探索人工智能（AI）助手的应用，以实现全天候（7x24）的客户咨询响应，全面提升用户体验和业务竞争力。本解决方案通过函数计算FC 和大模型服务平台百炼，为您提供一个高效便捷构建 AI 助手思路。

阿里云云原生

827

赵世振

2024-12-25

2042

通义视觉推理大模型QVQ-72B-preview重磅上线

Qwen团队推出了新成员QVQ-72B-preview，这是一个专注于提升视觉推理能力的实验性研究模型。提升了视觉表示的效率和准确性。它在多模态评测集如MMMU、MathVista和MathVision上表现出色，尤其在数学推理任务中取得了显著进步。尽管如此，该模型仍存在一些局限性，仍在学习和完善中。

赵世振

2,042

别梦

2023-08-07

621

MaxCompute ODPS 重装上阵，QUALIFY

MaxCompute支持QUALIFY语法过滤Window函数的结果，使得查询语句更简洁易理解。Window函数和QUALIFY语法之间的关系可以类比聚合函数+GROUP BY语法和HAVING语法。

别梦

621

ModelScope

2024-05-15

925

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

基于单个开源小模型的工具调用Agent，由于模型容量和预训练能力获取的限制，无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。

ModelScope

925

隆基

2024-05-15

109227

深度剖析 RocketMQ 5.0，消息进阶：如何支撑复杂业务消息场景？

本文主要学习 RocketMQ 的一致性特性，一致性对于交易、金融都是刚需。从大规模复杂业务出发，学习 RocketMQ 的 SQL 订阅、定时消息等特性。再从高可用的角度来看，这里更多的是大型公司对于高阶可用性的要求，如同城容灾、异地多活等。

隆基

109,227

林清山

2024-05-15

112194

RocketMQ 流数据库解析：实现一体化流处理

RocketMQ 5.0 是一款云原生的消息中间件，旨在覆盖更多业务场景。它针对国内企业在数字化转型中面临的多场景消息处理需求，提供了一体化的解决方案。

林清山

112,194

ModelScope

2024-05-15

717

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

717

官方博客-第26页-阿里云开发者社区

类目筛选

内容类型

Serverless GPU：助力 AI 推理加速

C5GAME 游戏饰品交易平台借助 RocketMQ Serverless 保障千万级玩家流畅体验

10 分钟打造你的专属 AI 客服

通义视觉推理大模型QVQ-72B-preview重磅上线

MaxCompute ODPS 重装上阵，QUALIFY

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

深度剖析 RocketMQ 5.0，消息进阶：如何支撑复杂业务消息场景？

RocketMQ 流数据库解析：实现一体化流处理

联合XTuner，魔搭社区全面支持数据集的长文本训练

官方博客-第26页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

Serverless GPU：助力 AI 推理加速

C5GAME 游戏饰品交易平台借助 RocketMQ Serverless 保障千万级玩家流畅体验

10 分钟打造你的专属 AI 客服

通义视觉推理大模型QVQ-72B-preview重磅上线

MaxCompute ODPS 重装上阵，QUALIFY

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

深度剖析 RocketMQ 5.0，消息进阶：如何支撑复杂业务消息场景？

RocketMQ 流数据库解析：实现一体化流处理

联合XTuner，魔搭社区全面支持数据集的长文本训练