官方博客-第21页-阿里云开发者社区

望宸

2025-02-20

645

大模型推理服务全景图

推理性能的提升涉及底层硬件、模型层，以及其他各个软件中间件层的相互协同，因此了解大模型技术架构的全局视角，有助于我们对推理性能的优化方案进行评估和选型。

望宸

645

橙唯

2025-02-21

897

基于LLM打造沉浸式3D世界

阿里云数据可视化产品DataV团队一直在三维交互领域进行前沿探索，为了解决LLMs与3D结合的问题，近期在虚幻引擎内结合通义千问大模型家族打造了一套基于LLM的实时可交互3D世界方案，通过自然语言来与引擎内的3D世界进行交互。

橙唯

897

云服务器ECS

2023-07-10

4542

一键配置版：搭建高可用的微信/支付宝小程序服务

本文提供在阿里云云服务器ECS上基于CentOS 7.9 64位操作系统搭建高可用的小程序服务端的指引。同时指导您在本地开发一个简单的微信/支付宝小程序——ECS小助手，通过远程调用部署在ECS上的服务端，实现在小程序中输入框输入ECS实例ID查询实例详细信息的功能。

云服务器ECS

4,542

阿里云PolarDB

2023-07-26

1215

PolarDB-X 私有协议2.0

本文主要介绍私有协议2.0，也即XRPC的背景、总体设计、相关技术实现细节和性能测试结果。

阿里云PolarDB

1,215

致问

2023-09-15

120024

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

本文将会分享Hologres RoaringBitmap 方案在画像分析的应用实践，实现更快更准的画像分析。

致问

120,024

ModelScope

2024-05-15

1138

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,138

澄潭董艺荃

2024-05-16

88535

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

这篇文章介绍了使用开源工具NextChat和Higress搭建的一个模拟ChatGPT和通义千问对话PK的测试场景。

澄潭董艺荃

88,535

陈浩章颖强

2024-05-29

55712

ICDE’24｜中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

PolarDB Serverless如何在0.5秒内实现跨机迁移？

陈浩章颖强

55,712

阿里云瑶池数据库

2024-06-18

707

内附原文｜SIGMOD’24：百万核的智能调度，云数仓如何结合AI处理用户混合负载

论文提出的Flux通过使用AI技术将短时和长时查询解耦进行自动弹性，解决了云数据仓库的性能瓶颈，同时支持了资源按需预留。Flux优于传统的方法，查询响应时间 (RT) 最多可减少75%，资源利用率提高19.0%，成本开销降低77.8%。

阿里云瑶池数据库

707

官方博客-第21页-阿里云开发者社区

类目筛选

内容类型

大模型推理服务全景图

基于LLM打造沉浸式3D世界

一键配置版：搭建高可用的微信/支付宝小程序服务

PolarDB-X 私有协议2.0

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

vLLM部署Yuan2.0：高吞吐、更便捷

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

ICDE’24｜中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

内附原文｜SIGMOD’24：百万核的智能调度，云数仓如何结合AI处理用户混合负载

官方博客-第21页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大模型推理服务全景图

基于LLM打造沉浸式3D世界

一键配置版：搭建高可用的微信/支付宝小程序服务

PolarDB-X 私有协议2.0

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

vLLM部署Yuan2.0：高吞吐、更便捷

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

ICDE’24｜中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

内附原文｜SIGMOD’24：百万核的智能调度，云数仓如何结合AI处理用户混合负载