官方博客-第22页-阿里云开发者社区

望宸

2025-02-20

645

大模型推理服务全景图

推理性能的提升涉及底层硬件、模型层，以及其他各个软件中间件层的相互协同，因此了解大模型技术架构的全局视角，有助于我们对推理性能的优化方案进行评估和选型。

望宸

645

橙唯

2025-02-21

897

基于LLM打造沉浸式3D世界

阿里云数据可视化产品DataV团队一直在三维交互领域进行前沿探索，为了解决LLMs与3D结合的问题，近期在虚幻引擎内结合通义千问大模型家族打造了一套基于LLM的实时可交互3D世界方案，通过自然语言来与引擎内的3D世界进行交互。

橙唯

897

笃敏

2025-03-28

245

架构革新：揭示卓越性能与高可扩展的共赢秘诀

为了构建现代化的可观测数据采集器LoongCollector，iLogtail启动架构通用化升级，旨在提供高可靠、高可扩展和高性能的实时数据采集和计算服务。然而，通用化的过程总会伴随性能劣化，本文重点介绍LoongCollector的性能优化之路，并对通用化和高性能之间的平衡给出见解。

笃敏

245

致问

2023-09-15

120024

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

本文将会分享Hologres RoaringBitmap 方案在画像分析的应用实践，实现更快更准的画像分析。

致问

120,024

阿里云MaxCompute

2023-09-27

1419

深入MaxCompute，人力家借助Information Schema合理治理费用

本文将为大家带来MaxCompute与人力家客户案例深度解读。

阿里云MaxCompute

1,419

非有

2024-05-15

1484

一文详解 Java 限流接口实现

本文介绍的实现方式属于应用级限制，应用级限流方式只是单应用内的请求限流，不能进行全局限流。要保证系统的抗压能力，限流是一个必不可少的环节，虽然可能会造成某些用户的请求被丢弃，但相比于突发流量造成的系统宕机来说，这些损失一般都在可以接受的范围之内。

非有

1,484

吴昆

2024-05-15

49931

秒级弹性，探索弹性调度与虚拟节点如何迅速响应瞬时算力需求

秒级弹性！探索弹性调度与虚拟节点如何迅速响应瞬时算力需求？

吴昆

49,931

ModelScope

2024-05-15

1138

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,138

言澈

2024-05-15

1120

全景剖析阿里云容器网络数据链路（六）—— ASM Istio

本文是[全景剖析容器网络数据链路]第六部分部分，主要介绍ASM Istio模式下，数据面链路的转转发链路。

言澈

1,120

官方博客-第22页-阿里云开发者社区

类目筛选

内容类型

大模型推理服务全景图

基于LLM打造沉浸式3D世界

架构革新：揭示卓越性能与高可扩展的共赢秘诀

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

深入MaxCompute，人力家借助Information Schema合理治理费用

一文详解 Java 限流接口实现

秒级弹性，探索弹性调度与虚拟节点如何迅速响应瞬时算力需求

vLLM部署Yuan2.0：高吞吐、更便捷

全景剖析阿里云容器网络数据链路（六）—— ASM Istio

官方博客-第22页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大模型推理服务全景图

基于LLM打造沉浸式3D世界

架构革新：揭示卓越性能与高可扩展的共赢秘诀

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

深入MaxCompute，人力家借助Information Schema合理治理费用

一文详解 Java 限流接口实现

秒级弹性，探索弹性调度与虚拟节点如何迅速响应瞬时算力需求

vLLM部署Yuan2.0：高吞吐、更便捷

全景剖析阿里云容器网络数据链路（六）—— ASM Istio