官方博客-第13页-阿里云开发者社区

子白

2024-05-15

102480

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,480

阿里云瑶池数据库

2024-11-06

1752

大咖说｜Data+AI：企业智能化转型的核心驱动力

阿里云DMS+X：一站式Data+AI平台

阿里云瑶池数据库

1,752

亦达

2025-02-20

738

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

738

灵杰开发者

2025-08-08

658

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

简介：本文整理自阿里云高级技术专家李麟在Flink Forward Asia 2025新加坡站的分享，介绍了Flink 2.1 SQL在实时数据处理与AI融合方面的关键进展，包括AI函数集成、Join优化及未来发展方向，助力构建高效实时AI管道。

灵杰开发者

658

穿杨

2024-08-21

434

谈谈优雅的钩子--bpftrace

bpftrace是一个内核跟踪工具，简单来说就是在函数上挂个钩子，挂上钩子后就可以将函数的入参和返回值取出来再放入程序进行二次编程，最终能让程序按照我们的意图来对函数进行观测。

穿杨

434

阿里云云原生

2025-04-28

1003

对比测评：AI编程工具需要 Rules 能力

通义灵码Project Rules是一种针对AI代码生成的个性化规则设定工具，旨在解决AI生成代码不精准或不符合开发者需求的问题。通过定义编码规则（如遵循SOLID原则、OWASP安全规范等），用户可引导模型生成更符合项目风格和偏好的代码。例如，在使用阿里云百炼服务平台的curl调用时，通义灵码可根据预设规则生成Java代码，显著提升代码采纳率至95%以上。此外，还支持技术栈、应用逻辑设计、核心代码规范等多方面规则定制，优化生成代码的质量与安全性。

阿里云云原生

1,003

阿里云云原生

2025-05-16

670

日志采集 Agent 性能大比拼——LoongCollector 性能深度测评

为了展现 LoongCollector 的卓越性能，本文通过纵向（LoongCollector 与 iLogtail 产品升级对比）和横向（LoongCollector 与其他开源日志采集 Agent 对比）两方面对比，深度测评不同采集 Agent 在常见的日志采集场景下的性能。

阿里云云原生

670

赫曦

2024-05-15

93218

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

本文主要介绍了通过弹性，实现成本优化，解决集群资源利用率难题。

赫曦

93,218

ModelScope

2024-05-15

1230

元象大模型开源30款量化版本加速低成本部署丨附教程

元象大模型一次性发布30款量化版本，全开源，无条件免费商用。

ModelScope

1,230

官方博客-第13页-阿里云开发者社区

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大咖说｜Data+AI：企业智能化转型的核心驱动力

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

谈谈优雅的钩子--bpftrace

对比测评：AI编程工具需要 Rules 能力

日志采集 Agent 性能大比拼——LoongCollector 性能深度测评

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

元象大模型开源30款量化版本加速低成本部署丨附教程

官方博客-第13页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大咖说｜Data+AI：企业智能化转型的核心驱动力

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

谈谈优雅的钩子--bpftrace

对比测评：AI编程工具需要 Rules 能力

日志采集 Agent 性能大比拼——LoongCollector 性能深度测评

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

元象大模型开源30款量化版本 加速低成本部署丨附教程

元象大模型开源30款量化版本加速低成本部署丨附教程