官方博客-第12页-阿里云开发者社区

子白

2024-05-15

102480

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,480

亦达

2025-02-20

738

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

738

灵杰开发者

2025-08-08

658

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

简介：本文整理自阿里云高级技术专家李麟在Flink Forward Asia 2025新加坡站的分享，介绍了Flink 2.1 SQL在实时数据处理与AI融合方面的关键进展，包括AI函数集成、Join优化及未来发展方向，助力构建高效实时AI管道。

灵杰开发者

658

穿杨

2024-08-21

434

谈谈优雅的钩子--bpftrace

bpftrace是一个内核跟踪工具，简单来说就是在函数上挂个钩子，挂上钩子后就可以将函数的入参和返回值取出来再放入程序进行二次编程，最终能让程序按照我们的意图来对函数进行观测。

穿杨

434

阿里云云原生

2025-04-28

1003

对比测评：AI编程工具需要 Rules 能力

通义灵码Project Rules是一种针对AI代码生成的个性化规则设定工具，旨在解决AI生成代码不精准或不符合开发者需求的问题。通过定义编码规则（如遵循SOLID原则、OWASP安全规范等），用户可引导模型生成更符合项目风格和偏好的代码。例如，在使用阿里云百炼服务平台的curl调用时，通义灵码可根据预设规则生成Java代码，显著提升代码采纳率至95%以上。此外，还支持技术栈、应用逻辑设计、核心代码规范等多方面规则定制，优化生成代码的质量与安全性。

阿里云云原生

1,003

赫曦

2024-05-15

93218

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

本文主要介绍了通过弹性，实现成本优化，解决集群资源利用率难题。

赫曦

93,218

ModelScope

2024-05-15

1230

元象大模型开源30款量化版本加速低成本部署丨附教程

元象大模型一次性发布30款量化版本，全开源，无条件免费商用。

ModelScope

1,230

虎仔

2024-10-22

1204

最佳实践：通义灵码生成单元测试，让单测更简单

本文首先讲述了什么是单元测试、单元测试的价值、一个好的单元测试所具备的原则，进而引入如何去编写一个好的单元测试，通义灵码是如何快速生成单元测试的。

虎仔

1,204

羿莉

2024-12-17

1626

云上数据安全保护：敏感日志扫描与脱敏实践详解

随着企业对云服务的广泛应用，数据安全成为重要课题。通过对云上数据进行敏感数据扫描和保护，可以有效提升企业或组织的数据安全。本文主要基于阿里云的数据安全中心数据识别功能进行深入实践探索。通过对商品购买日志的模拟，分析了如何使用阿里云的工具对日志数据进行识别、脱敏（3 种模式）处理和基于 StoreView 的查询脱敏方式，从而在保障数据安全的同时满足业务需求。通过这些实践，企业可以有效降低数据泄漏风险，提升数据治理能力和系统安全性。

羿莉

1,626

官方博客-第12页-阿里云开发者社区

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

谈谈优雅的钩子--bpftrace

对比测评：AI编程工具需要 Rules 能力

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

元象大模型开源30款量化版本加速低成本部署丨附教程

最佳实践：通义灵码生成单元测试，让单测更简单

云上数据安全保护：敏感日志扫描与脱敏实践详解

官方博客-第12页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

谈谈优雅的钩子--bpftrace

对比测评：AI编程工具需要 Rules 能力

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

元象大模型开源30款量化版本 加速低成本部署丨附教程

最佳实践：通义灵码生成单元测试，让单测更简单

云上数据安全保护：敏感日志扫描与脱敏实践详解

元象大模型开源30款量化版本加速低成本部署丨附教程