官方博客-第3页-阿里云开发者社区

子白

2024-05-15

102427

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,427

杨永

2024-05-15

93856

使用KMS为MSE-Nacos敏感配置加密的最佳实践

本文主要介绍通过KMS密钥管理服务产生的密钥对敏感的AK等数据进行加密之后可以有效解决泄漏带来的安全风险问题，其次通过KMS凭据托管的能力直接将MSE的主AK进行有效管理，保障全链路无AK的业务体验，真正做到安全、可控。

杨永

93,856

剑洁雲尧

2024-09-04

612

浅谈Elasticsearch的入门与实践

本文主要围绕ES核心特性：分布式存储特性和分析检索能力，介绍了概念、原理与实践案例，希望让读者快速理解ES的核心特性与应用场景。

剑洁雲尧

612

赫曦

2024-05-15

93168

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

本文主要介绍了通过弹性，实现成本优化，解决集群资源利用率难题。

赫曦

93,168

寒斜

2024-11-19

738

基于事件驱动构建 AI 原生应用

AI 应用在商业化服务的阶段会面临诸多挑战，比如更快的服务交付速度，更实时、精准的结果以及更人性化的体验等，传统架构限制于同步交互，无法满足上述需求，本篇文章给大家分享一下如何基于事件驱动架构应对上述挑战。

寒斜

738

资源编排ROS

2024-05-15

1688

大模型不知不觉已经火了快一年了，拥有一个能够随时对话使用的大模型已经成为不少人的刚需。然而，最大的问题可能是如何访问和调用对话模型。如果，我是说如果，能在您的即时通讯软件钉钉中直接与通义千问对话，是不是会让这一切更方便快捷？！按照传统方案，我们要实现上述场景可能需要非常繁琐的接入步骤，甚至还需要自行开发很多代码，这样的准入门槛实在，太！高！啦！而今天，我要向各位隆重介绍一个新的解决方案——阿里云计算巢AppFlow应用与数据集成平台，无需任何代码开发，简单快捷，自动连接企业内部应用与外部应用或数据，搭建企业的自动化服务流程，帮助个人、企业降低了集成实施的周期和成本。

资源编排ROS

1,688

阿里云云原生

2025-04-28

702

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

本文介绍了阿里云容器服务（ACK）支持的StrmVol存储卷方案，旨在解决Kubernetes环境中海量小文件访问性能瓶颈问题。通过虚拟块设备与内核态文件系统（如EROFS）结合，StrmVol显著降低了小文件访问延迟，适用于AI训练集加载、时序日志分析等场景。其核心优化包括内存预取加速、减少I/O等待、内核态直接读取避免用户态切换开销，以及轻量索引快速初始化。示例中展示了基于Argo Workflows的工作流任务，模拟分布式图像数据集加载，测试结果显示平均处理时间为21秒。StrmVol适合只读场景且OSS端数据无需频繁更新的情况，详细使用方法可参考官方文档。

阿里云云原生

702

阿里云实时数仓Hologres

2024-05-15

1001

Flink+Paimon+Hologres 构建实时湖仓数据分析

本文整理自阿里云高级专家喻良，在 Flink Forward Asia 2023 主会场的分享。

阿里云实时数仓Hologres

1,001

宝惜

2024-11-15

478

架构师的真内核

本文旨在帮助大家深入理解技术、架构和团队领导力的本质，从而获得持续成长的方法。欢迎在文末留言，你觉得架构师需要具备的核心能力是什么？

宝惜

478

官方博客-第3页-阿里云开发者社区

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

使用KMS为MSE-Nacos敏感配置加密的最佳实践

浅谈Elasticsearch的入门与实践

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

基于事件驱动构建 AI 原生应用

简单几步，钉钉机器人秒变通义千问对话机器人

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

Flink+Paimon+Hologres 构建实时湖仓数据分析

架构师的真内核

官方博客-第3页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

使用KMS为MSE-Nacos敏感配置加密的最佳实践

浅谈Elasticsearch的入门与实践

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

基于事件驱动构建 AI 原生应用

简单几步，钉钉机器人秒变通义千问对话机器人

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

Flink+Paimon+Hologres 构建实时湖仓数据分析

架构师的真内核