官方博客-第7页-阿里云开发者社区

子白

2024-05-15

102421

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,421

阿里云瑶池数据库

2024-05-15

1958

众安保险 CDP 平台：借助阿里云数据库 SelectDB 版内核 Apache Doris 打破数据孤岛，人群圈选提速4倍

随着业务在金融、保险和商城领域的不断扩展，众安保险建设 CDP 平台以提供自动化营销数据支持。早期 CDP 平台依赖于 Spark + Impala + Hbase + Nebula 复杂的技术组合，这不仅导致数据分析形成数据孤岛，还带来高昂的管理及维护成本。为解决该问题，众安保险引入 Apache Doris，替换了早期复杂的技术组合，不仅降低了系统的复杂性，打破了数据孤岛，更提升了数据处理的效率。

阿里云瑶池数据库

1,958

智予

2024-05-15

1087

云数据库专属集群MyBase在金融云的物理围笼实践

本文档详细介绍基于云数据库专属集群MyBase在金融公共云部署物理围笼实践的方案。

智予

1,087

阿里云瑶池数据库

2024-06-25

24749

内附原文｜详解SIGMOD’24最佳论文：PolarDB破解多主架构经典难题

在今年的SIGMOD会议上，阿里云瑶池数据库团队的论文《PolarDB-MP: A Multi-Primary Cloud-Native Database via Disaggregated Shared Memory》获得了Industry Track Best Paper Award，这是中国企业独立完成的成果首次摘得SIGMOD最高奖。PolarDB-MP是基于分布式共享内存的多主云原生数据库，本文将介绍这篇论文的具体细节。

阿里云瑶池数据库

24,749

陈浩章颖强

2024-08-23

277

ICDE’24 | 中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

数据库领域顶会 ICDE 2024于5月13-17日在荷兰乌特勒支（Utrecht, Netherlands）举办。ICDE (The International Conference on Data Engineering) 与VLDB、SIGMOD被公认为是国际数据管理领域三大顶级学术会议，此次在荷兰召开的ICDE 2024大会，共吸引北京大学、清华大学、浙江大学、MIT、斯坦福等机构，以及谷歌、微软、阿里云、华为、字节等公司的近1000名人员参会，共同探讨AI、数据库、数据处理领域的前沿技术问题。

陈浩章颖强

277

探索云世界

2024-12-20

481

RDS通用云盘核心能力

本次实验主要体验RDS通用云盘的三项核心能力：IO加速、IO突发和数据归档。首先创建实验资源，包括RDS MySQL实例和ECS实例，耗时约5分钟。接着通过sysbench导入数据并配置安全设置。在体验阶段，我们对比了开启和关闭IO加速及IO突发功能对RDS性能的影响，观察到QPS有显著差异。最后，通过将数据从云盘迁移到OSS中，展示了冷存层的数据归档功能，并进行RDS硬盘缩容，验证了其成本优势。整个实验过程详细记录了每一步操作，确保用户能直观感受到RDS通用云盘带来的性能提升和成本优化。

探索云世界

481

阿里云云原生

2025-04-07

657

极氪汽车云原生架构落地实践

随着极氪数字业务的飞速发展，背后的 IT 技术也在不断更新迭代。极氪极为重视客户对服务的体验，并将系统稳定性、业务功能的迭代效率、问题的快速定位和解决视为构建核心竞争力的基石。

阿里云云原生

657

阿里云云原生

2025-04-25

658

理工科 MCP Server 神器，补足人工智能幻觉短板

本文介绍了为何需要WolframAlpha及其在解决大语言模型“幻觉”问题上的优势。大型语言模型如GPT-4虽在自然语言处理方面表现出色，但在科学与数学问题上常出错。WolframAlpha凭借其强大的计算能力和广泛的知识库，能准确处理复杂问题。Higress MCP市场已上线WolframAlpha LLM API，支持多种调用方式，并提供每月10次免费试用。配置流程包括获取API工具、安装Lobechat及配置Higress MCP插件。测试案例显示，WolframAlpha在数学推理、日常计算和图像绘制等方面表现优异，未来结合更多服务将推动AI技术发展。

阿里云云原生

658

阿里云云原生

2025-04-28

699

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

本文介绍了阿里云容器服务（ACK）支持的StrmVol存储卷方案，旨在解决Kubernetes环境中海量小文件访问性能瓶颈问题。通过虚拟块设备与内核态文件系统（如EROFS）结合，StrmVol显著降低了小文件访问延迟，适用于AI训练集加载、时序日志分析等场景。其核心优化包括内存预取加速、减少I/O等待、内核态直接读取避免用户态切换开销，以及轻量索引快速初始化。示例中展示了基于Argo Workflows的工作流任务，模拟分布式图像数据集加载，测试结果显示平均处理时间为21秒。StrmVol适合只读场景且OSS端数据无需频繁更新的情况，详细使用方法可参考官方文档。

阿里云云原生

699

官方博客-第7页-阿里云开发者社区

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

众安保险 CDP 平台：借助阿里云数据库 SelectDB 版内核 Apache Doris 打破数据孤岛，人群圈选提速4倍

云数据库专属集群MyBase在金融云的物理围笼实践

内附原文｜详解SIGMOD’24最佳论文：PolarDB破解多主架构经典难题

ICDE’24 | 中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

RDS通用云盘核心能力

极氪汽车云原生架构落地实践

理工科 MCP Server 神器，补足人工智能幻觉短板

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

官方博客-第7页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

众安保险 CDP 平台：借助阿里云数据库 SelectDB 版内核 Apache Doris 打破数据孤岛，人群圈选提速4倍

云数据库专属集群MyBase在金融云的物理围笼实践

内附原文｜详解SIGMOD’24最佳论文：PolarDB破解多主架构经典难题

ICDE’24 | 中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

RDS通用云盘核心能力

极氪汽车云原生架构落地实践

理工科 MCP Server 神器，补足人工智能幻觉短板

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度