官方博客-第14页-阿里云开发者社区

子白

2024-05-15

102421

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,421

ModelScope

2024-05-15

1927

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

MiniCPM-V 2.0 不仅带来优秀端侧多模态通用能力，更带来惊艳的 OCR 表现。通过自研的高清图像解码技术，可以突破传统困境，让更为精准地识别充满纷繁细节的街景、长图在端侧成为可能。

ModelScope

1,927

赵世振

2024-08-22

1221

阿里云百炼应用实践系列-10分钟在企业微信中集成一个 AI 助手

在阿里云平台上，您只需十分钟，无需任何编码，即可在企业微信上为您的组织集成一个具备大模型能力的AI助手。此助手可24小时响应用户咨询，解答各类问题，尤其擅长处理私域问题，从而成为您企业的专属助手，有效提升用户体验及业务竞争力。

赵世振

1,221

右予故黎

2024-11-21

973

“无”中生有：基于知识增强的RAG优化实践

本文作者基于自身在RAG技术领域长达半年的实践经验，分享了从初识RAG的潜力到面对实际应用挑战的心路历程，以及如何通过一系列优化措施逐步解决这些挑战的过程。

右予故黎

973

舟谨

2024-12-13

449

如何提取手写票据信息

本文主要讲述在处理票据信息结构化提取任务时，如何结合OCR（光学字符识别）技术和多模态大模型Qwen-VL来提高票据信息提取的准确性和效率。

舟谨

449

阿里云云原生

2025-04-28

699

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

本文介绍了阿里云容器服务（ACK）支持的StrmVol存储卷方案，旨在解决Kubernetes环境中海量小文件访问性能瓶颈问题。通过虚拟块设备与内核态文件系统（如EROFS）结合，StrmVol显著降低了小文件访问延迟，适用于AI训练集加载、时序日志分析等场景。其核心优化包括内存预取加速、减少I/O等待、内核态直接读取避免用户态切换开销，以及轻量索引快速初始化。示例中展示了基于Argo Workflows的工作流任务，模拟分布式图像数据集加载，测试结果显示平均处理时间为21秒。StrmVol适合只读场景且OSS端数据无需频繁更新的情况，详细使用方法可参考官方文档。

阿里云云原生

699

阿里云实时计算Flink

2023-03-30

4963

Apache Paimon 在同程旅行的探索实践

本文主要介绍 Apache Paimon 在同程旅行的生产落地实践经验。

阿里云实时计算Flink

4,963

致问

2023-09-15

120014

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

本文将会分享Hologres RoaringBitmap 方案在画像分析的应用实践，实现更快更准的画像分析。

致问

120,014

瑞丹

2024-06-05

883

【企业实践】台州银行携手瓴羊Dataphin共建数据平台，打造小微金融治理新标杆

台州银行数据治理项目携手瓴羊Dataphin，荣获中国信息通信研究院评为“2023年铸基计划高质量数字化转型典型优秀案例”、数字化研究机构沙丘社区选为“2024中国数据资产管理最佳实践案例”双重认可。

瑞丹

883

官方博客-第14页-阿里云开发者社区

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

阿里云百炼应用实践系列-10分钟在企业微信中集成一个 AI 助手

“无”中生有：基于知识增强的RAG优化实践

如何提取手写票据信息

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

Apache Paimon 在同程旅行的探索实践

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

【企业实践】台州银行携手瓴羊Dataphin共建数据平台，打造小微金融治理新标杆

官方博客-第14页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

阿里云百炼应用实践系列-10分钟在企业微信中集成一个 AI 助手

“无”中生有：基于知识增强的RAG优化实践

如何提取手写票据信息

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

Apache Paimon 在同程旅行的探索实践

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

【企业实践】台州银行携手瓴羊Dataphin共建数据平台，打造小微金融治理新标杆