官方博客-第13页-阿里云开发者社区

子白

2024-05-15

102421

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,421

ModelScope

2024-05-15

1927

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

MiniCPM-V 2.0 不仅带来优秀端侧多模态通用能力，更带来惊艳的 OCR 表现。通过自研的高清图像解码技术，可以突破传统困境，让更为精准地识别充满纷繁细节的街景、长图在端侧成为可能。

ModelScope

1,927

赵世振

2024-08-22

1221

阿里云百炼应用实践系列-10分钟在企业微信中集成一个 AI 助手

在阿里云平台上，您只需十分钟，无需任何编码，即可在企业微信上为您的组织集成一个具备大模型能力的AI助手。此助手可24小时响应用户咨询，解答各类问题，尤其擅长处理私域问题，从而成为您企业的专属助手，有效提升用户体验及业务竞争力。

赵世振

1,221

右予故黎

2024-11-21

973

“无”中生有：基于知识增强的RAG优化实践

本文作者基于自身在RAG技术领域长达半年的实践经验，分享了从初识RAG的潜力到面对实际应用挑战的心路历程，以及如何通过一系列优化措施逐步解决这些挑战的过程。

右予故黎

973

舟谨

2024-12-13

449

如何提取手写票据信息

本文主要讲述在处理票据信息结构化提取任务时，如何结合OCR（光学字符识别）技术和多模态大模型Qwen-VL来提高票据信息提取的准确性和效率。

舟谨

449

阿里云云原生

2025-04-28

699

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

本文介绍了阿里云容器服务（ACK）支持的StrmVol存储卷方案，旨在解决Kubernetes环境中海量小文件访问性能瓶颈问题。通过虚拟块设备与内核态文件系统（如EROFS）结合，StrmVol显著降低了小文件访问延迟，适用于AI训练集加载、时序日志分析等场景。其核心优化包括内存预取加速、减少I/O等待、内核态直接读取避免用户态切换开销，以及轻量索引快速初始化。示例中展示了基于Argo Workflows的工作流任务，模拟分布式图像数据集加载，测试结果显示平均处理时间为21秒。StrmVol适合只读场景且OSS端数据无需频繁更新的情况，详细使用方法可参考官方文档。

阿里云云原生

699

致问

2023-09-15

120014

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

本文将会分享Hologres RoaringBitmap 方案在画像分析的应用实践，实现更快更准的画像分析。

致问

120,014

牛俊

2024-08-15

11738

动手实践：高效构建企业级AI搜索

本文介绍了基于阿里云 Elasticsearch的AI搜索产品能力、业务价值、场景应用，以及搭建演示等。

牛俊

11,738

阿里云云原生

2024-09-14

665

通义灵码获得国产 AI 编码工具最高成绩丨阿里云云原生 8 月产品月报

阿里云云原生 8 月产品月报。

阿里云云原生

665

官方博客-第13页-阿里云开发者社区

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

阿里云百炼应用实践系列-10分钟在企业微信中集成一个 AI 助手

“无”中生有：基于知识增强的RAG优化实践

如何提取手写票据信息

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

动手实践：高效构建企业级AI搜索

通义灵码获得国产 AI 编码工具最高成绩丨阿里云云原生 8 月产品月报

官方博客-第13页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

阿里云百炼应用实践系列-10分钟在企业微信中集成一个 AI 助手

“无”中生有：基于知识增强的RAG优化实践

如何提取手写票据信息

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

动手实践：高效构建企业级AI搜索

通义灵码获得国产 AI 编码工具最高成绩丨阿里云云原生 8 月产品月报