官方博客-第29页-阿里云开发者社区

ModelScope

2024-05-15

1139

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,139

澄潭董艺荃

2024-05-16

88536

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

这篇文章介绍了使用开源工具NextChat和Higress搭建的一个模拟ChatGPT和通义千问对话PK的测试场景。

澄潭董艺荃

88,536

阿里云实时数仓Hologres

2024-07-23

25222

分析性能提升40%，阿里云Hologres流量场景最佳实践

阿里云实时数仓Hologres

25,222

牛俊

2024-08-15

11749

动手实践：高效构建企业级AI搜索

本文介绍了基于阿里云 Elasticsearch的AI搜索产品能力、业务价值、场景应用，以及搭建演示等。

牛俊

11,749

赵世振

2024-08-22

1231

阿里云百炼应用实践系列-10分钟在企业微信中集成一个 AI 助手

在阿里云平台上，您只需十分钟，无需任何编码，即可在企业微信上为您的组织集成一个具备大模型能力的AI助手。此助手可24小时响应用户咨询，解答各类问题，尤其擅长处理私域问题，从而成为您企业的专属助手，有效提升用户体验及业务竞争力。

赵世振

1,231

剑洁雲尧

2024-09-04

617

浅谈Elasticsearch的入门与实践

本文主要围绕ES核心特性：分布式存储特性和分析检索能力，介绍了概念、原理与实践案例，希望让读者快速理解ES的核心特性与应用场景。

剑洁雲尧

617

贾缃

2024-09-04

481

WASM性能分析-插桩方案

本文结合了代码插桩和性能火焰图的技术，以 WebAssembly 为例介绍了性能分析的方法和相关实现。

贾缃

481

付宇轩

2024-09-14

746

阿里云函数计算 x NVIDIA 加速企业 AI 应用落地

阿里云函数计算与 NVIDIA TensorRT/TensorRT-LLM 展开合作，通过结合阿里云的无缝计算体验和 NVIDIA 的高性能推理库，开发者能够以更低的成本、更高的效率完成复杂的 AI 任务，加速技术落地和应用创新。

付宇轩

746

唐三

2024-10-18

801

从云原生到 AI 原生，网关的发展趋势和最佳实践

本文整理自阿里云智能集团资深技术专家，云原生产品线中间件负责人谢吉宝（唐三）在云栖大会的精彩分享。讲师深入浅出的分享了软件架构演进过程中，网关所扮演的各类角色，AI 应用的流量新特征对软件架构和网关所提出的新诉求，以及基于阿里自身实践所带来的开源贡献和商业能力。

唐三

801

官方博客-第29页-阿里云开发者社区

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

分析性能提升40%，阿里云Hologres流量场景最佳实践

动手实践：高效构建企业级AI搜索

阿里云百炼应用实践系列-10分钟在企业微信中集成一个 AI 助手

浅谈Elasticsearch的入门与实践

WASM性能分析-插桩方案

阿里云函数计算 x NVIDIA 加速企业 AI 应用落地

从云原生到 AI 原生，网关的发展趋势和最佳实践

官方博客-第29页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

分析性能提升40%，阿里云Hologres流量场景最佳实践

动手实践：高效构建企业级AI搜索

阿里云百炼应用实践系列-10分钟在企业微信中集成一个 AI 助手

浅谈Elasticsearch的入门与实践

WASM性能分析-插桩方案

阿里云函数计算 x NVIDIA 加速企业 AI 应用落地

从云原生到 AI 原生，网关的发展趋势和最佳实践