官方博客-第28页-阿里云开发者社区

ModelScope

2024-05-15

1139

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,139

澄潭董艺荃

2024-05-16

88536

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

这篇文章介绍了使用开源工具NextChat和Higress搭建的一个模拟ChatGPT和通义千问对话PK的测试场景。

澄潭董艺荃

88,536

牛俊

2024-08-15

11749

动手实践：高效构建企业级AI搜索

本文介绍了基于阿里云 Elasticsearch的AI搜索产品能力、业务价值、场景应用，以及搭建演示等。

牛俊

11,749

阿里云云原生

2024-08-21

1038

用好通义灵码，让这款 AI 编码助手帮你做更多工作

通义灵码提供了一系列快捷键和配置选项以增强开发体验。

阿里云云原生

1,038

赵世振

2024-08-21

1459

阿里云百炼应用实践系列-10分钟构建能主动提问的智能导购

通过使用阿里云百炼平台，您可以快速构建一个多代理（Multi-Agent）架构的智能导购助手。该助手能够通过多轮互动了解顾客的具体需求，收集详细信息后，利用阿里云百炼的知识检索增强功能或已有的商品数据库进行商品搜索，为顾客推荐最合适的产品。

赵世振

1,459

赵世振

2024-08-22

1231

阿里云百炼应用实践系列-10分钟在企业微信中集成一个 AI 助手

在阿里云平台上，您只需十分钟，无需任何编码，即可在企业微信上为您的组织集成一个具备大模型能力的AI助手。此助手可24小时响应用户咨询，解答各类问题，尤其擅长处理私域问题，从而成为您企业的专属助手，有效提升用户体验及业务竞争力。

赵世振

1,231

贾缃

2024-09-04

481

WASM性能分析-插桩方案

本文结合了代码插桩和性能火焰图的技术，以 WebAssembly 为例介绍了性能分析的方法和相关实现。

贾缃

481

唐三

2024-10-18

801

从云原生到 AI 原生，网关的发展趋势和最佳实践

本文整理自阿里云智能集团资深技术专家，云原生产品线中间件负责人谢吉宝（唐三）在云栖大会的精彩分享。讲师深入浅出的分享了软件架构演进过程中，网关所扮演的各类角色，AI 应用的流量新特征对软件架构和网关所提出的新诉求，以及基于阿里自身实践所带来的开源贡献和商业能力。

唐三

801

勉成

2024-12-12

574

如何找出Java进程占用CPU高的元凶

本文记录了一次Java进程CPU占用率过高的问题和排查思路。

勉成

574

官方博客-第28页-阿里云开发者社区

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

动手实践：高效构建企业级AI搜索

用好通义灵码，让这款 AI 编码助手帮你做更多工作

阿里云百炼应用实践系列-10分钟构建能主动提问的智能导购

阿里云百炼应用实践系列-10分钟在企业微信中集成一个 AI 助手

WASM性能分析-插桩方案

从云原生到 AI 原生，网关的发展趋势和最佳实践

如何找出Java进程占用CPU高的元凶

官方博客-第28页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

动手实践：高效构建企业级AI搜索

用好通义灵码，让这款 AI 编码助手帮你做更多工作

阿里云百炼应用实践系列-10分钟构建能主动提问的智能导购

阿里云百炼应用实践系列-10分钟在企业微信中集成一个 AI 助手

WASM性能分析-插桩方案

从云原生到 AI 原生，网关的发展趋势和最佳实践

如何找出Java进程占用CPU高的元凶