ModelScope

2024-05-15

用消费级显卡微调属于自己的Agent

本文为魔搭社区轻量级训练推理工具SWIFT微调实战教程系列

ModelScope

151

骆天

2024-05-15

793

高并发架构设计三大利器：缓存、限流和降级

软件系统有三个追求：高性能、高并发、高可用，俗称三高。本篇讨论高并发，从高并发是什么到高并发应对的策略、缓存、限流、降级等。

骆天

793

阿里云云原生

2024-05-15

113572

函数计算部署AI艺术字应用，生成新春文字头像

基于 Stable Diffusion Serverless API 解决方案搭建 AI 文字生成应用，支持并发出图。

阿里云云原生

113,572

刘宇

2024-05-15

112126

20行代码，Serverless架构下用Python轻松搞定图像分类和预测

本文将AI项目与Serverless架构进行结合，在Serverless架构下用20行Python代码搞定图像分类和预测。

刘宇

112,126

探索云世界

2024-05-15

38038

不需要懂技术，3分钟幻兽帕鲁服务器搭建教程

幻兽帕鲁最近非常火。有些小伙伴可能不喜欢跟陌生人一起玩，那么你可以搭建一个专有服务器和朋友一起联机游戏。自己搭建服务器不仅更私密，还能自定义游戏里的一些选项，比如调整工作速度倍率、经验获取倍率等。这篇教程将引导你在几分钟内快速完成幻兽帕鲁服务器的搭建。

探索云世界

38,038

德灵

2024-05-15

114713

阿里云PAI大模型RAG对话系统最佳实践

本文为大模型RAG对话系统最佳实践，旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术，从而显著提升对话系统的性能，使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践，您可以掌握构建一个大模型RAG对话系统的完整开发链路。

德灵

114,713

吴昆

2024-05-15

145356

弹性调度助力企业灵活应对业务变化，高效管理云上资源

本文主要介绍了弹性调企业灵活应对企业业务变化，并高效管理云上资源。

吴昆

145,356

赫曦

2024-05-15

92573

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

本文主要介绍了通过弹性，实现成本优化，解决集群资源利用率难题。

赫曦

92,573

子白

2024-05-15

100748

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

100,748

类目筛选

内容类型

用消费级显卡微调属于自己的Agent

高并发架构设计三大利器：缓存、限流和降级

函数计算部署AI艺术字应用，生成新春文字头像

20行代码，Serverless架构下用Python轻松搞定图像分类和预测

不需要懂技术，3分钟幻兽帕鲁服务器搭建教程

阿里云PAI大模型RAG对话系统最佳实践

弹性调度助力企业灵活应对业务变化，高效管理云上资源

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

大语言模型推理提速，TensorRT-LLM 高性能推理实践