骆天

2024-05-15

高并发架构设计三大利器：缓存、限流和降级

软件系统有三个追求：高性能、高并发、高可用，俗称三高。本篇讨论高并发，从高并发是什么到高并发应对的策略、缓存、限流、降级等。

骆天

793

探索云世界

2024-05-15

38038

不需要懂技术，3分钟幻兽帕鲁服务器搭建教程

幻兽帕鲁最近非常火。有些小伙伴可能不喜欢跟陌生人一起玩，那么你可以搭建一个专有服务器和朋友一起联机游戏。自己搭建服务器不仅更私密，还能自定义游戏里的一些选项，比如调整工作速度倍率、经验获取倍率等。这篇教程将引导你在几分钟内快速完成幻兽帕鲁服务器的搭建。

探索云世界

38,038

德灵

2024-05-15

114713

阿里云PAI大模型RAG对话系统最佳实践

本文为大模型RAG对话系统最佳实践，旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术，从而显著提升对话系统的性能，使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践，您可以掌握构建一个大模型RAG对话系统的完整开发链路。

德灵

114,713

阿里云存储

2024-05-15

138304

用软硬协同设计下的飞天盘古降低存储系统开销

历经 15 载，如今的飞天盘古系统已迭代至第三代，数千万行代码和 1,000 余项专利，从大规模、到高性能、到高效能的分布式存储系统的演进，更高效地让数据中心成为一台计算机。

阿里云存储

138,304

吴昆

2024-05-15

145356

弹性调度助力企业灵活应对业务变化，高效管理云上资源

本文主要介绍了弹性调企业灵活应对企业业务变化，并高效管理云上资源。

吴昆

145,356

赫曦

2024-05-15

92573

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

本文主要介绍了通过弹性，实现成本优化，解决集群资源利用率难题。

赫曦

92,573

橙鲤

2024-05-15

154

如何在数字世界复刻一个高还原、高拟真的“你”

通过阿里云智能媒体服务IMS完成数字人形象训练、人声克隆定制，并使用Timeline实现视频合成及创作，打造一个“声形俱佳”的数字分身。

橙鲤

154

子白

2024-05-15

100748

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

100,748

孟威

2024-05-15

104068

SLS 大模型可观测&安全推理审计标准解决方案

本文介绍大模型可观测&安全推理审计解决方案和Demo演示，SLS 提供全面的 LLM 监控和日志记录功能。监控大模型使用情况和性能，自定义仪表盘；SLS 汇总 Actiontrail 事件、云产品可观测日志、LLM 网关明细日志、详细对话明细日志、Prompt Trace 和推理实时调用明细等数据，建设完整统一的大模型可观测方案，为用户的大模型安全推理审计提供全面合规支持。

孟威

104,068

类目筛选

内容类型

高并发架构设计三大利器：缓存、限流和降级

不需要懂技术，3分钟幻兽帕鲁服务器搭建教程

阿里云PAI大模型RAG对话系统最佳实践

用软硬协同设计下的飞天盘古降低存储系统开销

弹性调度助力企业灵活应对业务变化，高效管理云上资源

阿里云云原生弹性方案，用弹性解决集群资源利用率难题

如何在数字世界复刻一个高还原、高拟真的“你”

大语言模型推理提速，TensorRT-LLM 高性能推理实践

SLS 大模型可观测&安全推理审计标准解决方案