ModelScope

2024-05-15

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

421

ModelScope

2024-05-15

103567

手把手教你捏一个自己的Agent

Modelscope AgentFabric是一个基于ModelScope-Agent的交互式智能体应用，用于方便地创建针对各种现实应用量身定制智能体，目前已经在生产级别落地。

ModelScope

103,567

阿里云云原生

2024-05-15

43405

得物 ZooKeeper SLA 也可以 99.99%丨最佳实践

在本文中，作者探讨了ZooKeeper（ZK）的一个内存占用问题，特别是当有大量的Watcher和ZNode时，导致的内存消耗。

阿里云云原生

43,405

阿里云云原生

2024-05-22

60146

基于 Prometheus 的超算弹性计算场景下主机监控最佳实践

超算快速弹性伸缩场景下，如何构建一套准确、快速、可靠的监控体系成为关键点。阿里云在超算场景的主机监控落地实践，解决超算场景面临的挑战，交付一套可靠和全面的主机监控体系。

阿里云云原生

60,146

涯海

2024-06-03

61094

一站式链路追踪：阿里云的端到端解决方案

端到端链路追踪是覆盖全部关联 IT 系统，能够完整记录用户行为在系统间调用路径与状态的最佳实践方案。而真正实现端到端链路追踪，需要解决三个难题：链路插桩、链路采集与加工、链路上下文透传。阿里云 ARMS 目前已支持全链路端到端追踪，快来查看转发吧~

涯海

61,094

阿里云云原生

2024-08-26

372

AI 网关基于 IP 地理位置，增强 Prompt 修饰能力

本⽂对 Prompt 的使用方式进行了简单介绍，让大家了解到 Prompt 对于 LLM 的重要性。并尝试在 Prompt 中结合用户 Geo IP 信息，实现 LLM 的个性化回复，提升问答的准确度。

阿里云云原生

372

阿里云云原生

2024-09-06

42

MacTalk 测评通义灵码，实现“微信表情”小功能

墨问西东创始人池建强分享了团队使用通义灵码的经验。

阿里云云原生

42

秦涛

2023-07-28

812

MaxCompute ODPS重装上阵， IF ELSE分支语句

MaxCompute通过脚本模式支持IF ELSE分支语句，让程序根据条件自动选择执行逻辑，支持更好的处理因数据不同而需要采用不同策略的业务场景产生的复杂SQL，提高开发者编程的灵活性！

秦涛

812

偏左

2023-08-28

20816

探索AI时代的应用工程化架构演进，一人公司时代还有多远？

当代AI来势汹汹，本文从AI的特点、对研发的挑战、AI的应用工程和场景分化等剖析了AI时代的应用工程化架构演进之路。

偏左

20,816

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

手把手教你捏一个自己的Agent

得物 ZooKeeper SLA 也可以 99.99%丨最佳实践

基于 Prometheus 的超算弹性计算场景下主机监控最佳实践

一站式链路追踪：阿里云的端到端解决方案

AI 网关基于 IP 地理位置，增强 Prompt 修饰能力

MacTalk 测评通义灵码，实现“微信表情”小功能

MaxCompute ODPS重装上阵， IF ELSE分支语句

探索AI时代的应用工程化架构演进，一人公司时代还有多远？