阿里云百炼

2024-07-09

阿里云百炼应用实践系列-基于LlamaIndex的文档问答助手

本文以百炼官方文档问答助手为例，介绍如何基于百炼平台打造基于LlamaIndex的RAG文档问答产品。我们基于百炼平台的底座能力，以官方帮助文档为指定知识库，搭建了问答服务，支持钉钉、Web访问。介绍了相关技术方案和主要代码，供开发者参考。

阿里云百炼

556

休祯

2024-07-18

7583

流量回放新形态：基于网关 Access Log 发起

流量回放技术在性能测试和故障排除中至关重要。传统工具如 GoReplay、Tcpreplay 等存在高权限、配置复杂、登录态失效等痛点。PTS 推出基于 Access Log 的流量回放功能，自动生成压测场景，解决传统工具痛点，操作简单，一起来了解下吧~

休祯

7,583

张佐玮

2023-12-01

927

Koordinator 助力云原生应用性能提升，小红书混部技术实践

本文基于 2023 云栖大会上关于 Koordinator 分享的实录，介绍小红书通过规模化落地混部技术来大幅提升集群资源效能，降低业务资源成本。

张佐玮

927

骄龙孤弋

2024-05-15

766

浅析JAVA日志中的几则性能实践与原理解释

本篇文章通过几个技术点说明日志记录过程中的性能实践，计算机领域的性能往往都遵循着冰山法则，即你能看得见的、程序员能感知的只是其中的一小部分，还有大量的细节隐藏在冰山之下。

骄龙孤弋

766

阿里云实时数仓Hologres

2024-05-15

706

Flink+Paimon+Hologres 构建实时湖仓数据分析

本文整理自阿里云高级专家喻良，在 Flink Forward Asia 2023 主会场的分享。

阿里云实时数仓Hologres

706

ModelScope

2024-05-15

411

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

411

龙蜥社区OpenAnolis

2024-05-15

114

从故障演练到运维工具产品力评测的探索 | 龙蜥技术

随着AI和云原生技术的发展，业界运维工具百花齐放，该如何让优秀的工具脱颖而出？

龙蜥社区OpenAnolis

114

阿里云大数据Al技术

2024-07-31

7057

OSS数据源一站式RAG最佳实践

本文介绍了如何使用OpenSearch LLM智能问答版通过OSS数据源一站式构建RAG系统。

阿里云大数据Al技术

7,057

资源编排ROS

2019-12-24

1904

资源编排ROS之自定制资源（基础篇）

本文介绍资源编排ROS的基础知识配置。

资源编排ROS

1,904

类目筛选

内容类型

阿里云百炼应用实践系列-基于LlamaIndex的文档问答助手

流量回放新形态：基于网关 Access Log 发起

Koordinator 助力云原生应用性能提升，小红书混部技术实践

浅析JAVA日志中的几则性能实践与原理解释

Flink+Paimon+Hologres 构建实时湖仓数据分析

vLLM部署Yuan2.0：高吞吐、更便捷

从故障演练到运维工具产品力评测的探索 | 龙蜥技术

OSS数据源一站式RAG最佳实践

资源编排ROS之自定制资源（基础篇）