官方博客-第26页-阿里云开发者社区

寻剑

2024-09-11

352

表格存储低成本向量检索服务助力 AI 检索

本文阐述了阿里云表格存储（Tablestore）如何通过其向量检索服务应对大规模数据检索的需求，尤其是在成本、规模和召回率这三个关键挑战方面。

寻剑

352

付宇轩

2024-09-14

764

阿里云函数计算 x NVIDIA 加速企业 AI 应用落地

阿里云函数计算与 NVIDIA TensorRT/TensorRT-LLM 展开合作，通过结合阿里云的无缝计算体验和 NVIDIA 的高性能推理库，开发者能够以更低的成本、更高的效率完成复杂的 AI 任务，加速技术落地和应用创新。

付宇轩

764

重彦

2024-09-25

711

深入探索 RUM 与全链路追踪：优化数字体验的利器

本文主要介绍了基于 OpenTeletemetry 与 W3C 协议构建端到端全链路的解决方案，同时探讨了 RUM 与端到端链路集成的最佳实践，希望可以为大家在生产环境落地应用提供一些参考。

重彦

711

垚佳汐遥

2024-10-23

1046

通义灵码知识库问答增强：知识库构建与管理指南

通义灵码能够结合企业知识库的私域数据，生成贴合企业特点的回答。充分发挥检索增强技术的优势，构建高质量的企业知识数据以及合理的知识库权限管理是必不可少的。本文将为您详细介绍如何构造与管理一个高质量的企业知识库。

垚佳汐遥

1,046

阿里云云原生

2024-11-01

997

Serverless GPU：助力 AI 推理加速

近年来，AI 技术发展迅猛，企业纷纷寻求将 AI 能力转化为商业价值，然而，在部署 AI 模型推理服务时，却遭遇成本高昂、弹性不足及运维复杂等挑战。本文将探讨云原生 Serverless GPU 如何从根本上解决这些问题，以实现 AI 技术的高效落地。

阿里云云原生

997

泉思

2024-11-19

423

浏览器拨测：将网站护航的阵地再前推一米

近年来，针对网站的攻击形式愈发多样，手段也变得更加隐蔽，使用浏览器拨测来监控服务的整个生命周期有助于及时发现攻击，保护核心业务链路不受损。阿里云监控浏览器拨测使用真实的浏览器进行拨测，通过提供丰富的断言能力和脚本录制能力护航服务的全生命周期和核心业务链路，助力开发者更好地监控服务的可用性，消除潜在风险。

泉思

423

右予故黎

2024-11-21

999

“无”中生有：基于知识增强的RAG优化实践

本文作者基于自身在RAG技术领域长达半年的实践经验，分享了从初识RAG的潜力到面对实际应用挑战的心路历程，以及如何通过一系列优化措施逐步解决这些挑战的过程。

右予故黎

999

星莲

2024-11-21

1433

剖析大模型连“Strawberry”的“r”都数不对的原因

本文将从两个常见的大模型翻车问题入手解析这些问题背后体现的大模型技术原理，并解释了为什么会导致这些问题，接着我们利用CoT（思维链）方法解决这些问题并基于上述原理试图剖析CoT方法起作用的可能原因，最后提出【理由先行】风格这一简单有效的Prompt Trick。

星莲

1,433

阿里云云原生

2025-01-07

292

Envoy 开启 HTTP2 后偶现 404 解决方法

在大部分基于 Envoy 实现的网关里，都存在这样一个问题，当开启 http2 时，客户端访问会出现偶发的 404，并且可以从日志注意到这些 404 的请求，:authority 头里的域名和 SNI 里的域名不一致。且在使用泛域名证书，且配置了多个域名的路由的情况下，这个问题特别容易出现。

阿里云云原生

292

官方博客-第26页-阿里云开发者社区

类目筛选

内容类型

表格存储低成本向量检索服务助力 AI 检索

阿里云函数计算 x NVIDIA 加速企业 AI 应用落地

深入探索 RUM 与全链路追踪：优化数字体验的利器

通义灵码知识库问答增强：知识库构建与管理指南

Serverless GPU：助力 AI 推理加速

浏览器拨测：将网站护航的阵地再前推一米

“无”中生有：基于知识增强的RAG优化实践

剖析大模型连“Strawberry”的“r”都数不对的原因

Envoy 开启 HTTP2 后偶现 404 解决方法

官方博客-第26页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

表格存储低成本向量检索服务助力 AI 检索

阿里云函数计算 x NVIDIA 加速企业 AI 应用落地

深入探索 RUM 与全链路追踪：优化数字体验的利器

通义灵码知识库问答增强：知识库构建与管理指南

Serverless GPU：助力 AI 推理加速

浏览器拨测：将网站护航的阵地再前推一米

“无”中生有：基于知识增强的RAG优化实践

剖析大模型连“Strawberry”的“r”都数不对的原因

Envoy 开启 HTTP2 后偶现 404 解决方法