官方博客-第37页-阿里云开发者社区

寻剑

2024-09-11

293

表格存储低成本向量检索服务助力 AI 检索

本文阐述了阿里云表格存储（Tablestore）如何通过其向量检索服务应对大规模数据检索的需求，尤其是在成本、规模和召回率这三个关键挑战方面。

寻剑

293

阿里云云原生

2024-09-14

721

Serverless 安全防护能力除了支持目前既定的等保合规（漏洞扫描、入侵检测、基线检测等）、安全隔离的能力外还支持 WAF 防火墙、支持通信加密、操作审计、权限管控等能力，也正是有了这些能力的加持，SAE 才能很好的服务了金融、政企、医疗等行业的客户；Serverless（SAE）未来还计划规划更多安全能力为企业保驾护航，包括：代码安全扫描、加密、堡垒机、最小权限、身份与访问管理、以及更多的攻击防护等能力的建设。

阿里云云原生

721

阿里云云原生

2024-11-01

915

Serverless GPU：助力 AI 推理加速

近年来，AI 技术发展迅猛，企业纷纷寻求将 AI 能力转化为商业价值，然而，在部署 AI 模型推理服务时，却遭遇成本高昂、弹性不足及运维复杂等挑战。本文将探讨云原生 Serverless GPU 如何从根本上解决这些问题，以实现 AI 技术的高效落地。

阿里云云原生

915

阿里云云原生

2025-01-06

279

函数计算助您 7 分钟极速部署开源对话大模型

本方案利用函数计算的无服务器架构，您可以在函数计算控制台选择魔搭（ModelScope）开源大模型应用模板；同时，我们将利用文件存储 NAS ，为应用服务所需的大模型和相关文件提供一个安全的存储环境；最终通过访问提供的域名进行模型的调用与验证。仅需三步，即可玩转目前热门 AI 大模型。

阿里云云原生

279

澄潭计缘望宸

2025-03-14

896

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

通义千问最新推出的QwQ-32B推理模型，拥有320亿参数，性能媲美DeepSeek-R1（6710亿参数）。QwQ-32B支持在小型移动设备上本地运行，并可将企业大模型API调用成本降低90%以上。本文介绍了如何通过Higress AI网关实现DeepSeek-R1与QwQ-32B之间的无缝切换，涵盖环境准备、模型接入配置及客户端调用示例等内容。此外，还详细探讨了Higress AI网关的多模型服务、消费者鉴权、模型自动切换等高级功能，帮助企业解决TPS与成本平衡、内容安全合规等问题，提升大模型应用的稳定性和效率。

澄潭计缘望宸等

896

夏振华许文豪

2025-04-18

485

AI 时代，为什么编程能力≠ 开发门槛

在 2.0 阶段，我们目标是实现面向任务的协同编码模式，人的主要职责转变为任务的下发、干预以及最后结果的审查。在这个过程中，人的实际工作量开始减轻，AI 工作的占比显著提升。目前的 2.0 版本是我们最近上线的。

夏振华许文豪

485

寒斜

2022-10-14

515

人人都是Serverless架构师之传统内容管理系统改造实战三[性能优化]

内容管理系统是很常见的一种web应用场景，可以用到个人独立站，企业官网展示等场景，具有很高的实用价值，一个标准的内容管理系统主要由三个部分组成主站展示部分、后台管理系统、API接口服务，本系列文章会以一个已有内容管理系统的Serverless架构重构展开，介绍改造的基本思路，改造细节，以及性能优化业务可观测设计等。涉及大家关心的Serverless生产遇到的一些问题，比如数据库、日志、动静态分离、调试、维护、灰度方案等。最真实的展现Serverless架构的实施落地细节。

寒斜

515

王夕宁

2023-02-28

16883

应用场景系列之（1）,流量管理下的熔断场景

本文主要介绍深入理解熔断器在不同场景下的行为。

王夕宁

16,883

龙蜥社区OpenAnolis

2023-03-01

643

如何有效降低产品级内存数据库快照尾延迟

本文讲解内存键值对数据库在使用 fork 拍摄快照时引起的请求尾延迟激增问题如何解决的实践方案。

龙蜥社区OpenAnolis

643

官方博客-第37页-阿里云开发者社区

类目筛选

内容类型

表格存储低成本向量检索服务助力 AI 检索

Serverless 安全新杀器：云安全中心护航容器安全

Serverless GPU：助力 AI 推理加速

函数计算助您 7 分钟极速部署开源对话大模型

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

AI 时代，为什么编程能力≠ 开发门槛

人人都是Serverless架构师之传统内容管理系统改造实战三[性能优化]

应用场景系列之（1）,流量管理下的熔断场景

如何有效降低产品级内存数据库快照尾延迟

官方博客-第37页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

表格存储低成本向量检索服务助力 AI 检索

Serverless 安全新杀器：云安全中心护航容器安全

Serverless GPU：助力 AI 推理加速

函数计算助您 7 分钟极速部署开源对话大模型

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

AI 时代，为什么编程能力≠ 开发门槛

人人都是Serverless架构师之传统内容管理系统改造实战三[性能优化]

应用场景系列之（1）,流量管理下的熔断场景

如何有效降低产品级内存数据库快照尾延迟