缓存的搜索结果-阿里云开发者社区

晚安code

|

2小时前

|

博文

RocketMQ 延迟消息实战：延迟双删策略解决 Redis 缓存一致性

RocketMQ 延迟消息怎么用？本文从本地搭建开始，用订单超时案例讲透延迟消息与延迟双删，解决 Redis 缓存一致性难题。

# 消息中间件 # 缓存 # NoSQL # Redis # RocketMQ

程序员在线

|

5小时前

|

博文

阿里云百炼Token Plan按Credits计费是如何计算的？1个Credits相当于多少Token？

阿里云百炼Token Plan团队版是面向企业用户的AI订阅服务，以Credits统一计费，支持文本/图像多模型及主流编程与Agent工具。含标准（198元/月）、高级（698元）、尊享（1398元）三档坐席，单价低至0.005592元/Credit，较按量计费最高省44%。阿里云百炼Token Plan官网：https://t.aliyun.com/U/EsRjVx

# 人工智能 # 缓存 # 自然语言处理 # API # 开发者

云百科

|

6小时前

|

博文

阿里云百炼 Token Plan 订阅制升级：个人版上线、团队版降价，一把 API Key 跑通 Qwen3.8-Max-Preview 与 HappyHorse 1.1

阿里云百炼Token Plan全新升级：个人版39元起/月，团队版低至150元/席位/月；统一Credits抵扣，支持Qwen3.8-Max-Preview（2.4T）、HappyHorse视频等150+全模态模型；夜间调用低至0.2折，单Token成本锐减98%。阿里云百炼Token Plan官网：https://t.aliyun.com/U/EsRjVx

# 缓存 # 人工智能 # 自然语言处理 # API # 开发者

万岳科技程序员小赵

|

9小时前

|

博文

搭建同城外卖系统：商家端商品管理、多规格SKU与库存同步解决方案

同城外卖系统中，商家端商品管理是运营效率核心。需科学设计商品模型与SKU体系，实现规格灵活配置、库存原子扣减（Redis+队列）、多门店差异化经营及状态实时同步，支撑高并发与稳定扩展。

# 消息中间件 # 存储 # 缓存 # 小程序 # 数据库

1575030468644753

|

9小时前

|

博文

|

来自：阿里云百炼

【剪映小助手】搜索贴纸接口（Search Sticker）

搜索贴纸接口用于草稿自动化中的贴纸检索，依赖FastAPI、Pydantic等模块，支持关键词搜索。含配置加载、JSON解析、缓存与分页优化，提供完整日志、测试及故障排查指南。（239字）

# JSON # 缓存 # 运维 # 数据格式 # 索引

晚安code

|

12小时前

|

博文

DeepSeek V4 Flash 对标 Gemini 3.6，AI 大跑毒时代

DeepSeek V4 Flash 0731 上线公测，智能指数追平 Gemini 3.6 Flash，价格仅其零头，拆解「大跑毒时代」谁先出局。

# 机器学习/深度学习 # 人工智能 # 缓存 # API # 内存技术

zsv5cklftqhb6

|

13小时前

|

博文

AI Agent 从跑通到可用：五个必须解决的生产问题

本文聚焦AI Agent工程化落地难题，提出可直接实践的系统化分析框架：强调将模型路由、上下文管理、工具调用、失败降级与可观测性解耦为独立模块，通过统一API入口实现调用治理，确保系统长期稳定、安全可控、成本透明。

# 人工智能 # 缓存 # 安全 # 前端开发 # 开发工具

zsv5cklftqhb6

|

13小时前

|

博文

大模型应用成本为什么容易失控：一套可落地的工程治理方法

本文系统阐述大模型成本治理的工程化方法：聚焦重复调用、无效上下文、错误重试与缺细分账四大隐性成本源；主张“先分类、再推理”，按任务价值匹配模型与上下文；强调细粒度日志（模型/Token/缓存/重试/场景）与结构化成本追踪，并给出缓存策略与落地实施顺序，助力降本增效。

# 缓存 # 人工智能 # 安全 # 测试技术 # UED

杨运交

|

15小时前

|

博文

[034][公共模块]基于SpEL的方法参数表达式求值器设计与实现

本文设计并实现了基于Spring SpEL的`MethodBasedExpressionEvaluator`，支持方法参数自动映射、占位符解析、Bean引用、自定义变量注入及表达式缓存，具备类型安全、线程安全与高扩展性，适用于权限控制、日志模板、缓存Key生成等场景。（239字）

# 缓存 # 安全 # Java # 数据安全/隐私保护 # Spring

AI未闻花名

|

16小时前

|

博文

|

来自：千问大模型

FlashAttention、PagedAttention两代注意力算法，改写大模型推理生态详解.186

本文深入剖析大模型推理中自注意力机制的性能瓶颈及两大革命性优化：FlashAttention通过SRAM分片计算，将O(n²)显存/算力开销降至O(n)，显著提升长文本处理效率；PagedAttention借鉴操作系统分页思想，实现KV缓存的离散化、复用化管理，彻底解决高并发下的显存碎片与卡顿问题。二者协同构成当前大模型高效推理基石。

# 机器学习/深度学习 # 缓存 # 算法 # 异构计算 # 内存技术

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

缓存