官方博客-第22页-阿里云开发者社区

非有

2024-05-15

1501

一文详解 Java 限流接口实现

本文介绍的实现方式属于应用级限制，应用级限流方式只是单应用内的请求限流，不能进行全局限流。要保证系统的抗压能力，限流是一个必不可少的环节，虽然可能会造成某些用户的请求被丢弃，但相比于突发流量造成的系统宕机来说，这些损失一般都在可以接受的范围之内。

非有

1,501

孟威

2024-05-15

105547

SLS 大模型可观测&安全推理审计标准解决方案

本文介绍大模型可观测&安全推理审计解决方案和Demo演示，SLS 提供全面的 LLM 监控和日志记录功能。监控大模型使用情况和性能，自定义仪表盘；SLS 汇总 Actiontrail 事件、云产品可观测日志、LLM 网关明细日志、详细对话明细日志、Prompt Trace 和推理实时调用明细等数据，建设完整统一的大模型可观测方案，为用户的大模型安全推理审计提供全面合规支持。

孟威

105,547

ModelScope

2024-05-15

1959

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

MiniCPM-V 2.0 不仅带来优秀端侧多模态通用能力，更带来惊艳的 OCR 表现。通过自研的高清图像解码技术，可以突破传统困境，让更为精准地识别充满纷繁细节的街景、长图在端侧成为可能。

ModelScope

1,959

阿里云实时数仓Hologres

2024-05-15

75072

大数据分析平台之 OLAP 架构的最佳实践

本文将分享聚水潭云原生 OLAP 架构的最佳实践。

阿里云实时数仓Hologres

75,072

信徒

2024-12-05

841

我的程序突然罢工了｜深入探究HSF调用异常，从死锁到活锁的全面分析与解决

本文详细记录了作者在处理HSF调用异常问题的过程中，从初步怀疑死锁到最终发现并解决活锁问题的全过程。

信徒

841

阿里云云原生

2025-01-22

530

两步构建 AI 总结助手，实现智能文档摘要

本方案将运用函数计算 FC，构建一套高可用性的 Web 服务，以满足用户多样化的需求。当用户发起请求时，系统内部会自动将包含文本和提示词的信息传递给百炼模型服务，百炼平台将根据后台配置调用相应的大模型服务，对文本数据进行智能识别与解析，最终将总结结果返回给用户。

阿里云云原生

530

望宸

2025-02-20

669

大模型推理服务全景图

推理性能的提升涉及底层硬件、模型层，以及其他各个软件中间件层的相互协同，因此了解大模型技术架构的全局视角，有助于我们对推理性能的优化方案进行评估和选型。

望宸

669

柯灵

2025-03-11

1588

QwQ-32B一键部署，真正的0代码，0脚本，0门槛

阿里云发布的QwQ-32B模型通过强化学习显著提升了推理能力，核心指标达到DeepSeek-R1满血版水平。用户可通过阿里云系统运维管理（OOS）一键部署OpenWebUI+Ollama方案，轻松将QwQ-32B模型部署到ECS，或连接阿里云百炼的在线模型。整个过程无需编写代码，全部在控制台完成，适合新手操作。

柯灵

1,588

豁朗

2022-05-16

2236

【最佳实践】K8s挂载PVC日志采集“轻量级”玩法

本文提供一种相对Sidecar部署更轻量级的采集方式，只需要部署少量的Logtail容器，即可采集不同业务容器的日志。

豁朗

2,236

官方博客-第22页-阿里云开发者社区

类目筛选

内容类型

一文详解 Java 限流接口实现

SLS 大模型可观测&安全推理审计标准解决方案

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

大数据分析平台之 OLAP 架构的最佳实践

我的程序突然罢工了｜深入探究HSF调用异常，从死锁到活锁的全面分析与解决

两步构建 AI 总结助手，实现智能文档摘要

大模型推理服务全景图

QwQ-32B一键部署，真正的0代码，0脚本，0门槛

【最佳实践】K8s挂载PVC日志采集“轻量级”玩法

官方博客-第22页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

一文详解 Java 限流接口实现

SLS 大模型可观测&安全推理审计标准解决方案

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

大数据分析平台之 OLAP 架构的最佳实践

我的程序突然罢工了｜深入探究HSF调用异常，从死锁到活锁的全面分析与解决

两步构建 AI 总结助手，实现智能文档摘要

大模型推理服务全景图

QwQ-32B一键部署，真正的0代码，0脚本，0门槛

【最佳实践】K8s挂载PVC日志采集“轻量级”玩法