官方博客-第7页-阿里云开发者社区

赵世振

2024-12-24

1345

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

本篇文章详细讨论了如何确保大型语言模型（LLMs）输出结构化的JSON格式，这对于提高数据处理的自动化程度和系统的互操作性至关重要。

赵世振

1,345

望宸

2025-02-28

1156

DeepSeek加速了模型平权，大模型推理需求激增，性能提升主战场从训练转向推理。SSE（Server-Sent Events）和WebSocket成为大模型应用的标配网络通信协议。SSE适合服务器单向推送实时数据，如一问一答场景；WebSocket支持双向实时通信，适用于在线游戏、多人协作等高实时性场景。两者相比传统HTTPS协议，能更好地支持流式输出、长时任务处理和多轮交互，满足大模型应用的需求。随着用户体量扩大，网关层面临软件变更、带宽成本及恶意攻击等挑战，需通过无损上下线、客户端重连机制、压缩算法及安全防护措施应对。

望宸

1,156

阿里云开发者

2025-04-24

1209

为什么一定要做Agent智能体？

作者通过深入分析、理解、归纳，最后解答了“为什么一定要做Agent”这个问题。

阿里云开发者

1,209

ModelScope

2024-05-15

15239

Llama 3开源，魔搭社区手把手带你推理，部署，微调和评估

Meta发布了 Meta Llama 3系列，是LLama系列开源大型语言模型的下一代。在接下来的几个月，Meta预计将推出新功能、更长的上下文窗口、额外的模型大小和增强的性能，并会分享 Llama 3 研究论文。

ModelScope

15,239

阿里云云原生

2024-05-15

73833

通义灵码技术解析，打造 AI 原生开发新范式

本文第一部分先介绍 AIGC 对软件研发的根本性影响，从宏观上介绍当下的趋势；第二部分将介绍 Copilot 模式，第三部分是未来软件研发 Agent 产品的进展。

阿里云云原生

73,833

悦达

2025-03-21

1222

监控vLLM等大模型推理性能

本文将深入探讨 AI 推理应用的可观测方案，并基于 Prometheus 规范提供一套完整的指标观测方案，帮助开发者构建稳定、高效的推理应用。

悦达

1,222

阿里云开发者

2024-11-29

1186

【由浅到深】从神经网络原理、Transformer模型演进、到代码工程实现

阅读这个文章可能的收获：理解AI、看懂模型和代码、能够自己搭建模型用于实际任务。

阿里云开发者

1,186

柳遵飞

2024-12-11

1019

SpringCloud 应用 Nacos 配置中心注解

在 Spring Cloud 应用中可以非常低成本地集成 Nacos 实现配置动态刷新，在应用程序代码中通过 Spring 官方的注解 @Value 和 @ConfigurationProperties，引用 Spring enviroment 上下文中的属性值，这种用法的最大优点是无代码层面侵入性，但也存在诸多限制，为了解决问题，提升应用接入 Nacos 配置中心的易用性，Spring Cloud Alibaba 发布一套全新的 Nacos 配置中心的注解。

柳遵飞

1,019

孙玉梅

2025-04-01

438

从 DeepSeek 敏感信息泄露谈可观测系统的数据安全预防

探讨了 SLS 中增强数据安全的几种方式：权限精细化管控有效减少了潜在安全风险；接入层脱敏技术阻止敏感数据落库，提升了隐私保护；StoreView 字段集控制通过限制查询数据范围，降低数据泄露损害。智能监控系统提供实时监测，快速识别并阻断异常拖库行为，为企业提供了迅速响应和抵御威胁的能力。

孙玉梅

438

官方博客-第7页-阿里云开发者社区

类目筛选

内容类型

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

大模型推理主战场：通信协议的标配

为什么一定要做Agent智能体？

Llama 3开源，魔搭社区手把手带你推理，部署，微调和评估

通义灵码技术解析，打造 AI 原生开发新范式

监控vLLM等大模型推理性能

【由浅到深】从神经网络原理、Transformer模型演进、到代码工程实现

SpringCloud 应用 Nacos 配置中心注解

从 DeepSeek 敏感信息泄露谈可观测系统的数据安全预防

官方博客-第7页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

大模型推理主战场：通信协议的标配

为什么一定要做Agent智能体？

Llama 3开源，魔搭社区手把手带你推理，部署，微调和评估

通义灵码技术解析，打造 AI 原生开发新范式

监控vLLM等大模型推理性能

【由浅到深】从神经网络原理、Transformer模型演进、到代码工程实现

SpringCloud 应用 Nacos 配置中心注解

从 DeepSeek 敏感信息泄露谈可观测系统的数据安全预防