官方博客-第7页-阿里云开发者社区

赵世振

2024-12-24

1346

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

本篇文章详细讨论了如何确保大型语言模型（LLMs）输出结构化的JSON格式，这对于提高数据处理的自动化程度和系统的互操作性至关重要。

赵世振

1,346

希秀吴诗倩柳佚洲公等

2024-09-03

3476

【算法精讲系列】通义模型Prompt调优的实用技巧与经验分享

本文详细阐述了Prompt的设计要素，包括引导语、上下文信息等，还介绍了多种Prompt编写策略，如复杂规则拆分、关键信息冗余、使用分隔符等，旨在提高模型输出的质量和准确性。通过不断尝试、调整和优化，可逐步实现更优的Prompt设计。

希秀吴诗倩柳佚洲公等

3,476

资源编排ROS

2024-05-15

1767

大模型不知不觉已经火了快一年了，拥有一个能够随时对话使用的大模型已经成为不少人的刚需。然而，最大的问题可能是如何访问和调用对话模型。如果，我是说如果，能在您的即时通讯软件钉钉中直接与通义千问对话，是不是会让这一切更方便快捷？！按照传统方案，我们要实现上述场景可能需要非常繁琐的接入步骤，甚至还需要自行开发很多代码，这样的准入门槛实在，太！高！啦！而今天，我要向各位隆重介绍一个新的解决方案——阿里云计算巢AppFlow应用与数据集成平台，无需任何代码开发，简单快捷，自动连接企业内部应用与外部应用或数据，搭建企业的自动化服务流程，帮助个人、企业降低了集成实施的周期和成本。

资源编排ROS

1,767

龙蜥社区OpenAnolis

2024-11-06

2990

AI 场景下确保模型数据安全，Confidential AI 技术最佳实践解读

机密计算软硬结合技术保障数据安全。

龙蜥社区OpenAnolis

2,990

柳遵飞

2024-12-11

1023

SpringCloud 应用 Nacos 配置中心注解

在 Spring Cloud 应用中可以非常低成本地集成 Nacos 实现配置动态刷新，在应用程序代码中通过 Spring 官方的注解 @Value 和 @ConfigurationProperties，引用 Spring enviroment 上下文中的属性值，这种用法的最大优点是无代码层面侵入性，但也存在诸多限制，为了解决问题，提升应用接入 Nacos 配置中心的易用性，Spring Cloud Alibaba 发布一套全新的 Nacos 配置中心的注解。

柳遵飞

1,023

望宸

2025-02-28

1156

大模型推理主战场：通信协议的标配

DeepSeek加速了模型平权，大模型推理需求激增，性能提升主战场从训练转向推理。SSE（Server-Sent Events）和WebSocket成为大模型应用的标配网络通信协议。SSE适合服务器单向推送实时数据，如一问一答场景；WebSocket支持双向实时通信，适用于在线游戏、多人协作等高实时性场景。两者相比传统HTTPS协议，能更好地支持流式输出、长时任务处理和多轮交互，满足大模型应用的需求。随着用户体量扩大，网关层面临软件变更、带宽成本及恶意攻击等挑战，需通过无损上下线、客户端重连机制、压缩算法及安全防护措施应对。

望宸

1,156

悦达

2025-03-21

1226

监控vLLM等大模型推理性能

本文将深入探讨 AI 推理应用的可观测方案，并基于 Prometheus 规范提供一套完整的指标观测方案，帮助开发者构建稳定、高效的推理应用。

悦达

1,226

阿里云开发者

2025-04-24

1209

为什么一定要做Agent智能体？

作者通过深入分析、理解、归纳，最后解答了“为什么一定要做Agent”这个问题。

阿里云开发者

1,209

李德

2025-03-27

1192

大模型联网搜索的短板与突破之路

本文作者详细分析了当前大模型在联网搜索功能中存在的几个主要问题，并提供了具体的案例和解决方案。

李德

1,192

官方博客-第7页-阿里云开发者社区

类目筛选

内容类型

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

【算法精讲系列】通义模型Prompt调优的实用技巧与经验分享

简单几步，钉钉机器人秒变通义千问对话机器人

AI 场景下确保模型数据安全，Confidential AI 技术最佳实践解读

SpringCloud 应用 Nacos 配置中心注解

大模型推理主战场：通信协议的标配

监控vLLM等大模型推理性能

为什么一定要做Agent智能体？

大模型联网搜索的短板与突破之路

官方博客-第7页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

【算法精讲系列】通义模型Prompt调优的实用技巧与经验分享

简单几步，钉钉机器人秒变通义千问对话机器人

AI 场景下确保模型数据安全，Confidential AI 技术最佳实践解读

SpringCloud 应用 Nacos 配置中心注解

大模型推理主战场：通信协议的标配

监控vLLM等大模型推理性能

为什么一定要做Agent智能体？

大模型联网搜索的短板与突破之路