官方博客-第13页-阿里云开发者社区

舟谨

2024-12-13

594

如何提取手写票据信息

本文主要讲述在处理票据信息结构化提取任务时，如何结合OCR（光学字符识别）技术和多模态大模型Qwen-VL来提高票据信息提取的准确性和效率。

舟谨

594

丕天

2025-03-21

1300

AI 推理场景的痛点和解决方案

一个典型的推理场景面临的问题可以概括为限流、负载均衡、异步化、数据管理、索引增强 5 个场景。通过云数据库 Tair 丰富的数据结构可以支撑这些场景，解决相关问题，本文我们会针对每个场景逐一说明。

丕天

1,300

阿里云云原生

2025-08-01

1152

Vibecoding 新体验：实测 Qwen3 Coder 代码生成效果

Qwen3 Coder 是全球领先的开源编程大模型，具备强大的代码生成能力与1M超长上下文支持，适用于构建复杂应用。本文通过实际案例展示其在电商网站开发中的应用，并详解提示词设计、技术拆解与部署方案，探讨Agentic AI落地的挑战与经验。

阿里云云原生

1,152

ModelScope

2024-05-15

1996

剖析大模型连“Strawberry”的“r”都数不对的原因

本文将从两个常见的大模型翻车问题入手解析这些问题背后体现的大模型技术原理，并解释了为什么会导致这些问题，接着我们利用CoT（思维链）方法解决这些问题并基于上述原理试图剖析CoT方法起作用的可能原因，最后提出【理由先行】风格这一简单有效的Prompt Trick。

星莲

1,578

赵世振

2024-12-24

2719

本文介绍了阿里云百炼的CosyVoice语音合成大模型及其高并发调用优化方案。CosyVoice支持文本到语音的实时流式合成，适用于智能设备播报、音视频创作等多种场景。为了高效稳定地调用服务，文章详细讲解了WebSocket连接复用、连接池和对象池等优化技术，并通过对比实验展示了优化效果。优化后，机器负载降低，任务耗时减少，网络负载更优。同时，文章还提供了异常处理方法及常见问题解决方案，帮助开发者更好地集成和使用SDK。

赵世振

2,719

望宸

2025-02-28

1289

大模型推理主战场：通信协议的标配

DeepSeek加速了模型平权，大模型推理需求激增，性能提升主战场从训练转向推理。SSE（Server-Sent Events）和WebSocket成为大模型应用的标配网络通信协议。SSE适合服务器单向推送实时数据，如一问一答场景；WebSocket支持双向实时通信，适用于在线游戏、多人协作等高实时性场景。两者相比传统HTTPS协议，能更好地支持流式输出、长时任务处理和多轮交互，满足大模型应用的需求。随着用户体量扩大，网关层面临软件变更、带宽成本及恶意攻击等挑战，需通过无损上下线、客户端重连机制、压缩算法及安全防护措施应对。

望宸

1,289

澄潭计缘望宸

2025-03-14

1167

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

通义千问最新推出的QwQ-32B推理模型，拥有320亿参数，性能媲美DeepSeek-R1（6710亿参数）。QwQ-32B支持在小型移动设备上本地运行，并可将企业大模型API调用成本降低90%以上。本文介绍了如何通过Higress AI网关实现DeepSeek-R1与QwQ-32B之间的无缝切换，涵盖环境准备、模型接入配置及客户端调用示例等内容。此外，还详细探讨了Higress AI网关的多模型服务、消费者鉴权、模型自动切换等高级功能，帮助企业解决TPS与成本平衡、内容安全合规等问题，提升大模型应用的稳定性和效率。

澄潭计缘望宸等

1,167

子白

2024-05-15

102600

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,600

官方博客-第13页-阿里云开发者社区

类目筛选

内容类型

如何提取手写票据信息

AI 推理场景的痛点和解决方案

Vibecoding 新体验：实测 Qwen3 Coder 代码生成效果

Multi-Agent实践第7期：智能体的高效协作

剖析大模型连“Strawberry”的“r”都数不对的原因

【最佳实践系列】高并发调用百炼语音合成大模型

大模型推理主战场：通信协议的标配

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

大语言模型推理提速，TensorRT-LLM 高性能推理实践

官方博客-第13页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

如何提取手写票据信息

AI 推理场景的痛点和解决方案

Vibecoding 新体验：实测 Qwen3 Coder 代码生成效果

Multi-Agent实践第7期：智能体的高效协作

剖析大模型连“Strawberry”的“r”都数不对的原因

【最佳实践系列】高并发调用百炼语音合成大模型

大模型推理主战场：通信协议的标配

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

大语言模型推理提速，TensorRT-LLM 高性能推理实践