官方博客-第12页-阿里云开发者社区

星莲

2024-11-21

1578

剖析大模型连“Strawberry”的“r”都数不对的原因

本文将从两个常见的大模型翻车问题入手解析这些问题背后体现的大模型技术原理，并解释了为什么会导致这些问题，接着我们利用CoT（思维链）方法解决这些问题并基于上述原理试图剖析CoT方法起作用的可能原因，最后提出【理由先行】风格这一简单有效的Prompt Trick。

星莲

1,578

舟谨

2024-12-13

593

如何提取手写票据信息

本文主要讲述在处理票据信息结构化提取任务时，如何结合OCR（光学字符识别）技术和多模态大模型Qwen-VL来提高票据信息提取的准确性和效率。

舟谨

593

澄潭计缘望宸

2025-03-14

1167

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

通义千问最新推出的QwQ-32B推理模型，拥有320亿参数，性能媲美DeepSeek-R1（6710亿参数）。QwQ-32B支持在小型移动设备上本地运行，并可将企业大模型API调用成本降低90%以上。本文介绍了如何通过Higress AI网关实现DeepSeek-R1与QwQ-32B之间的无缝切换，涵盖环境准备、模型接入配置及客户端调用示例等内容。此外，还详细探讨了Higress AI网关的多模型服务、消费者鉴权、模型自动切换等高级功能，帮助企业解决TPS与成本平衡、内容安全合规等问题，提升大模型应用的稳定性和效率。

澄潭计缘望宸等

1,167

探索云世界

2025-11-17

181

【跨国数仓迁移最佳实践7】基于 MaxCompute 多租的大数据平台架构

本系列文章将围绕东南亚头部科技集团的真实迁移历程展开，逐步拆解 BigQuery 迁移至 MaxCompute 过程中的关键挑战与技术创新。本篇为第七篇，基于MaxCompute 多租的大数据平台架构。注：客户背景为东南亚头部科技集团，文中用 GoTerra 表示。

探索云世界

181

赵世振

2024-12-24

2718

【最佳实践系列】高并发调用百炼语音合成大模型

本文介绍了阿里云百炼的CosyVoice语音合成大模型及其高并发调用优化方案。CosyVoice支持文本到语音的实时流式合成，适用于智能设备播报、音视频创作等多种场景。为了高效稳定地调用服务，文章详细讲解了WebSocket连接复用、连接池和对象池等优化技术，并通过对比实验展示了优化效果。优化后，机器负载降低，任务耗时减少，网络负载更优。同时，文章还提供了异常处理方法及常见问题解决方案，帮助开发者更好地集成和使用SDK。

赵世振

2,718

丕天

2025-03-21

1298

AI 推理场景的痛点和解决方案

一个典型的推理场景面临的问题可以概括为限流、负载均衡、异步化、数据管理、索引增强 5 个场景。通过云数据库 Tair 丰富的数据结构可以支撑这些场景，解决相关问题，本文我们会针对每个场景逐一说明。

丕天

1,298

骆天

2024-05-15

3945

高并发架构设计三大利器：缓存、限流和降级

软件系统有三个追求：高性能、高并发、高可用，俗称三高。本篇讨论高并发，从高并发是什么到高并发应对的策略、缓存、限流、降级等。

骆天

3,945

垚佳汐遥

2024-10-23

1093

通义灵码知识库问答增强：知识库构建与管理指南

通义灵码能够结合企业知识库的私域数据，生成贴合企业特点的回答。充分发挥检索增强技术的优势，构建高质量的企业知识数据以及合理的知识库权限管理是必不可少的。本文将为您详细介绍如何构造与管理一个高质量的企业知识库。

垚佳汐遥

1,093

李德

2024-12-06

1474

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

本文章基于业务实践，总结有关客服质检场景的解决方案和处理经验，为相似场景提供可行的借鉴方法。

李德

1,474

官方博客-第12页-阿里云开发者社区

类目筛选

内容类型

剖析大模型连“Strawberry”的“r”都数不对的原因

如何提取手写票据信息

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

【跨国数仓迁移最佳实践7】基于 MaxCompute 多租的大数据平台架构

【最佳实践系列】高并发调用百炼语音合成大模型

AI 推理场景的痛点和解决方案

高并发架构设计三大利器：缓存、限流和降级

通义灵码知识库问答增强：知识库构建与管理指南

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

官方博客-第12页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

剖析大模型连“Strawberry”的“r”都数不对的原因

如何提取手写票据信息

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

【跨国数仓迁移最佳实践7】基于 MaxCompute 多租的大数据平台架构

【最佳实践系列】高并发调用百炼语音合成大模型

AI 推理场景的痛点和解决方案

高并发架构设计三大利器：缓存、限流和降级

通义灵码知识库问答增强：知识库构建与管理指南

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估