官方博客-第6页-阿里云开发者社区

ModelScope

2024-05-15

15993

Llama 3开源，魔搭社区手把手带你推理，部署，微调和评估

Meta发布了 Meta Llama 3系列，是LLama系列开源大型语言模型的下一代。在接下来的几个月，Meta预计将推出新功能、更长的上下文窗口、额外的模型大小和增强的性能，并会分享 Llama 3 研究论文。

ModelScope

15,993

赵世振

2024-07-30

2463

阿里云百炼应用实践系列-AI助手快速搭建

本文主要介绍如何基于阿里云百炼平台快速在10分钟为您的网站添加一个 AI 助手。我们基于阿里云百炼平台的能力，以官方帮助文档为参考，搭建了一个以便全天候（7x24）回应客户咨询的AI助手，介绍了相关技术方案和主要代码，供开发者参考。

赵世振

2,463

灵杰开发者

2024-08-16

17213

RAG效果优化：高质量文档解析详解

本文介绍了如何通过高质量的文档解析提升RAG系统整体的效果。

灵杰开发者

17,213

裘展

2024-11-07

2338

白话文讲解大模型｜ Attention is all you need

本文档旨在详细阐述当前主流的大模型技术架构如Transformer架构。我们将从技术概述、架构介绍到具体模型实现等多个角度进行讲解。通过本文档，我们期望为读者提供一个全面的理解，帮助大家掌握大模型的工作原理，增强与客户沟通的技术基础。本文档适合对大模型感兴趣的人员阅读。

裘展

2,338

澄潭计缘望宸

2025-03-14

1625

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

通义千问最新推出的QwQ-32B推理模型，拥有320亿参数，性能媲美DeepSeek-R1（6710亿参数）。QwQ-32B支持在小型移动设备上本地运行，并可将企业大模型API调用成本降低90%以上。本文介绍了如何通过Higress AI网关实现DeepSeek-R1与QwQ-32B之间的无缝切换，涵盖环境准备、模型接入配置及客户端调用示例等内容。此外，还详细探讨了Higress AI网关的多模型服务、消费者鉴权、模型自动切换等高级功能，帮助企业解决TPS与成本平衡、内容安全合规等问题，提升大模型应用的稳定性和效率。

澄潭计缘望宸等

1,625

孤弋正己

2025-05-29

4048

MCP Server的五种主流架构与Nacos的选择

本文深入探讨了Model Context Protocol (MCP) 在企业级环境中的部署与管理挑战，详细解析了五种主流MCP架构模式（直连远程、代理连接远程、直连本地、本地代理连接本地、混合模式）的优缺点及适用场景，并结合Nacos服务治理框架，提供了实用的企业级MCP部署指南。通过Nacos MCP Router，实现MCP服务的统一管理和智能路由，助力金融、互联网、制造等行业根据数据安全、性能需求和扩展性要求选择合适架构。文章还展望了MCP在企业落地的关键方向，包括中心化注册、软件供应链控制和安全访问等完整解决方案。

孤弋正己

4,048

牧申景穆

2024-09-02

4199

【算法精讲系列】阿里云百炼SFT微调实践分享

本内容为您提供了百炼平台SFT微调的实践案例，帮助您方便并快速借助模型微调定制化您自己的专属模型。

牧申景穆

4,199

沈询

2024-11-06

3057

基于开源框架Spring AI Alibaba快速构建Java应用

本文旨在帮助开发者快速掌握并应用 Spring AI Alibaba，提升基于 Java 的大模型应用开发效率和安全性。

沈询

3,057

舟谨

2024-11-29

3129

作为开发者，我如何提高任务型大模型应用的响应性能

本文基于实际场景，分享了作为开发者提高大模型响应性能的四个实用方法。

舟谨

3,129

官方博客-第6页-阿里云开发者社区

类目筛选

内容类型

Llama 3开源，魔搭社区手把手带你推理，部署，微调和评估

阿里云百炼应用实践系列-AI助手快速搭建

RAG效果优化：高质量文档解析详解

白话文讲解大模型｜ Attention is all you need

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

MCP Server的五种主流架构与Nacos的选择

【算法精讲系列】阿里云百炼SFT微调实践分享

基于开源框架Spring AI Alibaba快速构建Java应用

作为开发者，我如何提高任务型大模型应用的响应性能

官方博客-第6页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

Llama 3开源，魔搭社区手把手带你推理，部署，微调和评估

阿里云百炼应用实践系列-AI助手快速搭建

RAG效果优化：高质量文档解析详解

白话文讲解大模型｜ Attention is all you need

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

MCP Server的五种主流架构与Nacos的选择

【算法精讲系列】阿里云百炼SFT微调实践分享

基于开源框架Spring AI Alibaba快速构建Java应用

作为开发者，我如何提高任务型大模型应用的响应性能