官方博客-第5页-阿里云开发者社区

  • 2025-02-13
    4301

    在通义灵码里用上DeepSeek-V3 和 DeepSeek-R1 满血版671B模型

    除了 AI 程序员的重磅上线外,近期通义灵码能力再升级全新上线模型选择功能,目前已经支持 Qwen2.5、DeepSeek-V3 和 R1系列模型,用户可以在 VSCode 和 JetBrains 里搜索并下载最新通义灵码插件,在输入框里选择模型,即可轻松切换模型。

  • 2025-05-22
    1266

    自媒体创作场景实践|通义千问3 + MCP=一切皆有可能

    本文介绍了通过MCP(Model Context Protocol)结合通义千问大模型实现跨平台、跨服务的自动化任务处理方案。使用Qwen3-235B-A22B模型,配合ComfyUI生成图像,并通过小红书等社交媒体发布内容,展示了如何打破AI云服务的数据孤岛。具体实践包括接入FileSystem、ComfyUI和第三方媒体Server,完成从本地文件读取到生成图像再到发布的全流程。 方案优势在于高可扩展性和易用性,但也存在大模型智能化不足、MCP Server开发难度较大及安全风险等问题。未来需进一步提升模型能力、丰富应用场景并解决安全挑战,推动MCP在更多领域落地。

    1,266
  • 2024-05-15
    243003

    通义千问API:用4行代码对话大模型

    本章将通过一个简单的例子,让你快速进入到通义千问大模型应用开发的世界。

    243,003
  • 2024-05-15
    15103

    Llama 3开源,魔搭社区手把手带你推理,部署,微调和评估

    Meta发布了 Meta Llama 3系列,是LLama系列开源大型语言模型的下一代。在接下来的几个月,Meta预计将推出新功能、更长的上下文窗口、额外的模型大小和增强的性能,并会分享 Llama 3 研究论文。

    15,103
  • 2024-05-24
    62563

    ClickHouse物化视图里常见的7个坑,点进看避坑指南

    一文解析ClickHouse物化视图

    62,563
  • 2024-11-06
    1800

    基于开源框架Spring AI Alibaba快速构建Java应用

    本文旨在帮助开发者快速掌握并应用 Spring AI Alibaba,提升基于 Java 的大模型应用开发效率和安全性。

    1,800
  • 2024-05-15
    3740

    大模型推理优化实践:KV cache复用与投机采样

    在本文中,我们将详细介绍两种在业务中实践的优化策略:多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现,并分享一些实现时的关键技巧。

    3,740
  • 2024-05-15
    78387

    通义千问API:让大模型使用各种工具

    本章我们将通过一个简单的例子,揭示基于LangChain的Agent开发的秘密,从而了解如何扩展大模型的能力。

    78,387
  • Post-Training on PAI (4):模型微调SFT、DPO、GRPO

    阿里云人工智能平台 PAI 提供了完整的模型微调产品能力,支持 监督微调(SFT)、偏好对齐(DPO)、强化学习微调(GRPO) 等业界常用模型微调训练方式。根据客户需求及代码能力层级,分别提供了 PAI-Model Gallery 一键微调、PAI-DSW Notebook 编程微调、PAI-DLC 容器化任务微调的全套产品功能。

  • 1
    ...
    4
    5
    6
    ...
    67
    到第