官方博客-第18页-阿里云开发者社区

ModelScope

2024-05-15

673

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

673

飒爽

2024-09-04

502

用Prompt技巧激发无限创意

本文深入探讨当前最前沿的prompt engineering方案，结合OpenAI、Anthropic和Google等大模型公司的资料，以及开源社区中宝贵的prompt技巧分享，全面解析这一领域的实践策略。

飒爽

502

舟谨

2024-12-13

403

如何提取手写票据信息

本文主要讲述在处理票据信息结构化提取任务时，如何结合OCR（光学字符识别）技术和多模态大模型Qwen-VL来提高票据信息提取的准确性和效率。

舟谨

403

赵世振

2024-12-25

2008

通义视觉推理大模型QVQ-72B-preview重磅上线

Qwen团队推出了新成员QVQ-72B-preview，这是一个专注于提升视觉推理能力的实验性研究模型。提升了视觉表示的效率和准确性。它在多模态评测集如MMMU、MathVista和MathVision上表现出色，尤其在数学推理任务中取得了显著进步。尽管如此，该模型仍存在一些局限性，仍在学习和完善中。

赵世振

2,008

赵世振

2025-01-09

1949

阿里云百炼xWaytoAGI共学课DAY3 - 更热门的多模态交互案例带练，实操掌握AI应用开发

本文章旨在帮助读者了解并掌握大模型多模态技术的实际应用，特别是如何构建基于多模态的实用场景。文档通过几个具体的多模态应用场景，如拍立淘、探一下和诗歌相机，展示了这些技术在日常生活中的应用潜力。

赵世振

1,949

唐三望宸

2025-01-23

408

海外泼天流量｜浅谈全球化技术架构

本文对海外泼天流量现状做了快速整理，旨在抛砖引玉，促进国内企业在出海过程中，交流如何构建全球化技术架构的落地经验，相信会有越来越多资深人士分享更深层次的实践。

唐三望宸

408

阿里云云原生

434

3个月，上百家企业交流，和大家聊聊AI应用的落地实践（开篇）

企业希望自己的业务被 AI 赋能的诉求是强烈的，但大多数企业是不知道从哪里下手的

阿里云云原生

434

偏左

2023-08-28

21327

探索AI时代的应用工程化架构演进，一人公司时代还有多远？

当代AI来势汹汹，本文从AI的特点、对研发的挑战、AI的应用工程和场景分化等剖析了AI时代的应用工程化架构演进之路。

偏左

21,327

阿里云云原生

2024-05-15

375

实践总结｜前端架构设计的一点考究（下）

作者将【DDD、六边形、洋葱、清洁、CQRS】进行深入学习并梳理总结的一个前端架构设计，并且经历一定应用实践的考验。

阿里云云原生

375

官方博客-第18页-阿里云开发者社区

类目筛选

内容类型

联合XTuner，魔搭社区全面支持数据集的长文本训练

用Prompt技巧激发无限创意

如何提取手写票据信息

通义视觉推理大模型QVQ-72B-preview重磅上线

阿里云百炼xWaytoAGI共学课DAY3 - 更热门的多模态交互案例带练，实操掌握AI应用开发

海外泼天流量｜浅谈全球化技术架构

3个月，上百家企业交流，和大家聊聊AI应用的落地实践（开篇）

探索AI时代的应用工程化架构演进，一人公司时代还有多远？

实践总结｜前端架构设计的一点考究（下）

官方博客-第18页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

联合XTuner，魔搭社区全面支持数据集的长文本训练

用Prompt技巧激发无限创意

如何提取手写票据信息

通义视觉推理大模型QVQ-72B-preview重磅上线

阿里云百炼xWaytoAGI共学课DAY3 - 更热门的多模态交互案例带练，实操掌握AI应用开发

海外泼天流量｜浅谈全球化技术架构

3个月，上百家企业交流，和大家聊聊AI应用的落地实践（开篇）

探索AI时代的应用工程化架构演进，一人公司时代还有多远？

实践总结｜前端架构设计的一点考究（下）