官方博客-第18页-阿里云开发者社区

ModelScope

2024-05-15

742

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

742

一默

2024-08-26

311

打破传统叙事逻辑，构建基于原子化任务的人机交互

在复杂中后台设计中，为解决配置变更影响多场景问题，提出结合正向和逆向信息架构，采用原子化任务，动态组合任务，降低用户和开发成本，优化体验并改变已有的产品迭代和人机交互模式。未来可能发展为AI自动根据业务规则和用户行为生成最佳方案。

一默

311

明巍临城水德

2024-11-14

534

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

在本文中，作者介绍了 Lingma SWE-GPT，一款专为解决复杂软件改进任务设计的开源大型语言模型系列。

明巍临城水德等

534

望宸

2025-02-20

660

大模型推理服务全景图

推理性能的提升涉及底层硬件、模型层，以及其他各个软件中间件层的相互协同，因此了解大模型技术架构的全局视角，有助于我们对推理性能的优化方案进行评估和选型。

望宸

660

阿里云云原生

2025-04-25

676

本文介绍了为何需要WolframAlpha及其在解决大语言模型“幻觉”问题上的优势。大型语言模型如GPT-4虽在自然语言处理方面表现出色，但在科学与数学问题上常出错。WolframAlpha凭借其强大的计算能力和广泛的知识库，能准确处理复杂问题。Higress MCP市场已上线WolframAlpha LLM API，支持多种调用方式，并提供每月10次免费试用。配置流程包括获取API工具、安装Lobechat及配置Higress MCP插件。测试案例显示，WolframAlpha在数学推理、日常计算和图像绘制等方面表现优异，未来结合更多服务将推动AI技术发展。

阿里云云原生

676

豁朗

2022-05-16

2229

【最佳实践】K8s挂载PVC日志采集“轻量级”玩法

本文提供一种相对Sidecar部署更轻量级的采集方式，只需要部署少量的Logtail容器，即可采集不同业务容器的日志。

豁朗

2,229

行疾

2024-05-15

3236

阿里云容器服务 ACK AI 助手正式上线

期待已久！阿里云容器服务 ACK AI 助手正式上线

行疾

3,236

资源编排ROS

2024-06-25

841

ROS CDK魔法书：点亮博客上云新技能（C#篇）

阿里云ROS CDK结合OSS的资源编排教程，教你如何以代码定义云资源，简化部署流程。ROS CDK允许使用编程语言（如TypeScript、C#）代替JSON或YAML模板，创建和管理云资源，如OSS Bucket。通过Asset模块，本地文件被转化为云资源，ROS CDK的`ros-cdk-ossassets`和`ros-cdk-ossdeployment`则负责资源上传和管理。教程以创建和部署博客到OSS为例，展示了从初始化项目、配置凭证到编写CDK代码，再到打包、部署和更新资源栈的全过程。使用ROS CDK，开发者能更高效地实现云上资源的自动化运维和管理。

资源编排ROS

841

青熙

2024-11-15

1227

AI经营｜多Agent择优生成商品标题

商品标题中关键词的好坏是商品能否被主搜检索到的关键因素，使用大模型自动优化标题成为【AI经营】中的核心能力之一，本文讲述大模型如何帮助商家优化商品素材，提升商品竞争力。

青熙

1,227

官方博客-第18页-阿里云开发者社区

类目筛选

内容类型

联合XTuner，魔搭社区全面支持数据集的长文本训练

打破传统叙事逻辑，构建基于原子化任务的人机交互

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

大模型推理服务全景图

理工科 MCP Server 神器，补足人工智能幻觉短板

【最佳实践】K8s挂载PVC日志采集“轻量级”玩法

阿里云容器服务 ACK AI 助手正式上线

ROS CDK魔法书：点亮博客上云新技能（C#篇）

AI经营｜多Agent择优生成商品标题

官方博客-第18页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

联合XTuner，魔搭社区全面支持数据集的长文本训练

打破传统叙事逻辑，构建基于原子化任务的人机交互

通义灵码 SWE-GPT：从 静态代码建模 迈向 软件开发过程长链推理

大模型推理服务全景图

理工科 MCP Server 神器，补足人工智能幻觉短板

【最佳实践】K8s挂载PVC日志采集“轻量级”玩法

阿里云容器服务 ACK AI 助手正式上线

ROS CDK魔法书：点亮博客上云新技能（C#篇）

AI经营｜多Agent择优生成商品标题

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理