文档备案控制台

开发者社区千问大模型文章正文

通义大模型使用指南之通义万相

2024-04-07 7804

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 该文介绍了如何在阿里云的通义大模型平台注册账号，并详细展示了通义万相功能的使用，包括文本生成图像、相似图像生成、图像风格迁移和应用广场（虚拟模特）四个部分。用户可以通过输入文字或选择图片，生成不同风格的创意作品，并能进行点赞、不满意、生成相似图、下载原图和收藏等操作。在应用广场中，用户可以上传图片并替换模特及背景，创建个性化商品展示图。

一、注册

我们可以打开以下网站，用手机号注册一个账号即可。

通义大模型 (aliyun.com)

二、使用介绍

如图，我们可以看到有三个大项功能，通义千问、通义万相、通义听悟。下来我们体验一下通义万相的功能。

1、通义万相

点开上面的通义万相，我们可以进入如下界面：通义万相 (aliyun.com)，可以看到主要有这几个功能：文本生成图像、相似图像生成、图像风格迁移和应用广场

1、1文本生成图像

当我们点击 文本生成图像 的时候，会出现如下界面，在问本框内输入文字，例如我输入了 山水画 ，点击 生成创意画作 就会出现右侧的图：

当我们觉得不满意的时候可以点击右上角的再次生成，或者想在原有的基础上再添加其他元素的时候，可以点击由上角的 复用创意

可以看到生成的图片有点像现代的画，不像是古代的那种山水画，于是我又重新输入了 古代游船

显示的画作还是很奇怪，于是我输入了

山水画画一个古诗为远上寒山石径斜，白云深处有人家。停车坐爱枫林晚，霜叶红于二月花的意境，

可以看到产生的画作确实还是比较现代，可能就是这个平台的风格，

生成满意的画作之后，我们在每个图片下面看到这几个按钮，从左向右分别为 点赞、不满意、生成相似图、下载原图、收藏 功能，可以进行自己想要的操作。

1、2相似图像生成

当我们点击 相似图像生成 的时候，会出现如下界面，在图像区选择一个图片文字，例如我输入了 官方样例 ，点击 生成相似画作 就会出现下方的图：

当我们选择失误的时候可以选择原图中左上角删除按钮来切换图片

1、3图像风格迁移

当我们点击 图像风格迁移 的时候，会出现如下界面，在图像区上侧是选择原图，下侧选择风格图，然后点击生成：

可以看到生成了如下画作:

可以看到原图就像是用风格图渲染了一遍一样。

1、4应用广场

当我们选择应用广场中的虚拟模特时

进入如下界面，可以看到主要功能为

1、上传真人实拍商品展示图

2、选择要保留的商品区域

3、配置模特形象与场景环境

4、点击生成获取模特大片

然后我在左侧的图片处选择一张图片，在右侧选中要替换的地方，在下方的提示词处输入一些提示词和预设模版

然后我们点击生成，可以看到生成后的图片基本满足了我们的提示词。

当然我们也可以在自定义的地方求换模特形象和背景环境，切换后的效果如下：

再次切换效果如下，可以看到还是有变化的。

以上就是我们本次体验的通义万相的功能了。

文章标签：

大模型服务平台百炼

自然语言处理

搜索推荐

来源：

开发者社区 > 阿里云百炼 > 文章 > 正文

小强聊it

目录

相关文章

霍格沃兹测试开发学社

|

9月前

|

存储人工智能 NoSQL

AI大模型应用实践八：如何通过RAG数据库实现大模型的私有化定制与优化

RAG技术通过融合外部知识库与大模型，实现知识动态更新与私有化定制，解决大模型知识固化、幻觉及数据安全难题。本文详解RAG原理、数据库选型（向量库、图库、知识图谱、混合架构）及应用场景，助力企业高效构建安全、可解释的智能系统。

霍格沃兹测试开发学社

1973 2 3

时光在流逝

|

9月前

|

机器学习/深度学习人工智能人机交互

当AI学会“看”和“听”：多模态大模型如何重塑人机交互

当AI学会“看”和“听”：多模态大模型如何重塑人机交互

时光在流逝

706 121 121

九月天空

|

9月前

|

数据采集人工智能搜索推荐

智能新纪元：多模态大模型如何重塑人机交互

智能新纪元：多模态大模型如何重塑人机交互

九月天空

421 113 113

九月天空

|

9月前

|

人工智能人机交互知识图谱

当AI学会“融会贯通”：多模态大模型如何重塑未来

当AI学会“融会贯通”：多模态大模型如何重塑未来

九月天空

495 114 114

代码bug生产队

|

9月前

|

人工智能安全搜索推荐

当AI学会“看”和“听”：多模态大模型如何重塑人机交互

当AI学会“看”和“听”：多模态大模型如何重塑人机交互

代码bug生产队

891 117 118

modelscope

|

11月前

|

数据采集机器学习/深度学习编解码

小红书 hi lab开源最强多模态大模型dots.vlm1，性能对标闭源 Gemini 2.5 Pro 和 Seed-VL1.5

小红书 hi lab开源最强多模态大模型dots.vlm1，性能对标闭源 Gemini 2.5 Pro 和 Seed-VL1.5

modelscope

961 0 0

小红书 hi lab开源最强多模态大模型dots.vlm1，性能对标闭源 Gemini 2.5 Pro 和 Seed-VL1.5

汀丶人工智能

|

10月前

|

机器学习/深度学习人工智能自然语言处理

AI Compass前沿速览：Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型

AI Compass前沿速览：Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型

汀丶人工智能

1242 13 13

AI Compass前沿速览：Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型

modelscope

|

10月前

|

机器学习/深度学习编解码人工智能

InternVL3.5多模态大模型开源发布，1B-241B九种尺寸，支持跨平台GUI自动化与矢量图生成

近日，上海人工智能实验室（上海AI实验室）重磅开源发布了多模态大模型书生·万象 InternVL3.5，通过创新的级联式强化学习（Cascade RL）、动态视觉分辨率路由与解耦部署架构，实现推理能力、部署效率与通用能力的全面升级。

modelscope

2817 7 7

千问大模型

热门文章

最新文章

最新版通义千问（Qwen3.7-Max）功能介绍

最新版通义千问（Qwen3.7-Max）功能介绍

最新版通义千问（Qwen3.7-Max）功能介绍

最新版通义千问（Qwen3.7-Max）功能介绍

最新版通义千问（Qwen3.7-Plus）功能介绍

阿里云通义千问大模型详解：Qwen3.7系列核心能力、应用价值与订阅全解

阿里云千问大模型入门到精通全解：核心功能、价格配置与完整实操指南

Github 2024-07-01开源项目月报 Top15

阿里云千问大模型解析：具体模型与优势、落地场景、选型与定价介绍

阿里云千问大模型完整指南：功能、参数与各类订阅方案详解

QoderWork + QoderWake 实战：AI 数字员工的企业级落地与效率革命

最新版阿里云千问 Qwen3.5-Omni 功能介绍

最新版阿里云 Qwen3.7-Flash 功能介绍

最新版阿里云千问大模型（Qwen Max/Plus/Flash）功能介绍

最新版通义千问（Qwen3.7-Plus）功能介绍

最新版通义千问（Qwen3.7-Max）功能介绍

63场景全覆盖：金融AI Skill全景实战

ESG量化与跨境合规AI：绿色金融的新基建

报告生成技能：5种报告类型的自动化生产

企业微信25场景AI：从客服到运营的全覆盖

相关课程

更多

阿里云大模型能力培训（永耀）

国家电网大模型ACP培训

大模型 Clouder认证：基于PAI ArtLab的AIGC设计基础

阿里云大模型工程师ACA认证课程

阿里云百炼大模型产品实践

相关电子书

更多

OpenSearch向量检索和大模型方案

通义万相：视觉生成大模型的进化与应用

达摩院通义视觉生成大模型

下一篇

一条命令迁移，帮你实现 OpenClaw 与 Hermes Agent 记忆互通！