通义大模型使用指南之通义万相

简介: 该文介绍了如何在阿里云的通义大模型平台注册账号,并详细展示了通义万相功能的使用,包括文本生成图像、相似图像生成、图像风格迁移和应用广场(虚拟模特)四个部分。用户可以通过输入文字或选择图片,生成不同风格的创意作品,并能进行点赞、不满意、生成相似图、下载原图和收藏等操作。在应用广场中,用户可以上传图片并替换模特及背景,创建个性化商品展示图。

一、注册

我们可以打开以下网站,用手机号注册一个账号即可。

通义大模型 (aliyun.com)

二、使用介绍

如图,我们可以看到有三个大项功能,通义千问、通义万相、通义听悟。下来我们体验一下通义万相的功能。

1、通义万相

点开上面的通义万相,我们可以进入如下界面:通义万相 (aliyun.com),可以看到主要有这几个功能:文本生成图像、相似图像生成、图像风格迁移和应用广场

1、1文本生成图像

当我们点击 文本生成图像 的时候,会出现如下界面 ,在问本框内输入文字,例如我输入了 山水画 ,点击 生成创意画作 就会出现右侧的图

当我们觉得不满意的时候可以点击右上角的再次生成,或者想在原有的基础上再添加其他元素的时候,可以点击由上角的 复用创意

可以看到生成的图片有点像现代的画,不像是古代的那种山水画,于是我又重新输入了 古代游船

显示的画作还是很奇怪,于是我输入了

山水画画一个古诗为 远上寒山石径斜,白云深处有人家。 停车坐爱枫林晚,霜叶红于二月花的意境 ,

可以看到产生的画作确实还是比较现代,可能就是这个平台的风格,

生成满意的画作之后,我们在每个图片下面看到这几个按钮,从左向右分别为 点赞、 不满意、生成相似图、下载原图、收藏 功能,可以进行自己想要的操作。

image.png

1、2相似图像生成

当我们点击 相似图像生成 的时候,会出现如下界面 ,在图像区选择一个图片文字,例如我输入了 官方样例 ,点击 生成相似画作 就会出现下方的图

当我们选择失误的时候可以选择原图中左上角 删除 按钮来切换图片

1、3图像风格迁移

当我们点击 图像风格迁移 的时候,会出现如下界面 ,在图像区上侧是选择原图,下侧选择风格图,然后点击生成

可以看到生成了如下画作:

可以看到原图就像是用风格图渲染了一遍一样。

1、4应用广场

当我们选择应用广场中的虚拟模特时

image.png

进入如下界面,可以看到主要功能为

1、上传真人实拍商品展示图

2、选择要保留的商品区域

3、配置模特形象与场景环境

4、点击生成获取模特大片

然后我在左侧的图片处选择一张图片,在右侧选中要替换的地方,在下方的提示词处输入一些提示词和预设模版

然后我们点击生成,可以看到生成后的图片基本满足了我们的提示词。

当然我们也可以在自定义的地方求换模特形象和背景环境,切换后的效果如下:

再次切换效果如下,可以看到还是有变化的。


以上就是我们本次体验的通义万相的功能了。

目录
相关文章
|
5月前
|
存储 人工智能 NoSQL
AI大模型应用实践 八:如何通过RAG数据库实现大模型的私有化定制与优化
RAG技术通过融合外部知识库与大模型,实现知识动态更新与私有化定制,解决大模型知识固化、幻觉及数据安全难题。本文详解RAG原理、数据库选型(向量库、图库、知识图谱、混合架构)及应用场景,助力企业高效构建安全、可解释的智能系统。
|
5月前
|
机器学习/深度学习 人工智能 人机交互
当AI学会“看”和“听”:多模态大模型如何重塑人机交互
当AI学会“看”和“听”:多模态大模型如何重塑人机交互
491 121
|
5月前
|
数据采集 人工智能 搜索推荐
智能新纪元:多模态大模型如何重塑人机交互
智能新纪元:多模态大模型如何重塑人机交互
332 113
|
5月前
|
人工智能 人机交互 知识图谱
当AI学会“融会贯通”:多模态大模型如何重塑未来
当AI学会“融会贯通”:多模态大模型如何重塑未来
386 114
|
5月前
|
人工智能 安全 搜索推荐
当AI学会“看”和“听”:多模态大模型如何重塑人机交互
当AI学会“看”和“听”:多模态大模型如何重塑人机交互
506 117
|
7月前
|
数据采集 机器学习/深度学习 编解码
小红书 hi lab开源最强多模态大模型dots.vlm1,性能对标闭源 Gemini 2.5 Pro 和 Seed-VL1.5
小红书 hi lab开源最强多模态大模型dots.vlm1,性能对标闭源 Gemini 2.5 Pro 和 Seed-VL1.5
770 0
小红书 hi lab开源最强多模态大模型dots.vlm1,性能对标闭源 Gemini 2.5 Pro 和 Seed-VL1.5
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
AI Compass前沿速览:Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型
AI Compass前沿速览:Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型
928 13
AI Compass前沿速览:Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型
|
6月前
|
机器学习/深度学习 编解码 人工智能
InternVL3.5多模态大模型开源发布,1B-241B九种尺寸,支持跨平台GUI自动化与矢量图生成
近日,上海人工智能实验室(上海AI实验室)重磅开源发布了多模态大模型书生·万象 InternVL3.5,通过创新的级联式强化学习(Cascade RL)、动态视觉分辨率路由与解耦部署架构,实现推理能力、部署效率与通用能力的全面升级。
1938 7

热门文章

最新文章