通义大模型使用指南之通义万相

本文涉及的产品
通义法睿合同智能审查,1个月8份合同免费体验
简介: 该文介绍了如何在阿里云的通义大模型平台注册账号,并详细展示了通义万相功能的使用,包括文本生成图像、相似图像生成、图像风格迁移和应用广场(虚拟模特)四个部分。用户可以通过输入文字或选择图片,生成不同风格的创意作品,并能进行点赞、不满意、生成相似图、下载原图和收藏等操作。在应用广场中,用户可以上传图片并替换模特及背景,创建个性化商品展示图。

一、注册

我们可以打开以下网站,用手机号注册一个账号即可。

通义大模型 (aliyun.com)

二、使用介绍

如图,我们可以看到有三个大项功能,通义千问、通义万相、通义听悟。下来我们体验一下通义万相的功能。

1、通义万相

点开上面的通义万相,我们可以进入如下界面:通义万相 (aliyun.com),可以看到主要有这几个功能:文本生成图像、相似图像生成、图像风格迁移和应用广场

1、1文本生成图像

当我们点击 文本生成图像 的时候,会出现如下界面 ,在问本框内输入文字,例如我输入了 山水画 ,点击 生成创意画作 就会出现右侧的图

当我们觉得不满意的时候可以点击右上角的再次生成,或者想在原有的基础上再添加其他元素的时候,可以点击由上角的 复用创意

可以看到生成的图片有点像现代的画,不像是古代的那种山水画,于是我又重新输入了 古代游船

显示的画作还是很奇怪,于是我输入了

山水画画一个古诗为 远上寒山石径斜,白云深处有人家。 停车坐爱枫林晚,霜叶红于二月花的意境 ,

可以看到产生的画作确实还是比较现代,可能就是这个平台的风格,

生成满意的画作之后,我们在每个图片下面看到这几个按钮,从左向右分别为 点赞、 不满意、生成相似图、下载原图、收藏 功能,可以进行自己想要的操作。

image.png

1、2相似图像生成

当我们点击 相似图像生成 的时候,会出现如下界面 ,在图像区选择一个图片文字,例如我输入了 官方样例 ,点击 生成相似画作 就会出现下方的图

当我们选择失误的时候可以选择原图中左上角 删除 按钮来切换图片

1、3图像风格迁移

当我们点击 图像风格迁移 的时候,会出现如下界面 ,在图像区上侧是选择原图,下侧选择风格图,然后点击生成

可以看到生成了如下画作:

可以看到原图就像是用风格图渲染了一遍一样。

1、4应用广场

当我们选择应用广场中的虚拟模特时

image.png

进入如下界面,可以看到主要功能为

1、上传真人实拍商品展示图

2、选择要保留的商品区域

3、配置模特形象与场景环境

4、点击生成获取模特大片

然后我在左侧的图片处选择一张图片,在右侧选中要替换的地方,在下方的提示词处输入一些提示词和预设模版

然后我们点击生成,可以看到生成后的图片基本满足了我们的提示词。

当然我们也可以在自定义的地方求换模特形象和背景环境,切换后的效果如下:

再次切换效果如下,可以看到还是有变化的。


以上就是我们本次体验的通义万相的功能了。

相关实践学习
如何快速创建插件agent
阿里云百炼应用基于Assistant API技术架构,结合大语言模型(LLM)的推理、知识检索增强、插件调度等能力,构建应对各类复杂场景任务的场景应用。通过集成化、直观易用的产品界面,为开发者提供了丰富的应用配置选项,包括大型语言模型(LLM)选择、Pro
目录
打赏
0
1
0
0
30
分享
相关文章
通过阿里云Milvus与通义千问VL大模型,快速实现多模态搜索
阿里云向量检索服务Milvus版是一款全托管向量检索引擎,并确保与开源Milvus的完全兼容性,支持无缝迁移。它在开源版本的基础上增强了可扩展性,能提供大规模AI向量数据的相似性检索服务。凭借其开箱即用的特性、灵活的扩展能力和全链路监控告警,Milvus云服务成为多样化AI应用场景的理想选择,包括多模态搜索、检索增强生成(RAG)、搜索推荐、内容风险识别等。您还可以利用开源的Attu工具进行可视化操作,进一步促进应用的快速开发和部署。
蔚来汽车智能座舱接入通义大模型,并使用通义灵码全面提效
为加速AI应用在企业市场落地,4月9日,阿里云在北京召开AI势能大会。阿里云智能集团资深副总裁、公共云事业部总裁刘伟光发表主题演讲,大模型的社会价值正在企业市场释放,阿里云将坚定投入,打造全栈领先的技术,持续开源开放,为AI应用提速。
通义万相2.1视频/图像模型新升级!可在阿里云百炼直接体验
通义万相2.1模型推出新特征,包括复杂人物运动的稳定展现、现实物理规律的逼真还原及中英文视频特效的绚丽呈现。通过自研的高效VAE和DiT架构,增强时空上下文建模能力,支持无限长1080P视频的高效编解码,并首次实现中文文字视频生成功能。升级后的通义万相荣登VBench榜单第一,提供电影级分镜效果、四格漫画故事速览及情侣头像创意定制等多种玩法,满足多样化的视觉创作需求。可直接在阿里云百炼平台调用API体验这些功能。
通义大模型:解码中国AI的"通"与"义"
“通义”取自中国传统文化中“通晓大义”,寓意技术与人文的结合。作为阿里巴巴旗下的超大规模语言模型,通义在知识蒸馏、动态稀疏激活和文化感知模块上实现三大突破,大幅提升效率与适切性。其已在医疗、司法、文化传播等领域落地,如辅助病历处理、法律文书生成及文物解说等。测试显示,通义在中文诗歌创作、商业报告生成等方面表现优异。同时,开放的开发者生态已吸引5万+创新者。未来,通义将探索长期记忆、自我反思及多智能体协作,向AGI迈进,成为智能本质的载体。其对中文语境情感的精准把握,更是中国AI“通情达义”的典范。
136 22
通义大模型:中国AI领域的新里程碑
本文介绍了阿里巴巴达摩院研发的“通义大模型”系列,该模型在2025年已成为AI领域的重要里程碑。通义大模型拥有超大规模参数、多模态融合、高效训练框架和中文优化等技术特点,在智能客服、内容创作、教育和企业服务等多个场景实现应用。未来,它将在多模态能力、小样本学习、安全性及应用场景拓展等方面持续突破,推动中国AI技术进步与行业智能化转型。
235 17
通义灵码技术解析:大模型如何重构开发者工作流
通义灵码是一款基于通义千问代码大模型的智能编程工具,专为中文开发者设计。它不仅提供代码补全功能,还覆盖需求分析、架构设计、代码生成与缺陷检测等全链路开发场景。文章从核心架构(多模态代码模型设计)、关键算法突破(语义驱动生成与双引擎缺陷检测)及工程实践(低延迟优化与企业级部署)三个维度剖析其创新逻辑,并通过性能基准测试展示其优越性。未来,通义灵码将持续探索AI-Native开发范式,重新定义开发者生产力。
64 7
通义万相2.1首尾帧模型开源!细节真实生动+过渡丝滑,指令遵循表现出色!
通义万相2.1首尾帧模型开源!细节真实生动+过渡丝滑,指令遵循表现出色!
83 5
通义万相Wan2.1视频模型开源!视频生成模型新标杆,支持中文字效+高质量视频生成
2025年1月,阿里通义万相Wan2.1模型登顶Vbench榜首第一,超越Sora、HunyuanVideo、Minimax、Luma、Gen3、Pika等国内外视频生成模型。而在今天,万相Wan2.1视频生成大模型正式开源!
2544 8
阿里云通义千问发布多款AI大模型 多模态、长文本能力全面升级!
阿里云通义千问发布多款AI大模型 多模态、长文本能力全面升级!
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等