通义万相AIGC快速生成图像体验测评

简介: 通义万相AI绘画创作部署与体验。

在这个数字化飞速发展的时代,AI技术正以前所未有的速度渗透进我们生活的每一个角落,而图像生成领域无疑是其中最引人注目的亮点之一。近日,我有幸体验了基于自研通义万相AIGC技术的Web服务,这款服务以其强大的文本到图像、涂鸦转换、人像风格重塑及人物写真创建等功能,为艺术创作与数字内容开发带来了革命性的变革。以下是我对这次测试体验的详细报告。


1、资源准备

本次需要的云产品包括ECS、对象存储OSS、DashScope灵积模型服务

image.png

开通DashScope服务并获取API-KEY,后面在云资源配置时需要。


image.png

image.png

单击创建新的API-KEY。在弹出的API-KEY详情页面,单击复制,将API-KEY妥善保存至本地后,单击我已保存,关闭。

image.png


2、一键部署


如下图所示,资源栈的名称是自动生成的,配置应用登录的用户名和密码。输入之前创建的DashScope API-KEY,选择ecs.g8a规格的ECS,输入实例密码,点击下一步开始创建。

image.png


image.png


可以在状态处查看创建的进度。

image.png

大概5-6分钟之后就创建完成了。在“输出”中点击体验的URL网址。

image.png


在“参数”的菜单中找到DemoUserName。


image.png

在体验的网址上输入上一步中的用户名和之前部署时设置的密码,即可登录。

image.png

3、功能体验

登录之后可以看到有“文本生成图像”、“涂鸦作画”、“人像风格重绘”。


体验文本生成图像,输入提示词:香港回归27年纪念日。提示需要15-30秒,但等了5分钟也没有出图。难道是这些关键词敏感?

image.png


把提示词换成“蓝天白云”,很快就出图了。也可以切换生成图片的风格包括:3D卡通、动画、中国话、扁平插画、油画、素描、水彩。

image.png

涂鸦作画,风格选择水彩,内容描述向日葵,进行涂鸦作画,生成的画要比涂鸦更丰富。

image.png

image.png


人像风格重绘,需要上传一张人像图片,这里选择使用国画古风的风格。


image.png


4、资源释放


登录ROS控制台在左侧导航栏,选择资源栈。在资源栈页面的顶部选择部署的资源栈所在地域,找到资源栈,然后在其右侧操作列,单击删除。



image.png

在删除资源栈对话框,选择删除方式为释放资源,然后单击确定,根据提示完成资源释放。


image.png

删除完成。

image.png


此外,针对API-KEY若长期不再使用,建议删除。注意保密。


image.png


5、测评体验


以下是针对测试体验中的一些问题及想法:


  • 测试过程中针对使用的ECS资源都有价格评估,方便使用者进行成本管理及成本预期。不知道图像生成的张数多少是否和计费有关系,还是只需要支付ECS和OSS的费用即可?
  • 部署过程比较简单,在文本生成图像时使用的提示词可能有敏感词,等了很长时间也没有出图。希望这个有敏感词的时候可以做标红提示。
  • 目前可选的图片风格还是比较有限,希望后面可以能自定义图片风格。
  • 针对生成的图像希望以后还可以根据提示词来局部调整。
  • 是否可以增加以图生图和图片合成两种场景。
  • 提示词反向学习,是否能上传一种照片来生成提示词,再修改这些提示词之后,重新生成自己想要的图片。


整体来说通义万相AIGC技术的Web服务无疑是一次成功的尝试,它以其强大的图像生成能力和丰富的功能选项,为艺术家、设计师以及广大用户提供了一个高效、便捷的创作平台。无论是专业人士还是业余爱好者,都能在这个平台上找到属于自己的创作乐趣和灵感。同时,该服务在广告营销、教育、游戏开发等多个领域的应用潜力巨大,有望为这些行业带来更加丰富的视觉内容和更优秀的用户体验。


相关实践学习
使用操作系统智能助手OS Copilot解锁操作系统运维与编程
在本实验场景中,将在阿里云ECS上体验OS Copilot产品。OS Copilot是阿里云操作系统团队基于大模型构建的OS智能助手。它具有自然语言问答、辅助命令执行、系统运维调优等功能,帮助用户更好地使用Linux,提升阿里云的使用体验。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
相关文章
|
11月前
|
人工智能 前端开发 搜索推荐
利用通义灵码和魔搭 Notebook 环境快速搭建一个 AIGC 应用 | 视频课
当我们熟悉了通义灵码的使用以及 Notebook 的环境后,大家可以共同探索 AIGC 的应用的更多玩法。
919 124
|
9月前
|
人工智能 IDE 定位技术
通义灵码 AI IDE 上线,第一时间测评体验
通义灵码 AI IDE 重磅上线,开启智能编程新纪元!无需插件,开箱即用,依托通义千问大模型,实现高效、智能的编程体验。支持 MCP 工具链,可快速调用多种服务(如12306余票查询、高德地图标注等),大幅提升开发效率。结合 Qwen3 强大的 Agent 能力,开发者可通过自然语言快速构建功能,如智能选票系统、地图可视化页面等。行间代码预测、AI 规则定制、记忆能力等功能,让 AI 更懂你的编码习惯。Lingma IDE 不仅是工具,更是开发者身边的智能助手,助力 AI 编程落地实践。立即下载体验,感受未来编程的魅力!
1008 16
|
10月前
|
数据可视化 API Swift
全模态图像模型Nexus-Gen对齐GPT-4o!同时搞定,数据、训练框架、模型全面开源
OpenAI GPT-4o发布强大图片生成能力后,业界对大模型生图能力的探索向全模态方向倾斜,训练全模态模型成研发重点。
455 17
|
9月前
|
搜索推荐 前端开发 JavaScript
通义灵码深度测评报告
通义灵码是阿里云推出的智能编程平台,基于Qwen3大模型与MCP服务生态,重新定义现代软件开发范式。本文测评聚焦其四大核心功能:编程智能体(自主决策开发)、MCP工具生态(加速开发流程)、记忆感知(个性化体验)及深度开发能力(智能推荐与解释)。实测数据显示,相比传统开发,效率显著提升,如API开发提速300%。展望应用场景包括低代码开发、DevOps自动化及教育领域等。总结建议增强多语言支持、优化复杂逻辑并建立开发者社区知识库。
|
5月前
|
人工智能 缓存 自然语言处理
Java与多模态AI:构建支持文本、图像和音频的智能应用
随着大模型从单一文本处理向多模态能力演进,现代AI应用需要同时处理文本、图像、音频等多种信息形式。本文深入探讨如何在Java生态中构建支持多模态AI能力的智能应用。我们将完整展示集成视觉模型、语音模型和语言模型的实践方案,涵盖从文件预处理、多模态推理到结果融合的全流程,为Java开发者打开通往下一代多模态AI应用的大门。
507 41
|
11月前
|
人工智能 中间件 API
别让创意卡在工具链!MiniMax MCP Server:MiniMax 开源 MCP 服务打通多模态生成能力,视频语音图像一键全搞定
MiniMax MCP Server 是基于模型上下文协议的多模态生成中间件,支持通过文本指令调用视频生成、图像创作、语音合成及声音克隆等能力,兼容主流客户端实现跨平台调用,采用检索增强生成技术保障内容准确性。
1023 3
别让创意卡在工具链!MiniMax MCP Server:MiniMax 开源 MCP 服务打通多模态生成能力,视频语音图像一键全搞定
|
10月前
|
人工智能 弹性计算 智能设计
🎨 三步打造AI创意工坊 | 通义万相图像生成服务极速部署指南
🚀 从零到大师 | 通义万相智能创作系统部署指南
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
88_多模态提示:图像与文本融合
在人工智能领域的快速发展中,多模态融合已成为突破单一模态限制、实现更全面智能理解的关键技术方向。人类理解世界的方式天然是多模态的——我们同时通过视觉、听觉、语言等多种感官获取信息并进行综合分析。例如,在餐厅点餐时,我们会同时处理菜单上的图片、服务员的介绍和菜品的文字描述,最终做出决策。这种自然的多模态信息整合能力,正是人工智能系统长期以来努力追求的目标。
772 0
|
7月前
|
传感器 机器学习/深度学习 监控
【图像融合】差异的高斯:一种简单有效的通用图像融合方法[用于融合红外和可见光图像、多焦点图像、多模态医学图像和多曝光图像](Matlab代码实现)
【图像融合】差异的高斯:一种简单有效的通用图像融合方法[用于融合红外和可见光图像、多焦点图像、多模态医学图像和多曝光图像](Matlab代码实现)
348 0