通义万相AI创作绘画产品方案产品体验

简介: 本次我有幸接触并体验了阿里云通义万相这一创新的AI绘画工具方案。该方案它是在利用人工智能技术,为用户提供创新、便捷的绘画创作体验。在体验过程中,我主要关注了产品的易用性、功能性、创新性、用户体验及方案本身等方面。

通义万相AI创作绘画产品方案产品体验

一、体验概述

本次我有幸接触并体验了阿里云通义万相这一创新的AI绘画工具方案。该方案它是在利用人工智能技术,为用户提供创新、便捷的绘画创作体验。在体验过程中,我主要关注了产品的易用性、功能性、创新性、用户体验及方案本身等方面。

二、体验过程

1. 部署与初始化

  • 按照官方提供的方案的指引,我们只需要点击一键部署即可。系统会自动一键创建了专有网络VPC、交换机、云服务器ECS以及对象存储OSS Bucket,并成功开通了DashScope灵积模型服务。

1.png

  • 创建过程相对顺畅,我们只需要配置服务器密码、DashScope灵积模型密钥、云服务器ECS类型、发布后的Web服务访问密码等即可。但部分步骤的文档说明略显简略,需要一定的技术背景才能顺利完成。

2.png

3.png


2. 功能体验

  • 整个部署预计在5分钟左右。部署完之后,我们可以通过资源编排ROS里面查看到相关的部署信息。

4.png

  • 然后我们通过应用程序生成的URL,在浏览器中输入该地址即可访问。

5.png

  • 输入我们之前配置好的账号及密码,我们可进入服务的体验界面,然后进行AI绘画创作。

6.png

3. 用户体验

  • 示例应用程序的用户界面简洁明了,易于操作。但在生成AI绘画作品后,用户界面没有提供直接的对比或编辑功能。由于这是一个简单的demo,产品的整体流程设计合理,但在部分细节上仍有待优化,以提升用户体验(特别是出图的速度,有点慢)。

7.png

8.png

三、体验感受

  1. 易用性:产品方案的部署过程虽然涉及多个产品,但整体流程设计合理,文档也相对清晰(这点给赞)。然而,对于非技术背景的用户来说,可能存在一定的上手难度。

10.png

  1. 功能性:这次示例应用程序提供的AI创作绘画功能表现较出色,能够快速生成高质量的AI绘画作品。但示例应用程序的功能相对基础,缺乏一些高级功能或自定义选项。

11.png

  1. 创新性:该产品方案在AI绘画领域具有较高的创新性,为用户提供了全新的创作体验。比如说demo提供了文本生成图像、涂鸦作画、人像风格重绘三大基础功能。在文本生成图像中,它提供了多种图片分辨率规格、图片数量及图片的风格,这可以大大提供用户灵活的创造,同时它也提供了。

12.png

13.png


  1. 用户体验:总体来看,这次的产品的整体流程设计合理,在用户界面和交互体验上还算不错。

四、个人反馈

4.1产品体验反馈:

  1. 文档完善性:部署文档整体来看,完善度较高。但是其中有几个小地方我要吐槽一下,建议进一步完善部署文档。比如说在部署完成后,登录的页面,登录的账号是什么?在文档中没有凸显出来,用户极其容易忘记,导致登录不了,另外这个用户名长度过长且具有一定复杂度,用户不太容易记住。还有就是服务器的选择,不同的服务器配置,会有什么样的差异?在该方案的部署文档中,没有找到相关的描述。还有部署过程的文档,在部署方案里面建议增加详尽的图文描述,这样会帮助用户快速并顺利的搭建环境。

14.png

15.png

  1. 功能扩展性:建议为示例应用程序添加更多高级功能或自定义选项,如调整绘画风格、形象等,以提升用户的创作体验。可以把通义万相里面的部分功能移植过来。

16.png

  1. 用户体验优化:建议优化用户界面和交互体验,例如在用户界面中添加对比和编辑功能,使用户能够直接在应用程序中查看和处理生成的AI绘画作品。例如,可以增加对比和编辑功能,提升用户在生成AI绘画作品后的使用体验。还有就是生成图片质量,对比了示例应用程序及通义万相的通义关键词生成效果,示例应用程序生成的效果要差一些。最后就是生成图片的速度上,示例应用程序大概需要30-45秒左右,而不是提示上的15-30秒。

17.png

18.png

19.png

20.png


4.2方案反馈:

  1. 面向人群:初看方案名字,可能会觉得它是面向广泛的艺术创作者、设计师、广告从业者、游戏开发者、教育机构以及对AI艺术感兴趣的普通用户。但是他们的背景可能包括专业艺术家、设计专业学生、市场营销人员、技术开发者等。但是细看它又需要一定技术背景的同学才能很好的了解它。
  2. 方案是否满足业务需求:从服务集成便捷性来看,通过ROS一键部署确实大大节省了部署的复杂度。降低了部署的技术门槛。但是在这个过程中,同样会带来一些困惑,希望后期能够改善优化下在服务响应时间来看,每次API的调用到结束,整体来看速度还不错,生成的效果也有保障。由于个人非专业人事,图片的泛化能力及生成的图片专业水平,不好判断。如果可以的话,可以把相关API清单罗列出来,让用户有一个全面的了解。
  3. 产品竞争力:方案中没有针对特定的场景,提出一整套相对完善的费用计算公司或方法。这样让用户很难准确的判断,引用该产品是否更具有性价比?它是否支持灵活调整费用等?除了费用之外,就是产品的专业能力,它针对复杂的场景及细节的处理能力是否足够强大?能不能支持更高级别的图像编辑功能(如局部修改、色彩调整等)。最后我还是建议可以在方案里面增加创意产业中的独特应用案例,展示其不可替代性。这样可以增加产品的竞争力。

五、小结

通义万相AI创作绘画产品方案在AI绘画领域具有较高的创新性,它能够为用户提供了全新的创作体验。在易用性、功能性和用户体验方面仍有待进一步提升。通过完善文档、扩展功能和优化用户体验等措施,该产品方案会变得更加成熟、完善。这次体验,让我深刻感受到了阿里云通义万相在推动绘画创作方式变革方面所展现出的非凡魅力与潜力。

目录
相关文章
|
27天前
|
数据采集 机器学习/深度学习 人工智能
Datawhale AI夏令营第四期魔搭-AIGC文生图方向Task1笔记
这段内容介绍了一个使用Stable Diffusion与LoRA技术创建定制化二次元图像生成模型的全流程。首先,通过安装必要的软件包如Data-Juicer和DiffSynth-Studio准备开发环境。接着,下载并处理二次元图像数据集,利用Data-Juicer进行数据清洗和筛选,确保图像质量和尺寸的一致性。随后,训练一个针对二次元风格优化的LoRA模型,并调整参数以控制模型复杂度。完成训练后,加载模型并通过精心设计的提示词(prompt)生成一系列高质量的二次元图像,展示模型对细节和艺术风格的理解与再现能力。整个过程展示了从数据准备到模型训练及结果生成的完整步骤,为定制化图像提供了方向。
|
1天前
|
人工智能 分布式计算 DataWorks
大数据&AI产品月刊【2024年8月】
大数据& AI 产品技术月刊【2024年8月】,涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。
|
20天前
|
存储 人工智能 自然语言处理
无缝融入,即刻智能[二]:Dify-LLM平台(聊天智能助手、AI工作流)快速使用指南,42K+星标见证专属智能方案
【8月更文挑战第8天】无缝融入,即刻智能[二]:Dify-LLM平台(聊天智能助手、AI工作流)快速使用指南,42K+星标见证专属智能方案
无缝融入,即刻智能[二]:Dify-LLM平台(聊天智能助手、AI工作流)快速使用指南,42K+星标见证专属智能方案
|
7天前
|
人工智能 计算机视觉 Python
AI计算机视觉笔记八:基于mediapipe的虚拟绘画
该项目利用MediaPipe手部关键点识别技术,实现了隔空绘画功能。用户可以通过手势控制绘画工具,选择颜色或橡皮擦。环境配置基于`mediapipe_env`,在PyCharm中运行。项目包括两个文件:`AiVirtualPainter.py`负责绘画逻辑,`HandTrackingModule.py`用于手部关键点检测。此项目展示了AI技术在互动应用中的潜力,适合初学者实践与学习。
26 10
|
9天前
|
人工智能 自动驾驶 架构师
Gartner 首次发布 AI 代码助手魔力象限,阿里云进入挑战者象限,通义灵码产品能力全面领先
通义灵码由阿里云和通义实验室联合打造,上线不到一年就入围 Gartner 挑战者象限,产品能力得到广泛认可。
|
27天前
|
SQL 人工智能 分布式计算
飞天发布时刻:大数据AI平台产品升级发布
阿里云飞天发布时刻产品发布会围绕阿里云大数据AI平台的新能力和新产品进行详细介绍。人工智能平台PAI、云原生大数据计算服务MaxCompute、开源大数据平台E-MapReduce、实时数仓Hologres、阿里云Elasticsearch、向量检索Milvus等产品均带来了相关发布的深度解读。
|
27天前
|
人工智能 分布式计算 大数据
大数据AI产品月刊-2024年7月
大数据& AI 产品技术月刊【2024年7月】,涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。
|
30天前
|
人工智能 自然语言处理 物联网
Datawhale从零入门AI文生图原理&实践-Task1
Datawhale从零入门AI文生图原理&实践-Task1
172 11
|
1月前
|
人工智能
如何利用ai快速写汇报、方案、总结。
本文介绍了一套与AI有效沟通的方法,以生成符合需求的文章。通过构建【角色+背景+任务+要求】的提示词框架,并辅以调试优化,可显著提升AI输出内容的质量。角色设定应包括单位、身份与能力;背景描述需涵盖宏观、微观及受众层面;任务需界定清晰,并可细分为文本输出或立意构思;要求则涉及语言风格、字数限制及内容结构。通过不断调试,最终产出满足期望的文章。
98 6
|
27天前
|
数据采集 机器学习/深度学习 人工智能
Datawhale AI夏令营第四期魔搭-AIGC文生图方向Task1笔记
这段内容介绍了一个使用LoRA技术定制Stable Diffusion模型的工作流程。首先定义了提示词的结构,接着概述了LoRA作为轻量级微调方法的角色。ComfyUI作为一个图形化工具,简化了AI模型的配置与操作。示例脚本展示了如何通过Data-Juicer和DiffSynth-Studio进行数据准备、模型训练,并最终生成特定风格的二次元图像。通过不同的种子和提示词,生成了一系列具有一致风格但内容各异的高质量二次元角色图像。
下一篇
DDNS