创意“孵化机”——基于通义万相加速绘画创作流程

简介: 阿里云在2023年推出了AI绘画平台**通义万相**,该平台能够根据文本描述生成图像,应用于艺术创作。近期,阿里云优化了通义万相的接入方式,提供API文档和一键部署服务,使得非技术人员也能轻松集成到Web应用中。为促进用户尝试,阿里云还推出了解决方案评测活动,参与者有机会获得奖品。通义万相通过ECS、OSS、VPC和DashScope等云服务支持,简化了技术架构,加速了绘画创作流程。此外,阿里云提供了优惠购买方案,新人享有特别折扣。该服务不仅适用于艺术家,还可应用于多个领域,提高内容生成效率。

引言

随着人工智能技术的飞速跃进,我们正见证着一个前所未有的创意革命。在过去几年间,AI不仅在科技领域内开疆拓土,更以其独到的创造力深刻影响了艺术的版图。AI绘画技术,这一昔日遥不可及的梦想,如今已成为触手可及的现实,正逐步渗透并革新着绘画创作的每一个角落。

2023年云栖大会后,阿里云正式推出通义万相AI创作艺术平台。这一平台凭借其先进的算法和对艺术深度理解的能力,能够精准解读用户的创意指令,转换为令人惊叹的视觉作品。无论是细腻逼真的风景描绘,还是超现实主义的梦幻构想,通义万相都能信手拈来,为艺术家们开辟了全新的表达空间,同时也为普通大众提供了探索艺术创作的无限可能。

image.png

而近期,为了满足用户在Web服务中部署及应用AI绘画技术的需求,阿里云进一步优化了通义万相的接入方式,通过提供详细的API文档以及一键部署的云服务解决方案,使其更加灵活便捷地与各类Web服务集成,能够保证即使是非技术背景的创意工作者也能轻松地将通义万相的强大功能嵌入自己的网站或应用中,从而实现个性化图像内容的快速生成与迭代。

同时,阿里云官方也推出了解决方案评测活动,链接如下:通义万相AI绘画创作,欢迎大家一起来文档捉虫,并有机会赢取富士mini12拍立得、小米蓝牙耳机、挂脖风扇、评测证书等多重好礼哦!

image.png

方案介绍

技术架构及相关基础设施和云服务

image.png

【专有名词解释如下】:

  • 用户端(Client):用户可以通过网页界面或其他应用程序提交请求,包括上传图片或者输入文本描述。

  • 云服务器ECS(Elastic Compute Service):ECS是阿里云提供的计算服务,可以用来运行企业门户网站的应用程序和服务。在这个方案中,作为后端服务器,ECS接收并处理来自用户端的请求,它负责解析用户提交的参数、调度AI绘画任务,并与云上的其他服务交互,如存储服务和AI处理服务。

  • 对象存储OSS(Object Storage Service):OSS是一种高可用、高吞吐量的云存储服务,用于存储用户上传的原始图片素材和AI绘画生成的输出图像。它提供RESTful API接口,使得ECS能够方便地上传和下载数据,同时也支持直接的公网访问链接,便于用户获取最终的绘画作品。

  • 专有网络VPC(Virtual Private Cloud):VPC为云上资源构建一个逻辑隔离的网络环境。它允许用户定义自己的IP地址范围、子网、安全策略和路由表,确保AI绘画系统的网络通信安全,同时提供灵活的网络部署能力。

  • DashScope灵积模型服务:这是阿里云提供的一系列高级AI模型服务,专门用于处理大规模机器学习和深度学习任务。在AI绘画场景下,DashScope通过其内置的视觉生成模型,如通义万相,来实现从文本描述或基础图像到高质量艺术作品的转换。

  • 通义万相:作为核心AI技术,通义万相是一种基于深度学习的文本到图像生成模型。用户提供的文本描述被转化为精细的视觉图像,过程中模型综合运用了自然语言理解和图像合成技术,能够创造出多样且富有创意的图像内容,满足用户的个性化需求。

当用户通过界面提交绘画需求,不论是文字描述还是参考图片,信息随即被传送至云端服务器。服务器分析处理这些数据后,智能调度计算资源,激活AI绘画模型进行创意生成。接着,模型依据指令细腻地绘制出图像,这个过程中可能融入变换的风格与丰富的想象元素。完成后,新诞生的艺术作品被安全存储于云端,并经过必要的格式调整与质量把控,最终通过网络将这独一无二的视觉成果交付回用户的终端界面,实现了从概念到可视艺术的即时转化。

方案部署

image.png

1.部署准备:

  • 准备阿里云账号:你需要有一个有效的阿里云账号才能开始部署。

  • 开通DashScope服务:登录你的阿里云账号,开通DashScope服务。

  • 获取API-KEY:在开通服务后,需要获取一个API-KEY来访问和使用DashScope服务。这个键通常用于验证和授权对服务的访问。

  • 获取AccessKey并授权:也需要获取一个AccessKey,并对其进行授权以便能够访问和操作相关的阿里云资源。

2.部署资源:

  • 创建专有网络VPC和交换机:在阿里云控制台,你可以创建一个专有的网络VPC,并配置相应的交换机。VPC允许你在阿里云上构建自己的私有网络环境。

  • 创建安全组:为了保护你的云资源,你需要创建并配置安全组规则。安全组是一种虚拟防火墙,用于控制进出实例的流量。

  • 创建云服务器ECS:根据你的需求,你可以创建一台或多台云服务器ECS实例。这些实例可以运行各种操作系统和应用。

  • 创建对象存储OSS Bucket:最后,你需要创建一个对象存储OSS Bucket来存放你的文件和数据。OSS提供高可用、低成本的云存储服务。

3.安装示例应用程序:

  • 安装示例应用程序:在这个步骤中,你需要安装本解决方案提供的示例应用程序,并启动服务。

  • 在浏览器中访问部署的服务,体验通义万相的相关功能:一旦部署完成,你可以通过浏览器访问部署的服务,测试和体验其功能。

4.完成及清理:

  • 如完成体验且无需使用相关资源,请释放所有资源:如果你已经完成了体验并且不再需要这些资源,建议你释放所有的资源以避免不必要的费用。这包括删除ECS实例、OSS Bucket以及终止其他相关的云服务。

方案权益

结合以上涉及到的云产品,阿里云在这个方案中也给出了优惠购买方案和试用方案,当然啦,试用优先嘛~

image.png

除去方案中提到的产品优惠外,还额外有新人限时折扣

image.png

image.png

新人首购服务器仅需36元/年!

SSL证书200元/1年,比官网直接购买便宜约140元!

看到这里我是真的忍不住要骂一句脏话,我去年买的时候还是99r一年,今年直接就36r了。。。靠。。。。阿里云你这么卷,让其他友商怎么活啊。

基于通义万相加速绘画创作流程

点击进入创意加速器:AI 绘画创作方案

该方案展示了如何利用自研的通义万相AIGC技术在Web服务中实现先进的图像生成。其中包括文本到图像、涂鸦转换、人像风格重塑以及人物写真创建等功能。这些能力可以加快艺术家和设计师的创作流程,提高创意效率。同时,也可以在广告营销、教育和游戏开发等多个领域进行应用,以提升内容的视觉表现和用户体验。通过通义万相,用户可以轻松将文字描述或简单草图转化为高质量图像,实现个性化视觉内容的定制,满足社交媒体、电子商务和电子娱乐产业的需求。这标志着艺术创作、个性化表达和数字内容开发的无限可能性。

点击此处的【一键部署】。

image.png

首页默认为【方案概览】,可以直接点击进入下一步

image.png

此处默认为已有阿里云账号了,直接进入开通DashScope服务并获取API-KEY。

image.png

登录DashScope控制台

image.png

单击去开通。

image.png

阅读并勾选服务协议,然后单击立即开通。

在左侧导航栏单击管理中心 > API-KEY管理,单击创建新的API-KEY。

image.png

在弹出的API-KEY详情页面,单击复制,将API-KEY妥善保存至本地后,单击我已保存,关闭。

image.png

到这里,部署的准备工作就完成了。

一键部署

单击一键部署前往ROS控制台,选择DashScope API-KEY、ECS实例规格和可用区,以及输入实例密码。

image.png

分别填写如下内容:

  • 资源栈名称:默认

  • 登录用户名:设置成自己常用的,登录web端应用时的用户名

  • 登录密码:登录web端应用时输入的密码

  • DashScope API-KEY:上文获取到的API

  • 存储空间名称:默认

  • 可用区:不做特定要求

  • 实例类型:建议为4c,8G

  • 实例密码:服务器ECS登录密码

image.png
image.png
image.png

确定无误后,点击下一步。

image.png

点击创建。

image.png
image.png

开始创建后,等待约5分钟左右,显示创建成功。

image.png

点击资源栈的输出Tab,再点击体验地址行中的URL进行访问。

image.png

在浏览器中打开体验地址后,在登录页面上输入之前配置的用户名和密码,然后进行登录和体验。

image.png

在体验完成后,在资源栈页面的顶部选择部署的资源栈所在地域,找到资源栈,然后在其右侧操作列,单击删除。在删除资源栈对话框,选择删除方式为释放资源,然后单击确定,根据提示完成资源释放即可。

手动部署

对比一键部署,自是不必多言了,其优势显而易见。一键部署极大地简化了技术部署的复杂度,特别适合新手或是急于快速搭建环境的开发者,这里手动部署就不做过多赘述了。

image.png

优化建议

老规矩了,开始就事论事。

对于这个方案,部署过程是非常简洁流畅的,可以说是完全没有任何问题,但是唯一的问题却是该方案的必要性和目的性不明确!

拿我之前写的门户网站上云对比来说,是因为在传统网站部署方式往往伴随着高昂的时间成本与运维开销,难以满足企业对速度与灵活性的迫切需求正是在这样的背景下,阿里云提出了全新的解决方案——使用云效将项目代码部署到云服务器ECS,快速完成一个企业门户网站的构建。这里听起来似乎很合理,对吧?

但是这次评测的内容,其实明明已经有通义万相平台了,为什么还需要基于ECS再重新搭一套呢?

而且对照下述的应用场景,通义万相平台也都可以实现,既然有在线的平台可以用,为何还要自己费力的去搭一个呢???

image.png

这就是我认为这篇方案中最大的问题,即没有从根源上突出该方案的必要性!如果没有突出必要性的话,就压根不会有人愿意为此买账了。

所以说,这里需要补充的内容就是采用自建ECS+通义万相构建文生图应用能带来的优势,并且这些优势是官方提供的在线通义万相平台不具备的。

比如说:可以接入自己的应用中作为特色功能之一,并且可以灵活调整服务定价、广告植入、数据变现等商业模式等等。

这是一点。

然后我还想谈一谈的是第三点,即针对业务场景,该方案还有哪些可以改进的图片生成能力或在您的业务场景中,还希望它可以提供哪些新的功能?

AI绘画自流行以来,大多数企业或者公司都感叹于它的艺术性,但是实际上,它的本质可以说是生产力加速器,如果只把它界定为艺术创作就有会有些太狭隘了。

可以参考一下其他画图工具,目前已经能实现AI自动生成流程图、系统架构图、UML图、类图、系统功能图了。

image.png

这里我也是期望通义万相在未来是真的可以实现到这一步,当然,这也取决于阿里云对于该平台的一个定位,如果只是定位为文生图绘画平台那么目前来看其实已经算不错了,但是如果真的想能够"千变万相",那么,未来的方向应当是超越传统文生艺术图的范畴,深入到更多专业领域和业务场景中,成为真正的多领域视觉内容生成平台,毕竟,需要文生图的不仅仅只有艺术领域。(当然,这一块也可以交给其他领域智能体)

第四点,同比其他类似产品方案,该方案该在成本、易用性、应用场景上是否有竞争力? 您是否愿意推荐团队使用?

目前一般集成文生图的方案有两种,一种是用GPU服务器本地部署SD后提供服务,一种是调用API来实现文生图。

使用GPU服务器本地部署SD(如Stable Diffusion)方案最大缺点就是价格昂贵,并且运维管理起来都很麻烦。

而调用API实现文生图服务(如通义万相)方案价格有很大优势,而且使用灵活性高,能够快速迭代和接入,特别适合中小企业和初创团队。它不仅免去了硬件购置和维护的高额成本,还显著降低了技术门槛,使得即使是没有深厚AI技术积累的团队也能轻松利用先进的文生图技术。调用API的方案还有一大优势在于其即时性和可扩展性。用户可以根据需求即时调用服务,无需等待漫长的模型训练或部署过程,这对于快速变化的市场环境尤为重要。同时,随着业务增长,API服务通常能平滑地扩容以应对更高的请求量,确保服务质量不受影响。

此外,API服务商通常会持续优化和更新他们的模型,这意味着用户可以无需任何额外操作就能享受到技术进步带来的质量提升。例如,随着算法的演进,生成的图像会更加逼真、创意性更强,或者能够满足更多特定场景的需求。

整体来看的话,其实竞争力还是很强的,如果有这个需求,我会认真考虑让团队使用的

结语

尽管在初始讨论中指出了方案必要性不明确的问题,但通过深入分析,发现自建ECS结合通义万相平台确实能为企业带来独特的价值,特别是在定制化集成、商业模式创新及特定业务场景的适应性方面。此外,与传统部署方案相比,特别是考虑到成本效益、易用性和灵活性,调用API的方案展现出了显著的优势,非常适合追求高效与创新的中小企业及初创团队。

而对于未来发展的期待,通义万相(或阿里其他文生图领域智能体)若能进一步拓展其能力边界,超越传统的文生艺术图范畴,涉足更广泛的商业与专业领域,将极大提升其行业影响力和实用性,满足更多元化的市场需求。这包括但不限于技术文档图示自动生成、产品设计稿快速原型制作等,真正成为赋能各行各业的全能视觉内容生成解决方案,让技术真正成为驱动行业进化和企业增长的核心引擎。

相关实践学习
通义万相文本绘图与人像美化
本解决方案展示了如何利用自研的通义万相AIGC技术在Web服务中实现先进的图像生成。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
相关文章
|
Serverless
📢大模型服务平台百炼“流程”功能下线通知
本文主要内容介绍了大模型服务平台百炼的“流程”功能将于2025年11月15日下线。自通知发布起,“流程”入口将逐步隐藏,建议用户尽快迁移至全新升级的工作流应用,支持MCP、函数计算及大模型节点编排,操作更便捷。2025年6月15日起,现存“流程”不可修改;11月15日起完全停用,智能体中需解除“流程”引用并替换为工作流。请参考相关文档完成迁移。
564 0
|
7月前
|
自然语言处理 前端开发 Java
JBoltAI 框架完整实操案例 在 Java 生态中快速构建大模型应用全流程实战指南
本案例基于JBoltAI框架,展示如何快速构建Java生态中的大模型应用——智能客服系统。系统面向电商平台,具备自动回答常见问题、意图识别、多轮对话理解及复杂问题转接人工等功能。采用Spring Boot+JBoltAI架构,集成向量数据库与大模型(如文心一言或通义千问)。内容涵盖需求分析、环境搭建、代码实现(知识库管理、核心服务、REST API)、前端界面开发及部署测试全流程,助你高效掌握大模型应用开发。
753 5
|
7月前
|
传感器 人工智能 监控
通义灵码智能体模式在企业级开发中的应用:以云效DevOps自动化流程为例
通义灵码智能体模式具备语义理解、任务闭环与环境感知能力,结合云效DevOps实现CI/CD异常修复、测试覆盖与配置合规检查,大幅提升研发效率与质量。
357 0
|
7月前
|
人工智能 搜索推荐 测试技术
通义灵码 Agent+MCP:打造自动化菜品推荐平台,从需求到部署实现全流程创新
通过通义灵码编程智能体模式和 MCP 的集成,开发者可以高效构建在线菜品推荐网站。智能体模式大幅提升了开发效率,MCP 服务则为功能扩展提供了无限可能。
|
6月前
|
人工智能 BI 语音技术
AR眼镜+AI大模型:颠覆工业设备验收流程的智能革命
本方案结合AR眼镜与AI视觉大模型,打造高效、精准、可追溯的设备验收流程。通过第一视角记录、智能识别、结构化数据生成与智能报表功能,提升验收效率与质量,助力企业实现智能化管理。
|
6月前
|
人工智能 缓存 数据可视化
手把手玩转本地大模型:Ollama+DeepSeek+Dify 零门槛全流程指南
本文提供从零搭建本地AI工作站的完整指南,详解本地化部署大模型的核心优势(数据隐私/离线可用/成本可控),涵盖Ollama安装、DeepSeek-Coder模型部署、Dify可视化操作及API调用实战,助你打造安全高效的私有AI开发环境。
|
8月前
|
人工智能 测试技术 API
通义灵码 + 魔搭MCP:全流程构建创空间应用
最近,通义灵码上线 MCP(ModelScope Cloud Platform)功能,从之前代码生成及修改的基础功能,到可以使用MCP服务连接更多功能,开发者可以实现从 代码爬取、模型推理到应用部署
2167 27
|
7月前
|
人工智能 Java API
Java 生态大模型应用开发全流程实战案例与技术路径终极对决
在Java生态中开发大模型应用,Spring AI、LangChain4j和JBoltAI是三大主流框架。本文从架构设计、核心功能、开发体验、性能扩展性、生态社区等维度对比三者特点,并结合实例分析选型建议。Spring AI适合已有Spring技术栈团队,LangChain4j灵活性强适用于学术研究,JBoltAI提供开箱即用的企业级解决方案,助力传统系统快速AI化改造。开发者可根据业务场景和技术背景选择最适合的框架。
1549 2
|
8月前
|
JavaScript 搜索推荐 前端开发
通义灵码2.5智能体模式联合MCP:打造自动化菜品推荐平台,实现从需求到部署的全流程创新
本项目利用通义灵码2.5的智能体模式与MCP服务,构建在线点餐推荐网站。基于Qwen3模型,实现从需求到代码生成的全流程自动化,集成“今天吃什么”和EdgeOne MCP服务,提供个性化推荐、偏好管理等功能。技术架构采用React/Vue.js前端与Node.js后端,结合MCP工具链简化开发。项目涵盖功能测试、部署及未来扩展方向,如餐厅推荐、语音交互等,展示高效开发与灵活扩展能力。

热门文章

最新文章