引言
随着人工智能技术的飞速跃进,我们正见证着一个前所未有的创意革命。在过去几年间,AI不仅在科技领域内开疆拓土,更以其独到的创造力深刻影响了艺术的版图。AI绘画技术,这一昔日遥不可及的梦想,如今已成为触手可及的现实,正逐步渗透并革新着绘画创作的每一个角落。
2023年云栖大会后,阿里云正式推出通义万相AI创作艺术平台。这一平台凭借其先进的算法和对艺术深度理解的能力,能够精准解读用户的创意指令,转换为令人惊叹的视觉作品。无论是细腻逼真的风景描绘,还是超现实主义的梦幻构想,通义万相都能信手拈来,为艺术家们开辟了全新的表达空间,同时也为普通大众提供了探索艺术创作的无限可能。
而近期,为了满足用户在Web服务中部署及应用AI绘画技术的需求,阿里云进一步优化了通义万相的接入方式,通过提供详细的API文档以及一键部署的云服务解决方案,使其更加灵活便捷地与各类Web服务集成,能够保证即使是非技术背景的创意工作者也能轻松地将通义万相的强大功能嵌入自己的网站或应用中,从而实现个性化图像内容的快速生成与迭代。
同时,阿里云官方也推出了解决方案评测活动,链接如下:通义万相AI绘画创作,欢迎大家一起来文档捉虫,并有机会赢取富士mini12拍立得、小米蓝牙耳机、挂脖风扇、评测证书等多重好礼哦!
方案介绍
技术架构及相关基础设施和云服务
【专有名词解释如下】:
用户端(Client):用户可以通过网页界面或其他应用程序提交请求,包括上传图片或者输入文本描述。
云服务器ECS(Elastic Compute Service):ECS是阿里云提供的计算服务,可以用来运行企业门户网站的应用程序和服务。在这个方案中,作为后端服务器,ECS接收并处理来自用户端的请求,它负责解析用户提交的参数、调度AI绘画任务,并与云上的其他服务交互,如存储服务和AI处理服务。
对象存储OSS(Object Storage Service):OSS是一种高可用、高吞吐量的云存储服务,用于存储用户上传的原始图片素材和AI绘画生成的输出图像。它提供RESTful API接口,使得ECS能够方便地上传和下载数据,同时也支持直接的公网访问链接,便于用户获取最终的绘画作品。
专有网络VPC(Virtual Private Cloud):VPC为云上资源构建一个逻辑隔离的网络环境。它允许用户定义自己的IP地址范围、子网、安全策略和路由表,确保AI绘画系统的网络通信安全,同时提供灵活的网络部署能力。
DashScope灵积模型服务:这是阿里云提供的一系列高级AI模型服务,专门用于处理大规模机器学习和深度学习任务。在AI绘画场景下,DashScope通过其内置的视觉生成模型,如通义万相,来实现从文本描述或基础图像到高质量艺术作品的转换。
通义万相:作为核心AI技术,通义万相是一种基于深度学习的文本到图像生成模型。用户提供的文本描述被转化为精细的视觉图像,过程中模型综合运用了自然语言理解和图像合成技术,能够创造出多样且富有创意的图像内容,满足用户的个性化需求。
当用户通过界面提交绘画需求,不论是文字描述还是参考图片,信息随即被传送至云端服务器。服务器分析处理这些数据后,智能调度计算资源,激活AI绘画模型进行创意生成。接着,模型依据指令细腻地绘制出图像,这个过程中可能融入变换的风格与丰富的想象元素。完成后,新诞生的艺术作品被安全存储于云端,并经过必要的格式调整与质量把控,最终通过网络将这独一无二的视觉成果交付回用户的终端界面,实现了从概念到可视艺术的即时转化。
方案部署
1.部署准备:
准备阿里云账号:你需要有一个有效的阿里云账号才能开始部署。
开通DashScope服务:登录你的阿里云账号,开通DashScope服务。
获取API-KEY:在开通服务后,需要获取一个API-KEY来访问和使用DashScope服务。这个键通常用于验证和授权对服务的访问。
获取AccessKey并授权:也需要获取一个AccessKey,并对其进行授权以便能够访问和操作相关的阿里云资源。
2.部署资源:
创建专有网络VPC和交换机:在阿里云控制台,你可以创建一个专有的网络VPC,并配置相应的交换机。VPC允许你在阿里云上构建自己的私有网络环境。
创建安全组:为了保护你的云资源,你需要创建并配置安全组规则。安全组是一种虚拟防火墙,用于控制进出实例的流量。
创建云服务器ECS:根据你的需求,你可以创建一台或多台云服务器ECS实例。这些实例可以运行各种操作系统和应用。
创建对象存储OSS Bucket:最后,你需要创建一个对象存储OSS Bucket来存放你的文件和数据。OSS提供高可用、低成本的云存储服务。
3.安装示例应用程序:
安装示例应用程序:在这个步骤中,你需要安装本解决方案提供的示例应用程序,并启动服务。
在浏览器中访问部署的服务,体验通义万相的相关功能:一旦部署完成,你可以通过浏览器访问部署的服务,测试和体验其功能。
4.完成及清理:
- 如完成体验且无需使用相关资源,请释放所有资源:如果你已经完成了体验并且不再需要这些资源,建议你释放所有的资源以避免不必要的费用。这包括删除ECS实例、OSS Bucket以及终止其他相关的云服务。
方案权益
结合以上涉及到的云产品,阿里云在这个方案中也给出了优惠购买方案和试用方案,当然啦,试用优先嘛~
除去方案中提到的产品优惠外,还额外有新人限时折扣。
新人首购服务器仅需36元/年!
SSL证书200元/1年,比官网直接购买便宜约140元!
看到这里我是真的忍不住要骂一句脏话,我去年买的时候还是99r一年,今年直接就36r了。。。靠。。。。阿里云你这么卷,让其他友商怎么活啊。
基于通义万相加速绘画创作流程
点击进入创意加速器:AI 绘画创作方案。
该方案展示了如何利用自研的通义万相AIGC技术在Web服务中实现先进的图像生成。其中包括文本到图像、涂鸦转换、人像风格重塑以及人物写真创建等功能。这些能力可以加快艺术家和设计师的创作流程,提高创意效率。同时,也可以在广告营销、教育和游戏开发等多个领域进行应用,以提升内容的视觉表现和用户体验。通过通义万相,用户可以轻松将文字描述或简单草图转化为高质量图像,实现个性化视觉内容的定制,满足社交媒体、电子商务和电子娱乐产业的需求。这标志着艺术创作、个性化表达和数字内容开发的无限可能性。
点击此处的【一键部署】。
首页默认为【方案概览】,可以直接点击进入下一步。
此处默认为已有阿里云账号了,直接进入开通DashScope服务并获取API-KEY。
登录DashScope控制台。
单击去开通。
阅读并勾选服务协议,然后单击立即开通。
在左侧导航栏单击管理中心 > API-KEY管理,单击创建新的API-KEY。
在弹出的API-KEY详情页面,单击复制,将API-KEY妥善保存至本地后,单击我已保存,关闭。
到这里,部署的准备工作就完成了。
一键部署
单击一键部署前往ROS控制台,选择DashScope API-KEY、ECS实例规格和可用区,以及输入实例密码。
分别填写如下内容:
资源栈名称:默认
登录用户名:设置成自己常用的,登录web端应用时的用户名
登录密码:登录web端应用时输入的密码
DashScope API-KEY:上文获取到的API
存储空间名称:默认
可用区:不做特定要求
实例类型:建议为4c,8G
实例密码:服务器ECS登录密码
确定无误后,点击下一步。
点击创建。
开始创建后,等待约5分钟左右,显示创建成功。
点击资源栈的输出Tab,再点击体验地址行中的URL进行访问。
在浏览器中打开体验地址后,在登录页面上输入之前配置的用户名和密码,然后进行登录和体验。
在体验完成后,在资源栈页面的顶部选择部署的资源栈所在地域,找到资源栈,然后在其右侧操作列,单击删除。在删除资源栈对话框,选择删除方式为释放资源,然后单击确定,根据提示完成资源释放即可。
手动部署
对比一键部署,自是不必多言了,其优势显而易见。一键部署极大地简化了技术部署的复杂度,特别适合新手或是急于快速搭建环境的开发者,这里手动部署就不做过多赘述了。
优化建议
老规矩了,开始就事论事。
对于这个方案,部署过程是非常简洁流畅的,可以说是完全没有任何问题,但是唯一的问题却是该方案的必要性和目的性不明确!
拿我之前写的门户网站上云对比来说,是因为在传统网站部署方式往往伴随着高昂的时间成本与运维开销,难以满足企业对速度与灵活性的迫切需求。正是在这样的背景下,阿里云提出了全新的解决方案——使用云效将项目代码部署到云服务器ECS,快速完成一个企业门户网站的构建。这里听起来似乎很合理,对吧?
但是这次评测的内容,其实明明已经有通义万相平台了,为什么还需要基于ECS再重新搭一套呢?
而且对照下述的应用场景,通义万相平台也都可以实现,既然有在线的平台可以用,为何还要自己费力的去搭一个呢???
这就是我认为这篇方案中最大的问题,即没有从根源上突出该方案的必要性!如果没有突出必要性的话,就压根不会有人愿意为此买账了。
所以说,这里需要补充的内容就是采用自建ECS+通义万相构建文生图应用能带来的优势,并且这些优势是官方提供的在线通义万相平台不具备的。
比如说:可以接入自己的应用中作为特色功能之一,并且可以灵活调整服务定价、广告植入、数据变现等商业模式等等。
这是一点。
然后我还想谈一谈的是第三点,即针对业务场景,该方案还有哪些可以改进的图片生成能力或在您的业务场景中,还希望它可以提供哪些新的功能?
AI绘画自流行以来,大多数企业或者公司都感叹于它的艺术性,但是实际上,它的本质可以说是生产力加速器,如果只把它界定为艺术创作就有会有些太狭隘了。
可以参考一下其他画图工具,目前已经能实现AI自动生成流程图、系统架构图、UML图、类图、系统功能图了。
这里我也是期望通义万相在未来是真的可以实现到这一步,当然,这也取决于阿里云对于该平台的一个定位,如果只是定位为文生图绘画平台那么目前来看其实已经算不错了,但是如果真的想能够"千变万相",那么,未来的方向应当是超越传统文生艺术图的范畴,深入到更多专业领域和业务场景中,成为真正的多领域视觉内容生成平台,毕竟,需要文生图的不仅仅只有艺术领域。(当然,这一块也可以交给其他领域智能体)
第四点,同比其他类似产品方案,该方案该在成本、易用性、应用场景上是否有竞争力? 您是否愿意推荐团队使用?
目前一般集成文生图的方案有两种,一种是用GPU服务器本地部署SD后提供服务,一种是调用API来实现文生图。
使用GPU服务器本地部署SD(如Stable Diffusion)方案最大缺点就是价格昂贵,并且运维管理起来都很麻烦。
而调用API实现文生图服务(如通义万相)方案价格有很大优势,而且使用灵活性高,能够快速迭代和接入,特别适合中小企业和初创团队。它不仅免去了硬件购置和维护的高额成本,还显著降低了技术门槛,使得即使是没有深厚AI技术积累的团队也能轻松利用先进的文生图技术。调用API的方案还有一大优势在于其即时性和可扩展性。用户可以根据需求即时调用服务,无需等待漫长的模型训练或部署过程,这对于快速变化的市场环境尤为重要。同时,随着业务增长,API服务通常能平滑地扩容以应对更高的请求量,确保服务质量不受影响。
此外,API服务商通常会持续优化和更新他们的模型,这意味着用户可以无需任何额外操作就能享受到技术进步带来的质量提升。例如,随着算法的演进,生成的图像会更加逼真、创意性更强,或者能够满足更多特定场景的需求。
整体来看的话,其实竞争力还是很强的,如果有这个需求,我会认真考虑让团队使用的。
结语
尽管在初始讨论中指出了方案必要性不明确的问题,但通过深入分析,发现自建ECS结合通义万相平台确实能为企业带来独特的价值,特别是在定制化集成、商业模式创新及特定业务场景的适应性方面。此外,与传统部署方案相比,特别是考虑到成本效益、易用性和灵活性,调用API的方案展现出了显著的优势,非常适合追求高效与创新的中小企业及初创团队。
而对于未来发展的期待,通义万相(或阿里其他文生图领域智能体)若能进一步拓展其能力边界,超越传统的文生艺术图范畴,涉足更广泛的商业与专业领域,将极大提升其行业影响力和实用性,满足更多元化的市场需求。这包括但不限于技术文档图示自动生成、产品设计稿快速原型制作等,真正成为赋能各行各业的全能视觉内容生成解决方案,让技术真正成为驱动行业进化和企业增长的核心引擎。