文档备案控制台

开发者社区 ModelScope模型即服务文章正文

WordArt Designer：基于用户驱动与大语言模型的艺术字生成

2023-10-26 49569

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 本文介绍了一个基于用户驱动，依赖于大型语言模型(LLMs)的艺术字生成框架WordArt Designer。

导读

本文介绍了一个基于用户驱动，依赖于大型语言模型(LLMs)的艺术字生成框架WordArt Designer。

该系统包含四个关键模块:LLM引擎、SemTypo、Styltypo和TextTypo模块。由gpt-3.5 turbo驱动的LLM引擎可以解释用户输入，从而将抽象概念转化为具体的设计。

SemTypo模块使用语义概念优化字体设计，在艺术转换和可读性之间取得平衡。在SemTypo的基础上，StyTypo模块辅助生成精细的图像。TextTypo模块通过纹理渲染进一步生成创造性纹理字体。目前应用demo已上线至ModelScope创空间，其中对应文字变形、纹理渲染相关等模型也即将在11月开源至ModelScope，敬请期待。

创空间应用体验

链接：https://modelscope.cn/studios/WordArt/WordArt/summary

阿里云开发者社区结果分享

链接：https://developer.aliyun.com/topic/vision/wordart?accounttraceid=1d19d366cfd64c07a8902ff7a5841b85smzy

艺术字设计是语言和设计的一个关键交叉点，在广告、幼儿教育和历史旅游等各个领域都有广泛的应用。遗憾的是，对于非专业的设计师来说，掌握艺术字设计仍然是一个非常挑战的任务。尽管之前已经有研究工作尝试弥合业余设计师和专业艺术字设计之间的差距，但现有的解决方案主要是在预定义的概念中生成语义连贯和视觉上令人愉悦的艺术字。这些解决方案通常缺乏适应性、创造性和计算效率。

技术架构图

WordArt Designer 系统主要涵盖4个关键模块，由大型语言模型(LLM)推动，如通义千问等，促进交互式、以用户为中心的设计过程。如图3所示，用户定义他们的设计需求，包括设计概念和领域，例如，“珠宝设计中的猫”。

LLM引擎：负责解析用户的设计需求，生成提示词以指导SemTypo、StylTypo和TextTypo模块，从而执行用户的设计愿景；

SemTypo模块： 负责根据LLM的提示创意词进行文字的变形，其中涉及文字参数化、区域笔画选择、可微渲染等；

StylTypo模块： 基于语义变形后的图像生成更平滑更丰富细节的图片；

TextTypo模块： 基于LLM的提示创意词进行文字纹理渲染，进一步生成带纹理的创意艺术字；

为了实现WordArt的自动化设计以及提高最终图片的质量，我们引入了一个质量评估反馈机制，确保进入纹理渲染模块的变形图片的创意性、艺术表达能力以及可扩展性。

最佳实践

目前，WordART Designer对应的应用已经上线至ModelScope创空间：创新艺术字（https://modelscope.cn/studios/WordArt/WordArt/summary），主要包括以下的三个功能（对应创空间的三个tab页面）：

文字变形；
文字纹理；
创意文字生成。

下面对这三个部分逐一进行介绍。

文字变形

文字变形的功能是基于用户输入的创意效果，对用户输入的文字进行变形，并最终得到变形后的文字图片。具体的操作步骤如下图所示：

生成完成后，可以看到如下所示的界面，用户可以针对生成的结果进行如下的操作：

对生成的结果进行切换浏览；
点击“为变形字增加纹理”，将对应的图片发送至【文字纹理】版块（在下一小节介绍）进行纹理添加；
点击“变形字生成矢量图”，下载对应的矢量图片。

文字纹理

文字纹理的功能是基于用户输入的纹理效果，对用户输入的文字添加纹理，并最终得到上了纹理的文字图片。需要注意的事，用户可以通过以下两种方式来产生输入文字图片：

使用【文字变形】版块生成的变形文字图片作为输入，如上一小节所介绍，通过点击“为变形字增加纹理”将对应的图片发送至本版块；
直接输入文字内容，并支持选择不同的字体。

使用【文字变形】版块生成的变形文字图片作为输入，具体的操作步骤如下：

生成完成后，可以看到如下所示的界面，用户可以切换查看生成结果。

如果是直接输入文字，具体的操作步骤如下：

生成完成后，可以看到如下所示的界面，用户可以切换查看生成结果。

创意文字生成

有的用户会觉得上述【文字变形】和【文字纹理】版块的效果描述过于繁琐，无法想到很好的描述词，那不妨试试【创意文字生成】版块。创意文字生成基于用户输入的创意字，利用大语言模型自动为用户推荐文字变形创意和文字纹理创意，用户仅需输入创意字内容，就可以得到最终变形和纹理的效果图。

具体的操作步骤如下：

生成完成后，可以看到如下所示的界面，用户可以切换查看生成结果。

探索创作作品

点击直达链接~

https://modelscope.cn/studios/WordArt/WordArt/summary

文章标签：

开发者

ModelScope运营小助手

目录

相关文章

游客2gmbr4slt6axw

|

2月前

|

开发框架安全 C#

【.NET】.NET 4.8下载 | .NET Framework 4.8安装使用指南（附安装包+图文步骤）

本文详解.NET Framework 4.8——微软最后也是最稳定的传统框架版本。它兼容性好、安全性高，是运行大量Windows软件（如办公工具、游戏、企业应用）的必备环境。含下载地址、安装步骤及常见错误（如0x800F081F）解决方案，适合普通用户与开发者参考。（239字）

游客2gmbr4slt6axw

3735 0 0

Q一个好的名字容易让人记住你2483558220

|

8月前

|

小程序 JavaScript 前端开发

基于微信小程序的校园外卖订餐配送系统

本研究针对校园外卖配送效率低、体验差等问题，设计并实现基于微信小程序的智能配送平台。融合SSM、Vue、uni-app等技术，优化点餐、支付与配送流程，提升师生用餐体验与餐饮管理效率。

Q一个好的名字容易让人记住你2483558220

638 5 5

村头的猫

|

12月前

|

数据采集 XML 搜索推荐

一文搞懂SEO优化之站点robots.txt

建站后千万别忘记配置 `robots.txt` 爬虫规则，对于搜索引擎发现你的站点非常重要，除了主动到搜索引擎平台提交网站之外，也要主动告诉搜索引擎网站里都有哪些网页？哪些希望被抓取？哪些不希望被抓取？

村头的猫

802 3 3

游客fy2ykbaw74qgw

|

11月前

|

安全生物认证数据安全/隐私保护

微信加人频繁怎么快速解除？？？

微信加人频繁限制的技术分析与解决方案 1. 微信加人限制机制解析

游客fy2ykbaw74qgw

673 0 0

Deephub

|

11月前

|

传感器算法数据挖掘

Python时间序列平滑技术完全指南：6种主流方法原理与实战应用

时间序列数据分析中，噪声干扰普遍存在，影响趋势提取。本文系统解析六种常用平滑技术——移动平均、EMA、Savitzky-Golay滤波器、LOESS回归、高斯滤波与卡尔曼滤波，从原理、参数配置、适用场景及优缺点多角度对比，并引入RPR指标量化平滑效果，助力方法选择与优化。

Deephub

2425 0 1

想飞的雪糕

|

机器学习/深度学习自然语言处理前端开发

前端大模型入门：Transformer.js 和 Xenova-引领浏览器端的机器学习变革

除了调用API接口使用Transformer技术，你是否想过在浏览器中运行大模型？Xenova团队推出的Transformer.js，基于JavaScript，让开发者能在浏览器中本地加载和执行预训练模型，无需依赖服务器。该库利用WebAssembly和WebGPU技术，大幅提升性能，尤其适合隐私保护、离线应用和低延迟交互场景。无论是NLP任务还是实时文本生成，Transformer.js都提供了强大支持，成为构建浏览器AI应用的核心工具。

想飞的雪糕

3504 1 2

程序员欣宸

|

分布式计算 Hadoop Linux

Linux配置SSH免密码登录(非root账号)

设置多台linux服务器之间以非root账号的身份免密码ssh登录

程序员欣宸

1520 0 0

Linux配置SSH免密码登录(非root账号)

五羟基己醛

|

芯片

【TI速成】半小时入门MSPM0G3507简明教程之按键定时器（二）

半小时入门MSPM0G3507简明教程之按键定时器

五羟基己醛

1605 0 0

luneice

|

安全网络协议 Shell

Ubuntu端口转发

Ubuntu端口转发的相关配置

luneice

6592 0 0

凯小默

|

开发者

webpack进阶篇（二十八）：优化构建时命令行的显示日志

webpack进阶篇（二十八）：优化构建时命令行的显示日志

凯小默

1191 0 0

webpack进阶篇（二十八）：优化构建时命令行的显示日志

ModelScope模型即服务

热门文章

最新文章

高效部署通义万相Wan2.1：ComfyUI文生/图生视频实战，工作流直取！

AgentScope：阿里开源多智能体低代码开发平台，支持一键导出源码、多种模型API和本地模型部署

嵌入式开发必备！Keil uVision5 C51 V9.61 安装激活 + 汉化完整教程, 含（Keil MDK 5.39）

DeepSeek-V4开源：百万上下文，Agent能力比肩顶级闭源模型

美团开源发布 LongCat-Flash-Chat：专为高效智能体任务设计，推理速度超100 tokens/s

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

在 AMD ROCm DSW 上跑通 DeepSeek-V4-Flash：vLLM 兼容部署、长上下文验证与 8K 性能扫参

LTX-2.3开源：视频生成引擎级升级

AgentScope 2.0 发布：从"跑通 Demo"到"稳定落地"，构建可靠智能体的工程底座

阿里云通义千问向全社会开放！

可计算元认知文本分析：跨领域语义漂移的多层解释框架与实证研究

🔥【零基础逆袭】我用Python写了个量化策略，3天赚了别人3年的钱！（附完整代码+教程）

ChatGPT 怎么导出 Word？保留公式、表格和代码块的实用流程

语义压缩，才是提示词工程的底层心法

别再让 AI 自动总结 Skill 了！

AI Agent 接入股票数据时，为什么要先设计数据工具层

别再让 AI 自动总结 Skill 了！

自变量开源Wall-OSS-0.5：预训练即可部署的具身智能大模型，17个零样本任务验证泛化能力

阶跃开源 Step 3.7 Flash：面向生产级 Agent 的高效率 Flash 模型

96.33% 新SOTA！PaddleOCR-VL-1.6 发布，大模型时代的数据基座再升级

相关电子书

更多

低代码开发师（初级）实战教程

冬季实战营第三期：MySQL数据库进阶实战

阿里巴巴DevOps 最佳实践手册

下一篇

阿里云正式发布 Agentic 代码安全：AI驱动的双Agent协同引擎