告别手动画图:用自然语言生成可直接发布的 SVG+PNG 技术图

简介: `fireworks-tech-graph`它把技术图这件事,从一次性手工劳动,变成了一种可以沉淀、复用、批量生成的 Skill 能力。在 AI/Agent 相关内容越来越多的背景下,这是一个很值得试一下的项目。

如果你经常写技术博客、做架构设计文档,或者需要快速出图,一定体会过这种纠结:脑子里有清晰的系统结构,但落到画图工具里就是另一回事了——要么在 draw.io 里拖拽半天,要么跟 Mermaid 的 DSL 语法较劲。

最近在 GitHub 上看到一个叫 fireworks-tech-graph 的项目,它是一个Skill,核心能力很简单:你用中文描述系统,它几秒钟生成可直接发布的 SVG + PNG 技术图

fireworks-tech-graph 概述

fireworks-tech-graph 将自然语言描述转化为精美的 SVG 技术图,并通过 cairosvg(推荐)导出高分辨率 PNG,同时支持 rsvg-convertpuppeteer 作为备选方案。内置 7 种模板风格 + 1 种 AI 手绘风格(Dark Luxury),深度覆盖 AI/Agent 领域常见图类型(RAG、Agentic Search、Mem0、Multi-Agent、Tool Call 流程等),并完整支持全部 14 种 UML 图类型。

github 地址:https://github.com/yizhiyanhua-ai/fireworks-tech-graph

该项目目前再github 上已有7.8k star

解决了什么问题?

很多人写技术文档时都会遇到一个很现实的问题:图很重要,但画图本身特别耗时间。

常见痛点包括:

  • 脑子里有结构,但落到图里很慢
  • Mermaid 适合快速表达,但视觉效果和复杂结构承载能力有限
  • draw.io 虽然强,但手工拖拽成本高,不适合频繁改稿
  • 当图要服务于 AI、Agent、RAG、Memory 这类新领域时,通用绘图工具缺少现成语义

fireworks-tech-graph 的价值在于:把“描述系统”直接转成“生成图”,而且不只是出 SVG,还能直接导出适合博客和文档嵌入的 PNG。

怎么用?

安装这个 Skill 只需要一行命令:

npx skills add yizhiyanhua-ai/fireworks-tech-graph

或者下载项目之后直接导入到你的AI 工具中

安装依赖

要导出 PNG,需要安装一个底层依赖。

  • npm 安装
# 最高保真:puppeteer(真实 Chromium,体积较大)
npm install puppeteer
  • pip 安装
# 推荐:cairosvg(CSS 支持最好)
pip install cairosvg

装完之后,直接在对话里用自然语言描述就行:

帮我话一张 github 开源项目https://github.com/yizhiyanhua-ai/fireworks-tech-graph     fireworks-tech-graph 工作流程图,使用中文,导出png

Skill 会自动识别图类型、选定风格、生成 SVG,然后导出 1920px 的高清 PNG。

不只是“自动画图”

这个项目有几个设计上的亮点,让它区别于普通的绘图工具。

8 种视觉风格

它内置了 8 套精心设计的样式,不是统一画风,而是能根据使用场景切换。

风格 特点 适用场景
扁平图标风 白底,彩色强调色 博客、技术文档
暗黑极客风 深色背景,霓虹配色 GitHub README、开发者文章
工程蓝图风 深蓝底,网格线,青色描边 架构设计文档
Notion 极简风 白底,单色箭头 Notion、Confluence Wiki
玻璃态卡片风 深色渐变,磨砂玻璃 产品官网、演讲 Keynote
Claude 官方风格 温暖奶油色背景 Anthropic 风格图表
OpenAI 官方风格 纯白背景,品牌配色 OpenAI 风格图表
暗黑奢华风 深黑背景,香槟金点缀 展示型架构图

14 种图类型 + 完整 UML 支持

这个 Skill 不是简单模板替换,它会先对用户描述做图类型归类,然后应用对应的布局规则。

支持的图类型包括:架构图、数据流图、流程图、Agent 架构图、Memory 架构图、时序图、对比矩阵、时间线、思维导图。



类型 描述 关键布局规则
架构图 服务、组件、云基础设施 水平分层,自上而下
数据流图 数据在系统中的流向 每条箭头标注数据类型
流程图 决策树、流程步骤 菱形 = 决策,自上而下
Agent 架构图 LLM + 工具 + 记忆 五层模型:输入/Agent/记忆/工具/输出
记忆架构图 Mem0、MemGPT 风格 读/写路径分离,记忆层级分明
序列图 API 调用链、时序交互 垂直生命线,水平消息箭头
对比图 功能矩阵、方案比较 列 = 系统,行 = 属性
思维导图 概念地图、发散思维 中心节点,贝塞尔曲线分支





完整的 14 种 UML 图(类图、组件图、部署图、包图、用例图、活动图、状态机图、序列图等)



UML 类型 描述 推荐风格
类图 类、属性、方法、关系 风格 1, 4
组件图 软件组件和依赖关系 风格 1, 3
部署图 硬件节点和软件部署 风格 3
包图 包组织和依赖关系 风格 1, 4
复合结构图 类/组件的内部结构 风格 1, 3
对象图 对象实例和关系 风格 1, 4
用例图 参与者、用例、系统边界 风格 1
活动图 工作流、并行流程 风格 3
状态机图 状态转换和事件 风格 2, 3
序列图 时间顺序的消息交换 风格 2
通信图 对象交互和消息 风格 1, 2
时序图 状态随时间的变化 风格 2
交互概览图 高层交互流程 风格 1, 2
ER 图 实体关系数据模型 风格 1, 3

AI/Agent 领域内建知识

对于 AI/Agent 相关场景,它内置了领域模式识别能力。RAG Pipeline、Agentic Search、Mem0 记忆架构、Multi-Agent 协作、Tool Call 流程这些常见 Pattern,不需要从零描述,直接说场景就能生成对应的领域图。

它还定义了一套语义形状词汇表:LLM 用双边框圆角矩形,Agent 用六边形,Vector Store 用带内环圆柱体;箭头颜色和虚线样式编码了写入、读取、异步、循环等语义。

输出与验证工具链

它提供了四个辅助脚本,让整个生成流程更稳定:

  • generate-diagram.sh:验证 SVG 并导出 PNG
  • generate-from-template.py:从模板快速创建起始 SVG
  • validate-svg.sh:单独校验 SVG 语法
  • test-all-styles.sh:批量测试所有风格

谁适合用?

  • 经常写技术博客、产品文档、方案文档的人
  • 经常需要画架构图、流程图、Agent 图,但不想每次都手动画的人
  • 做 AI / Agent / RAG / Memory 相关内容输出的人
  • 希望把“描述需求 → 生成图 → 嵌入文章”这条链路尽量标准化的人

写在最后

fireworks-tech-graph它把技术图这件事,从一次性手工劳动,变成了一种可以沉淀、复用、批量生成的 Skill 能力。在 AI/Agent 相关内容越来越多的背景下,这是一个很值得试一下的项目。

目录
相关文章
|
6天前
|
缓存 测试技术 API
Qwen 3.7 Plus 与 Max 实测:性价比与多模态能力差异解析(2026)
2026 年 6 月 1 日,阿里悄无声息地发布了 Qwen 3.7 Plus,距 Qwen 3.7 Max 上线刚好 11 天。同样的 1M 上下文,同样的 35 小时自治上限。但价格才是头条:Plus 是 0.40/M输入,Max是 2.50/M——便宜约 6 倍——并且还能看图、看视频。Vision Arena 上 Plus 已经排到 #16。所以这周真正值得讨论的问题不是”要不要为视觉能力买单”,而是”Max 凭什么用 6 倍价格换来 2 个百分点的 benchmark 领先”。
|
7天前
|
JavaScript 定位技术 API
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
CodeGraph 是一款爆火的本地代码智能工具,通过 tree-sitter 解析 AST 构建结构化知识图谱(存于 SQLite),为编程 Agent 提前生成“代码地图”。它显著降低 Agent 在中大型项目中的探索成本——实测工具调用减少71%、Token 降57%、速度提升46%,支持19+语言及主流框架路由识别,完全离线、无需 API Key。
713 6
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
|
7天前
|
人工智能 自然语言处理 文字识别
阿里云百炼Qwen3.7-Max简介:能力、优势、支持订阅计划参考
Qwen3.7-Max是阿里云百炼面向智能体时代推出的新一代旗舰模型,对标GPT-5.5、Claude Opus 4.7等闭源旗舰。该模型支持百万级token上下文窗口,具备顶级推理能力、多模态搜索与视觉理解增强、流式输出低延迟响应等核心优势,覆盖编程、办公、长周期自主执行等复杂场景。同时支持OpenAI接口兼容,便于系统快速迁移。用户可通过Token Plan团队或节省计划等订阅方式灵活调用,适合企业级高要求场景使用。
8748 37
阿里云百炼Qwen3.7-Max简介:能力、优势、支持订阅计划参考
|
7天前
|
人工智能 运维 JavaScript
阿里云Qoder CN(原通义灵码)全解析 产品形态、版本划分与技术适配说明
在AI辅助开发与智能办公工具持续普及的当下,阿里云旗下原通义灵码正式更名为Qoder CN,同时延伸出QoderWork CN、Qoder CN CLI、Qoder CN Mobile等多款配套产品,形成覆盖代码开发、日常办公、终端交互、移动端使用的完整工具矩阵。Qoder CN核心定位为AI智能编码助手,深度适配主流代码编辑器、集成开发环境以及终端场景;QoderWork CN则偏向桌面端综合办公辅助,二者面向不同使用场景,划分了多个版本档位,搭配差异化资源配额、功能权限与计费规则,同时兼容多款主流大模型。
704 6
|
7天前
|
存储 安全 Java
AgentScope Java 2.0:打造分布式、企业级智能体底座
AgentScope 2.0 面向分布式部署、稳定运行、权限安全等企业级需求全面升级,打造支持多租户隔离与长期稳定运行的企业级智能体底座。
|
7天前
|
数据采集 人工智能 前端开发
让 Coding Agent 从黑盒到透明:阿里云 Agent 观测审计数据采集实践
AI Agent 规模化落地带来执行黑盒、行为难追溯、成本难度量三大难题。阿里云基于 OTel 标准,面向 Coding Agent、个人通用助理和框架型 Agent,推出 LoongSuite Pilot、插件及探针等无侵入采集方案,让 Agent 实现可看见、可分析、可审计、可治理。
748 148
|
7天前
|
人工智能 运维 自然语言处理
阿里云百炼Qwen3.7-Max模型详解:综合能力、核心优势与订阅计划参考指南
2026年,大模型技术持续向通用化、高性能、场景化方向迭代,阿里云百炼作为一站式大模型服务平台,持续推出迭代升级的模型产品,Qwen3.7-Max便是当前主力旗舰级大模型之一。该模型依托深度优化的底层架构与大规模训练数据,在文本理解、逻辑推理、多模态交互、代码生成、长文本处理等多个维度实现能力升级,同时搭配灵活的订阅计划体系,能够适配个人开发者、中小企业、大型企业、政企机构等不同类型用户的使用需求。
591 2
|
7天前
|
JSON 缓存 安全
通过 CC Switch 本地路由让 Codex CLI 接入 DeepSeek 等第三方模型
CC Switch 通过本地路由(`127.0.0.1:15721`)实现协议转换:将 Codex 的 Responses API 请求自动映射为 DeepSeek 等厂商的 Chat Completions 接口,兼容流式响应与工具调用,无需修改 Codex 源码,安全隔离 API Key。(239字)
1811 3
通过 CC Switch 本地路由让 Codex CLI 接入 DeepSeek 等第三方模型
|
7天前
|
人工智能 缓存 自然语言处理
阿里Qwen3.7-Max评测:Agent能力显著提升,耗时与调用成本大幅下降
阿里云百炼推出面向智能体的旗舰大模型Qwen3.7-Max,具备长周期自主执行能力,显著提升编程、办公自动化等复杂任务处理水平;支持MCP集成与多框架兼容,并以限时5折+100万Tokens免费试用大幅降低使用门槛,助力企业高效落地AI应用。在阿里云百炼平台快速体验:https://t.aliyun.com/U/fPVHqY
1977 10
|
7天前
|
人工智能 运维 API
2026年阿里云百炼通义千问Qwen3.7-plus深度介绍 功能特性、使用优势及618大促订阅方案指南
大模型技术的普及,让AI能力逐步融入个人办公、内容创作、代码编写、企业运营、教育培训等各类场景。不同定位的模型对应不同使用需求,旗舰级模型性能强劲但使用成本偏高,轻量化模型价格低廉却难以胜任复杂任务,而介于两者之间的中端主力模型,凭借均衡的能力、亲民的定价、广泛的场景适配性,成为绝大多数个人用户、小型团队、中小企业的首选。
811 1

热门文章

最新文章