背景
本人自由职业,运营AI开源项目https://github.com/CloudOrc/SolidUI。
本文是站在AI产品工程角度推演。
简述
数据可视化,AI生成可视化,看似几个字的差别,其实是不同时代的产品,背后脉络不一样的。
数据可视化发展
大数据发展史:1960年-1980年关系数据库发展,然后1980年数据仓库理论完善,提出商业智能概念,2000年-2010年提出Hadoop体系,所有海量数据都放到Hadoop体系中,2010年之后,因为计算引擎发展,人们解绑数仓体系,发展数据湖体系和OLAP体系,现在可分两种情况,一种靠数据湖这种大一统技术方式处理数据,一种靠OLAP这种MPP架构轻量计算数据。可视化发展情况,1980年-1990年,Office体系,里面实现二维图表,人机交互生成,2000年-2010年,一些商业智能可视化,结合数据仓库业务捆绑,生成二维图表,2010年至今,数据格式也非常复杂,结构和非结构,2D,3D体系也完善了。
在2010起,数据可视化标准彻底定下来了,数据可视化可解释:让数据以图形和图像展示。
AI生成可视化发展
这个跟数据可视化并没有直接关系的,AI生成可视化可解释让大模型行为以图形和图像展示。
AI 生成大模型的历史可以追溯到 2010 年代初期。早期的自然语言处理 (NLP) 模型较小且功能有限,但随着研究和技术的进步,这些模型逐渐变得更大、更复杂。以下是一些重要的里程碑事件和大型 AI 生成模型的发展:
- Word2Vec (2013) - Word2Vec 是一种有监督学习方法,它将单词表示为高维空间中的向量,使得具有相似含义的单词在嵌入空间中距离较近。这是第一次成功地为自然语言处理任务提供了有意义的向量表示。
- Seq2Seq 和 Attention 机制 (2014-2015) - 序列到序列 (Sequence-to-Sequence, Seq2Seq) 模型是一种端到端的深度学习架构,广泛应用于机器翻译、摘要等任务。在这之后,研究人员引入了 Attention 机制,提高了模型处理长序列时的性能。
- ELMo (2018) - ELMo (Embeddings from Language Models) 是一种预训练的语言模型,它使用双向 LSTM(Long Short-Term Memory)神经网络生成上下文相关的词嵌入。这是第一个成功将预训练语言模型用于生成任务的方法。
- Transformer (2017) - Transformer 是一种新型神经网络架构,摒弃了传统的循环神经网络 (RNN)。该架构引入了多头自注意力 (Multi-Head Self-Attention) 机制,能够并行计算且可扩展性强,从而使训练大型模型成为可能。
- BERT (2018) - BERT (Bidirectional Encoder Representations from Transformers) 是一种基于 Transformer 的预训练模型。通过使用 Masked Language Model (MLM) 和 Next Sentence Prediction (NSP) 任务进行预训练,BERT 能够对文本进行深入理解。它在各种自然语言处理任务上取得了显著的性能提升。
- GPT (2018-2021) - GPT (Generative Pre-trained Transformer) 系列模型是 OpenAI 开发的一系列大型预训练语言模型。从 GPT 到 GPT-3,这些模型一直在不断扩大规模和能力。特别是 GPT-3,拥有 1750 亿个参数,成为了迄今为止最大的语言模型之一。GPT-3 在各种生成任务上展现出了惊人的性能,例如文本生成、翻译、摘要、问答等。
在这个过程中,出现了许多其他的模型和架构,如 ULMFiT、RoBERTa、ALBERT、T5 等。这些模型纷纷打破了自然语言处理任务的性能记录。如今,随着计算能力和研究的进一步发展,大型 AI 生成模型的规模和能力仍在不断扩大。
AI生成因OpenAI GPT而爆发,开启新时代的可视化方向,标准并没有生成,都在探索。
SolidUI精准定义
SolidUI的精准定义,是AI生成可视化。让垂直领域的模型的行为,以图形和图像展示。
特点
- 极简流程,简洁设计
- 支持多种维度图例
- 支持多种数据源
- 支持不同的插件,例如:huggingface体系
- 支持插件机器人
- 支持SolidUI自研模型
- 支持三方大模型体系
- 容器化部署
发展
思维演化
现在很多特点有受旧时代思维限制,例如0.1.0版本就能看出,在做可视化应用框架。从0.2.0版本开始做聊天框架,不断推开应用体系的推演。
在现在的风口趋势不断去下游探索,从0.3.0版本后开始进入模型体系探索。
现在由于在风口阶段,很多旧时代的思维模式,无论是产品,技术,运营都受到冲击,尤其在AI领域,很多变化性特别大,只谈AI产品思维,不是说把不变的那些特性和差异的一些东西做精了,就可以去做出一流的产品,不是这样,很多旧时代生成模式其实都是过时的,在AI生成体系并没有形成标准时,要去多探索边界,不断触底。
不断触底
但是做过真正 AI 创业人都会发现,所谓的 AI 创业,哪怕咱不谈所有的销售或者这些商业化的东西,你 80% 的东西是产品工程, 20% 的是底层的技术。甚至好。如果你是这时候创业,而你恰好不是 open AI 或者 Anthropic 的话,你可能有 10% 的技术就不错了。而这个时候我们会发现,所有这些先来的人,他不仅是技术,行业规模,甚至利益分配这些东西都是历史包袱。
所幸SolidUI是开源产品,可以不断触底突破,成为一流的产品,很多东西实现未必是主创真正想做的,但是不要一直身被包袱,新时代有新的公约。
兼容、迁移、丢弃
兼容、迁移和丢弃是SolidUI不断探索的过程中必然面临的问题。开源的伟大之处在于,全球协作中会有不断加入的大佬,分叉路径,但主路径的探索始终在进行。
护城河?
- 持续投入研发,保持技术创新和领先地位
- 优秀的产品设计和用户体验,使产品具备竞争优势
- 紧密的社区合作和支持,形成良好的生态系统。
- 积累信息和知识,这方面就是金钱。
结语
SolidUI是一款开源的AI生成可视化产品,以创新和突破为核心,不断挑战旧时代的思维模式。通过持续研发、优秀的产品设计、社区合作和行业经验积累,SolidUI努力在生成AI产品领域建立起护城河。