SolidUI的发展：不要身背历史包袱-阿里云开发者社区

SolidUI的发展：不要身背历史包袱

2023-06-26 129 发布于天津

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

实时数仓Hologres，5000CU*H 100GB 3个月

实时计算 Flink 版，5000CU*H 3个月

智能开放搜索 OpenSearch行业算法版，1GB 20LCU 1个月

简介： SolidUI的发展：不要身背历史包袱

背景

本人自由职业，运营AI开源项目https://github.com/CloudOrc/SolidUI。

本文是站在AI产品工程角度推演。

简述

数据可视化，AI生成可视化，看似几个字的差别，其实是不同时代的产品，背后脉络不一样的。

数据可视化发展

大数据发展史：1960年-1980年关系数据库发展，然后1980年数据仓库理论完善，提出商业智能概念，2000年-2010年提出Hadoop体系，所有海量数据都放到Hadoop体系中，2010年之后，因为计算引擎发展，人们解绑数仓体系，发展数据湖体系和OLAP体系，现在可分两种情况，一种靠数据湖这种大一统技术方式处理数据，一种靠OLAP这种MPP架构轻量计算数据。可视化发展情况，1980年-1990年，Office体系，里面实现二维图表，人机交互生成，2000年-2010年，一些商业智能可视化，结合数据仓库业务捆绑，生成二维图表，2010年至今，数据格式也非常复杂，结构和非结构，2D，3D体系也完善了。

在2010起，数据可视化标准彻底定下来了，数据可视化可解释：让数据以图形和图像展示。

AI生成可视化发展

这个跟数据可视化并没有直接关系的，AI生成可视化可解释让大模型行为以图形和图像展示。

AI 生成大模型的历史可以追溯到 2010 年代初期。早期的自然语言处理 (NLP) 模型较小且功能有限，但随着研究和技术的进步，这些模型逐渐变得更大、更复杂。以下是一些重要的里程碑事件和大型 AI 生成模型的发展：

Word2Vec (2013) - Word2Vec 是一种有监督学习方法，它将单词表示为高维空间中的向量，使得具有相似含义的单词在嵌入空间中距离较近。这是第一次成功地为自然语言处理任务提供了有意义的向量表示。
Seq2Seq 和 Attention 机制 (2014-2015) - 序列到序列 (Sequence-to-Sequence, Seq2Seq) 模型是一种端到端的深度学习架构，广泛应用于机器翻译、摘要等任务。在这之后，研究人员引入了 Attention 机制，提高了模型处理长序列时的性能。
ELMo (2018) - ELMo (Embeddings from Language Models) 是一种预训练的语言模型，它使用双向 LSTM（Long Short-Term Memory）神经网络生成上下文相关的词嵌入。这是第一个成功将预训练语言模型用于生成任务的方法。
Transformer (2017) - Transformer 是一种新型神经网络架构，摒弃了传统的循环神经网络 (RNN)。该架构引入了多头自注意力 (Multi-Head Self-Attention) 机制，能够并行计算且可扩展性强，从而使训练大型模型成为可能。
BERT (2018) - BERT (Bidirectional Encoder Representations from Transformers) 是一种基于 Transformer 的预训练模型。通过使用 Masked Language Model (MLM) 和 Next Sentence Prediction (NSP) 任务进行预训练，BERT 能够对文本进行深入理解。它在各种自然语言处理任务上取得了显著的性能提升。
GPT (2018-2021) - GPT (Generative Pre-trained Transformer) 系列模型是 OpenAI 开发的一系列大型预训练语言模型。从 GPT 到 GPT-3，这些模型一直在不断扩大规模和能力。特别是 GPT-3，拥有 1750 亿个参数，成为了迄今为止最大的语言模型之一。GPT-3 在各种生成任务上展现出了惊人的性能，例如文本生成、翻译、摘要、问答等。
在这个过程中，出现了许多其他的模型和架构，如 ULMFiT、RoBERTa、ALBERT、T5 等。这些模型纷纷打破了自然语言处理任务的性能记录。如今，随着计算能力和研究的进一步发展，大型 AI 生成模型的规模和能力仍在不断扩大。

AI生成因OpenAI GPT而爆发，开启新时代的可视化方向，标准并没有生成，都在探索。

SolidUI精准定义

SolidUI的精准定义，是AI生成可视化。让垂直领域的模型的行为，以图形和图像展示。

特点

极简流程，简洁设计
支持多种维度图例
支持多种数据源
支持不同的插件，例如：huggingface体系
支持插件机器人
支持SolidUI自研模型
支持三方大模型体系
容器化部署

发展

思维演化

现在很多特点有受旧时代思维限制，例如0.1.0版本就能看出，在做可视化应用框架。从0.2.0版本开始做聊天框架，不断推开应用体系的推演。

在现在的风口趋势不断去下游探索，从0.3.0版本后开始进入模型体系探索。

现在由于在风口阶段，很多旧时代的思维模式，无论是产品，技术，运营都受到冲击，尤其在AI领域，很多变化性特别大，只谈AI产品思维，不是说把不变的那些特性和差异的一些东西做精了，就可以去做出一流的产品，不是这样，很多旧时代生成模式其实都是过时的，在AI生成体系并没有形成标准时，要去多探索边界，不断触底。

不断触底

但是做过真正 AI 创业人都会发现，所谓的 AI 创业，哪怕咱不谈所有的销售或者这些商业化的东西，你 80% 的东西是产品工程， 20% 的是底层的技术。甚至好。如果你是这时候创业，而你恰好不是 open AI 或者 Anthropic 的话，你可能有 10% 的技术就不错了。而这个时候我们会发现，所有这些先来的人，他不仅是技术，行业规模，甚至利益分配这些东西都是历史包袱。

所幸SolidUI是开源产品，可以不断触底突破，成为一流的产品，很多东西实现未必是主创真正想做的，但是不要一直身被包袱，新时代有新的公约。

兼容、迁移、丢弃

兼容、迁移和丢弃是SolidUI不断探索的过程中必然面临的问题。开源的伟大之处在于，全球协作中会有不断加入的大佬，分叉路径，但主路径的探索始终在进行。

护城河？

持续投入研发，保持技术创新和领先地位
优秀的产品设计和用户体验，使产品具备竞争优势
紧密的社区合作和支持，形成良好的生态系统。
积累信息和知识，这方面就是金钱。

结语

SolidUI是一款开源的AI生成可视化产品，以创新和突破为核心，不断挑战旧时代的思维模式。通过持续研发、优秀的产品设计、社区合作和行业经验积累，SolidUI努力在生成AI产品领域建立起护城河。

SolidUI的发展：不要身背历史包袱

背景

简述

数据可视化发展

AI生成可视化发展

SolidUI精准定义

特点

发展

思维演化

不断触底

兼容、迁移、丢弃

护城河？

结语

大数据与机器学习

热门文章

最新文章

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

SolidUI的发展：不要身背历史包袱

背景

简述

数据可视化发展

AI生成可视化发展

SolidUI精准定义

特点

发展

思维演化

不断触底

兼容、迁移、丢弃

护城河？

结语

大数据与机器学习

热门文章

最新文章

相关课程

相关电子书

相关实验场景