新生产力工具AI推动下一级人类文明跃迁? AI如何倒逼数据库的进化? AI加持后的数据库应用场景有哪些变化?

本文涉及的产品
云原生数据库 PolarDB PostgreSQL 版,标准版 2核4GB 50GB
云原生数据库 PolarDB MySQL 版,通用型 2核4GB 50GB
简介: 新生产力工具AI会催生下一级人类文明跃迁吗? 数据库进化出了哪些与AI相结合的能力? AI加持后的数据库应用场景有哪些变化?

作者

digoal

日期

2023-09-21

标签

PostgreSQL , PolarDB , 生产力 , 生产工具 , 生产资料 , 人货场 , 供需连 , chat , image search , 相似圈选


背景

新生产力工具AI会催生下一级人类文明跃迁吗? 数据库进化出了哪些与AI相结合的能力? AI加持后的数据库应用场景有哪些变化?


新生产力工具AI会催生下一级人类文明跃迁吗?

  • 火的运用: 化学能、石器时代 -> 机械、...
  • 量子的运用: 原子能、计算机、互联网络
  • AI的运用: 万物智能


数据库进化出了哪些与AI相结合的能力?

1、现有数据采集、存储、分析, 以人类易于理解的属性和值为中心进行设计.

  • 属性: 文本, 时间, 数值, 布尔, IP, 范围, 经纬度, 路径, 多边形 等.
  • 值: 对应的值.
  • 搜索方法: 大、小、等、排序、不等、包含、不包含、距离、范围相交、范围包含、 ...


2、下一代数据采集、存储、分析, 将以AI(大模型)易于理解的属性和值为中心进行设计.

  • 属性: 向量!
  • 值: 浮点数组
  • 搜索方法: 相似、不同纬度的互补、完全不相干


3、数据库进化出了哪些与AI相结合的能力, 以PostgreSQL|PolarDB 开源为例(vector, embeddings, hnsw等向量插件):

  • 向量类型.
  • 向量搜索方法: 目前只支持相似. 我相信未来一定会支持 “不同纬度的互补、完全不相干”的快速搜索. (因为这些在现实世界都是热点需求.)
  • 向量索引. 加速各种向量搜索方法.


向量插件使用方法参考文末内容.


AI加持后的数据库应用场景有哪些变化?

任何工具, 本质上都是在解决不同资源的供需连接问题. 例如:

  1. chatgpt: 提问者 + 知识资源提供方
  2. image search: 搜图者 + 图片创作者
  3. 相似侵权 search: 搜索方(注册企业名称, 图片设计, 商标设计等) + 内容提供方
  4. 营销目标人群搜索: 商家 + 买家
  5. 职位匹配: 求职者 + 用人企业
  6. 企业合作匹配: 供应链上下游企业之间


AI加持后的数据库应用的几个阶段:

1、存量数据向量化


调用大模型对存量数据进行向量化处理. 使用方法参考:

https://developer.aliyun.com/article/1328091


2、相似选择 ( 同性相斥, 臭味相投. order by 向量距离 ) 例如:

  • chatgpt: 提问者 + 知识资源提供方
  • image search: 搜图者 + 图片创作者
  • 相似侵权 search: 搜索方(注册企业名称, 图片设计, 商标设计等) + 内容提供方
  • 营销目标人群搜索: 商家 + 买家
  • 职位匹配: 求职者 + 用人企业


向量相似搜索方法参考:

https://developer.aliyun.com/article/1323055


3、互补选择 ( 异性相吸, 毫不相干. 不同纬度的互补、完全不相干. order by 向量距离 desc OR order by 向量互补距离 ? ) 例如:

  • 企业合作匹配: 供应链上下游企业之间
  • 组合创新.
  • 一对多组合 (向量在不同方向叠加互补? 魔神坛斗士里的“仁、义、礼、智、信、忠、孝、悌、忍”合体)


向量的几种搜索颇有“道”的味道, 向量在未来也许可以和东方古老智慧进行融合:

  • 阴阳、五行、紫薇斗数、卦相演变 ...


参考

202308/20230829_02.md 《沉浸式学习PostgreSQL|PolarDB 8: 电商|短视频|新闻|内容推荐业务(根据用户行为推荐相似内容)、监控预测报警系统(基于相似指标预判告警)、音视图文多媒体相似搜索、人脸|指纹识别|比对 - 向量搜索应用》
202308/20230831_01.md 《沉浸式学习PostgreSQL|PolarDB 9: AI大模型+向量数据库, 提升AI通用机器人在专业领域的精准度, 完美诠释柏拉图提出的“知识是回忆而不是知觉”》
202309/20230914_01.md 《沉浸式学习PostgreSQL|PolarDB 16: 植入通义千问大模型+文本向量化模型, 让数据库具备AI能力》
202309/20230912_01.md 《制作 PostgresML docker 镜像》
202309/20230911_01.md 《PostgresML=模型集市+向量数据库+自定义模型 : 用postgresml体验AI应用(图像搜索、推荐系统和自然语言处理)与向量检索》
202302/20230220_02.md 《postgresML - end-to-end machine learning system》
相关实践学习
函数计算X RDS PostgreSQL,基于LLM大语言模型构建AI知识库
基于ChatGLM6B 大语言模型构建AI知识库问答应用。答疑群17125058181
目录
相关文章
|
1天前
|
SQL 关系型数据库 数据库
国产数据实战之docker部署MyWebSQL数据库管理工具
【10月更文挑战第23天】国产数据实战之docker部署MyWebSQL数据库管理工具
13 2
国产数据实战之docker部署MyWebSQL数据库管理工具
|
21天前
|
数据采集 人工智能 自然语言处理
表格增强生成TAG登场:解锁AI自然语言与数据库的完美结合
【10月更文挑战第4天】表格增强生成(TAG)范式解锁了AI自然语言处理与数据库的深度融合,旨在让用户通过自然语言便捷地查询和管理数据。TAG结合了语言模型的强大推理能力和数据库系统的高效计算能力,通过查询合成、执行及答案生成三步完成复杂查询。相较于传统Text2SQL和RAG方法,TAG在准确性上显著提升,但其应用仍面临技术门槛和数据质量等挑战。[论文地址:](https://arxiv.org/pdf/2408.14717)
40 4
|
24天前
|
存储 人工智能 Cloud Native
云栖重磅|从数据到智能:Data+AI驱动的云原生数据库
阿里云瑶池在2024云栖大会上重磅发布由Data+AI驱动的多模数据管理平台DMS:OneMeta+OneOps,通过统一、开放、多模的元数据服务实现跨环境、跨引擎、跨实例的统一治理,可支持高达40+种数据源,实现自建、他云数据源的无缝对接,助力业务决策效率提升10倍。
|
28天前
|
SQL 存储 人工智能
OceanBase CTO杨传辉谈AI时代下数据库技术的创新演进路径!
在「DATA+AI」见解论坛上,OceanBase CTO杨传辉先生分享了AI与数据库技术融合的最新进展。他探讨了AI如何助力数据库技术演进,并介绍了OceanBase一体化数据库的创新。OceanBase通过单机分布式一体化架构,实现了从小规模到大规模的无缝扩展,具备高可用性和高效的数据处理能力。此外,OceanBase还实现了交易处理、分析和AI的一体化,大幅提升了系统的灵活性和性能。杨传辉强调,OceanBase的目标是成为一套能满足80%工作负载需求的系统,推动AI技术在各行各业的广泛应用。关注我们,深入了解AI与大数据的未来!
|
2月前
|
人工智能 Prometheus Cloud Native
新场景、新能力,AI-native 时代的可观测革新
借助 AI-native 可观测解决方案,阿里云为用户提供开箱即用的覆盖大模型应用、大模型到基础设施的全链路实时观测、告警与诊断能力,帮助企业在复杂的数字化转型过程中更有效地确保资源的高效利用与业务的持续成功。
138 13
|
25天前
|
SQL 数据可视化 关系型数据库
【数据库工具】DBeaver:一款免费的通用数据库工具和 SQL 客户端
【数据库工具】DBeaver:一款免费的通用数据库工具和 SQL 客户端
47 1
|
2月前
|
机器学习/深度学习 人工智能 运维
|
10天前
|
机器学习/深度学习 人工智能 算法
AI在药物研发中还有哪些应用场景呢
【10月更文挑战第16天】AI在药物研发中还有哪些应用场景呢
63 0
|
2月前
|
人工智能 算法 大数据
懂场景者得AI,瓴羊发布年度产品智能化战略
9月20日,瓴羊智能科技(以下简称瓴羊)在2024云栖大会上举办了“Data × AI:企业服务智能化,价值增长新动能”专场论坛。阿里巴巴集团副总裁、瓴羊智能科技CEO 朋新宇在会上发布年度产品智能化战略:“(算法 + 算力 + 数据) x 场景 ”,强调企业必须重视场景,只有通过解构场景、重构业务,才能真正拥抱AI,带来突破性增长。
|
13天前
|
人工智能 NoSQL 机器人
MongoDB Atlas与YoMio.AI近乎完美适配:推理更快速、查询更灵活、场景更丰富
随着MongoDB的新发布和革新,YoMio.AI的“闪电式发展”值得期待。