新生产力工具AI推动下一级人类文明跃迁? AI如何倒逼数据库的进化? AI加持后的数据库应用场景有哪些变化?

本文涉及的产品
云原生数据库 PolarDB MySQL 版,Serverless 5000PCU 100GB
简介: 新生产力工具AI会催生下一级人类文明跃迁吗? 数据库进化出了哪些与AI相结合的能力? AI加持后的数据库应用场景有哪些变化?

作者

digoal

日期

2023-09-21

标签

PostgreSQL , PolarDB , 生产力 , 生产工具 , 生产资料 , 人货场 , 供需连 , chat , image search , 相似圈选


背景

新生产力工具AI会催生下一级人类文明跃迁吗? 数据库进化出了哪些与AI相结合的能力? AI加持后的数据库应用场景有哪些变化?


新生产力工具AI会催生下一级人类文明跃迁吗?

  • 火的运用: 化学能、石器时代 -> 机械、...
  • 量子的运用: 原子能、计算机、互联网络
  • AI的运用: 万物智能


数据库进化出了哪些与AI相结合的能力?

1、现有数据采集、存储、分析, 以人类易于理解的属性和值为中心进行设计.

  • 属性: 文本, 时间, 数值, 布尔, IP, 范围, 经纬度, 路径, 多边形 等.
  • 值: 对应的值.
  • 搜索方法: 大、小、等、排序、不等、包含、不包含、距离、范围相交、范围包含、 ...


2、下一代数据采集、存储、分析, 将以AI(大模型)易于理解的属性和值为中心进行设计.

  • 属性: 向量!
  • 值: 浮点数组
  • 搜索方法: 相似、不同纬度的互补、完全不相干


3、数据库进化出了哪些与AI相结合的能力, 以PostgreSQL|PolarDB 开源为例(vector, embeddings, hnsw等向量插件):

  • 向量类型.
  • 向量搜索方法: 目前只支持相似. 我相信未来一定会支持 “不同纬度的互补、完全不相干”的快速搜索. (因为这些在现实世界都是热点需求.)
  • 向量索引. 加速各种向量搜索方法.


向量插件使用方法参考文末内容.


AI加持后的数据库应用场景有哪些变化?

任何工具, 本质上都是在解决不同资源的供需连接问题. 例如:

  1. chatgpt: 提问者 + 知识资源提供方
  2. image search: 搜图者 + 图片创作者
  3. 相似侵权 search: 搜索方(注册企业名称, 图片设计, 商标设计等) + 内容提供方
  4. 营销目标人群搜索: 商家 + 买家
  5. 职位匹配: 求职者 + 用人企业
  6. 企业合作匹配: 供应链上下游企业之间


AI加持后的数据库应用的几个阶段:

1、存量数据向量化


调用大模型对存量数据进行向量化处理. 使用方法参考:

https://developer.aliyun.com/article/1328091


2、相似选择 ( 同性相斥, 臭味相投. order by 向量距离 ) 例如:

  • chatgpt: 提问者 + 知识资源提供方
  • image search: 搜图者 + 图片创作者
  • 相似侵权 search: 搜索方(注册企业名称, 图片设计, 商标设计等) + 内容提供方
  • 营销目标人群搜索: 商家 + 买家
  • 职位匹配: 求职者 + 用人企业


向量相似搜索方法参考:

https://developer.aliyun.com/article/1323055


3、互补选择 ( 异性相吸, 毫不相干. 不同纬度的互补、完全不相干. order by 向量距离 desc OR order by 向量互补距离 ? ) 例如:

  • 企业合作匹配: 供应链上下游企业之间
  • 组合创新.
  • 一对多组合 (向量在不同方向叠加互补? 魔神坛斗士里的“仁、义、礼、智、信、忠、孝、悌、忍”合体)


向量的几种搜索颇有“道”的味道, 向量在未来也许可以和东方古老智慧进行融合:

  • 阴阳、五行、紫薇斗数、卦相演变 ...


参考

202308/20230829_02.md 《沉浸式学习PostgreSQL|PolarDB 8: 电商|短视频|新闻|内容推荐业务(根据用户行为推荐相似内容)、监控预测报警系统(基于相似指标预判告警)、音视图文多媒体相似搜索、人脸|指纹识别|比对 - 向量搜索应用》
202308/20230831_01.md 《沉浸式学习PostgreSQL|PolarDB 9: AI大模型+向量数据库, 提升AI通用机器人在专业领域的精准度, 完美诠释柏拉图提出的“知识是回忆而不是知觉”》
202309/20230914_01.md 《沉浸式学习PostgreSQL|PolarDB 16: 植入通义千问大模型+文本向量化模型, 让数据库具备AI能力》
202309/20230912_01.md 《制作 PostgresML docker 镜像》
202309/20230911_01.md 《PostgresML=模型集市+向量数据库+自定义模型 : 用postgresml体验AI应用(图像搜索、推荐系统和自然语言处理)与向量检索》
202302/20230220_02.md 《postgresML - end-to-end machine learning system》
相关实践学习
如何一键本地部署PolarDB for PostgreSQL
《PolarDB for PostgreSQL动手实践》系列第一期,带您体验如何本地一键安装快速部署云原生开源数据库PolarDB for PostgreSQL。
相关文章
|
6天前
|
SQL 存储 关系型数据库
数据库开发之图形化工具以及表操作的详细解析
数据库开发之图形化工具以及表操作的详细解析
22 0
|
1月前
|
关系型数据库 MySQL 数据库
rds安装数据库客户端工具
安装阿里云RDS的数据库客户端涉及在本地安装对应类型(如MySQL、PostgreSQL)的客户端工具。对于MySQL,可选择MySQL Command-Line Client或图形化工具如Navicat,安装后输入RDS实例的连接参数进行连接。对于PostgreSQL,可以使用`psql`命令行工具或图形化客户端如PgAdmin。首先从阿里云控制台获取连接信息,然后按照官方文档安装客户端,最后配置客户端连接以确保遵循安全指引。
92 1
|
4天前
|
人工智能 机器人 Linux
超级炫酷的AI绘图工具—MidJourney入门使用教程
超级炫酷的AI绘图工具—MidJourney入门使用教程
|
11天前
|
人工智能
【强大的cursor_不懂就问AI工具做开发的AI助手技巧分享——一定要去试试!!!】
【强大的cursor_不懂就问AI工具做开发的AI助手技巧分享——一定要去试试!!!】
|
17天前
|
机器学习/深度学习 数据采集 人工智能
|
17天前
|
机器学习/深度学习 人工智能 算法
|
17天前
|
机器学习/深度学习 人工智能 算法
|
20天前
|
人工智能 安全 数据库
AI日报:这种病毒从生成式AI工具中窃取您的数据
AI日报:这种病毒从生成式AI工具中窃取您的数据
15 0
AI日报:这种病毒从生成式AI工具中窃取您的数据
|
1月前
|
人工智能 自然语言处理 搜索推荐
微调工程师岗位可能并不存在,但使用 AI 编码工具已经成为刚需
阿里云通义灵码,作为智能编码助手,下载量超130万,引领国内AI编码工具市场。
115769 87
|
1月前
|
存储 SQL 数据管理
阿里云数据库 SelectDB 内核 Apache Doris 如何基于自增列满足高效字典编码等典型场景需求|Deep Dive 系列
自增列的实现,使得 Apache Doris 可以在处理大规模时展示出更高的稳定性和可靠性。通过自增列,用户能够高效进行字典编码,显著提升了字符串精确去重以及查询的性能。使用自增列作为主键来存储明细数据,可以完美的解决明细数据更新的问题。同时,基于自增列,用户可以实现高效的分页机制,轻松应对深分页场景,有效过滤掉大量非必需数据,从而减轻数据库的负载压力,为用户带来了更加流畅和高效的数据处理体验。