新生产力工具AI推动下一级人类文明跃迁? AI如何倒逼数据库的进化? AI加持后的数据库应用场景有哪些变化?

简介: 新生产力工具AI会催生下一级人类文明跃迁吗? 数据库进化出了哪些与AI相结合的能力? AI加持后的数据库应用场景有哪些变化?

作者

digoal

日期

2023-09-21

标签

PostgreSQL , PolarDB , 生产力 , 生产工具 , 生产资料 , 人货场 , 供需连 , chat , image search , 相似圈选


背景

新生产力工具AI会催生下一级人类文明跃迁吗? 数据库进化出了哪些与AI相结合的能力? AI加持后的数据库应用场景有哪些变化?


新生产力工具AI会催生下一级人类文明跃迁吗?

  • 火的运用: 化学能、石器时代 -> 机械、...
  • 量子的运用: 原子能、计算机、互联网络
  • AI的运用: 万物智能


数据库进化出了哪些与AI相结合的能力?

1、现有数据采集、存储、分析, 以人类易于理解的属性和值为中心进行设计.

  • 属性: 文本, 时间, 数值, 布尔, IP, 范围, 经纬度, 路径, 多边形 等.
  • 值: 对应的值.
  • 搜索方法: 大、小、等、排序、不等、包含、不包含、距离、范围相交、范围包含、 ...


2、下一代数据采集、存储、分析, 将以AI(大模型)易于理解的属性和值为中心进行设计.

  • 属性: 向量!
  • 值: 浮点数组
  • 搜索方法: 相似、不同纬度的互补、完全不相干


3、数据库进化出了哪些与AI相结合的能力, 以PostgreSQL|PolarDB 开源为例(vector, embeddings, hnsw等向量插件):

  • 向量类型.
  • 向量搜索方法: 目前只支持相似. 我相信未来一定会支持 “不同纬度的互补、完全不相干”的快速搜索. (因为这些在现实世界都是热点需求.)
  • 向量索引. 加速各种向量搜索方法.


向量插件使用方法参考文末内容.


AI加持后的数据库应用场景有哪些变化?

任何工具, 本质上都是在解决不同资源的供需连接问题. 例如:

  1. chatgpt: 提问者 + 知识资源提供方
  2. image search: 搜图者 + 图片创作者
  3. 相似侵权 search: 搜索方(注册企业名称, 图片设计, 商标设计等) + 内容提供方
  4. 营销目标人群搜索: 商家 + 买家
  5. 职位匹配: 求职者 + 用人企业
  6. 企业合作匹配: 供应链上下游企业之间


AI加持后的数据库应用的几个阶段:

1、存量数据向量化


调用大模型对存量数据进行向量化处理. 使用方法参考:

https://developer.aliyun.com/article/1328091


2、相似选择 ( 同性相斥, 臭味相投. order by 向量距离 ) 例如:

  • chatgpt: 提问者 + 知识资源提供方
  • image search: 搜图者 + 图片创作者
  • 相似侵权 search: 搜索方(注册企业名称, 图片设计, 商标设计等) + 内容提供方
  • 营销目标人群搜索: 商家 + 买家
  • 职位匹配: 求职者 + 用人企业


向量相似搜索方法参考:

https://developer.aliyun.com/article/1323055


3、互补选择 ( 异性相吸, 毫不相干. 不同纬度的互补、完全不相干. order by 向量距离 desc OR order by 向量互补距离 ? ) 例如:

  • 企业合作匹配: 供应链上下游企业之间
  • 组合创新.
  • 一对多组合 (向量在不同方向叠加互补? 魔神坛斗士里的“仁、义、礼、智、信、忠、孝、悌、忍”合体)


向量的几种搜索颇有“道”的味道, 向量在未来也许可以和东方古老智慧进行融合:

  • 阴阳、五行、紫薇斗数、卦相演变 ...


参考

202308/20230829_02.md 《沉浸式学习PostgreSQL|PolarDB 8: 电商|短视频|新闻|内容推荐业务(根据用户行为推荐相似内容)、监控预测报警系统(基于相似指标预判告警)、音视图文多媒体相似搜索、人脸|指纹识别|比对 - 向量搜索应用》
202308/20230831_01.md 《沉浸式学习PostgreSQL|PolarDB 9: AI大模型+向量数据库, 提升AI通用机器人在专业领域的精准度, 完美诠释柏拉图提出的“知识是回忆而不是知觉”》
202309/20230914_01.md 《沉浸式学习PostgreSQL|PolarDB 16: 植入通义千问大模型+文本向量化模型, 让数据库具备AI能力》
202309/20230912_01.md 《制作 PostgresML docker 镜像》
202309/20230911_01.md 《PostgresML=模型集市+向量数据库+自定义模型 : 用postgresml体验AI应用(图像搜索、推荐系统和自然语言处理)与向量检索》
202302/20230220_02.md 《postgresML - end-to-end machine learning system》
目录
相关文章
|
4月前
|
存储 人工智能 NoSQL
AI大模型应用实践 八:如何通过RAG数据库实现大模型的私有化定制与优化
RAG技术通过融合外部知识库与大模型,实现知识动态更新与私有化定制,解决大模型知识固化、幻觉及数据安全难题。本文详解RAG原理、数据库选型(向量库、图库、知识图谱、混合架构)及应用场景,助力企业高效构建安全、可解释的智能系统。
|
7月前
|
存储 关系型数据库 数据库
附部署代码|云数据库RDS 全托管 Supabase服务:小白轻松搞定开发AI应用
本文通过一个 Agentic RAG 应用的完整构建流程,展示了如何借助 RDS Supabase 快速搭建具备知识处理与智能决策能力的 AI 应用,展示从数据准备到应用部署的全流程,相较于传统开发模式效率大幅提升。
附部署代码|云数据库RDS 全托管 Supabase服务:小白轻松搞定开发AI应用
|
4月前
|
人工智能 运维 NoSQL
云栖大会|AI浪潮下的NoSQL演进:下一代数据库的破局之道
AI浪潮下的NoSQL演进:下一代数据库的破局之道
|
4月前
|
人工智能 Cloud Native 关系型数据库
云栖重磅|瑶池数据库:从云原生数据底座向“AI就绪”的多模态数据底座演进
瑶池数据库:从云原生数据底座向“AI就绪”的多模态数据底座演进
|
5月前
|
缓存 Java 应用服务中间件
Spring Boot配置优化:Tomcat+数据库+缓存+日志,全场景教程
本文详解Spring Boot十大核心配置优化技巧,涵盖Tomcat连接池、数据库连接池、Jackson时区、日志管理、缓存策略、异步线程池等关键配置,结合代码示例与通俗解释,助你轻松掌握高并发场景下的性能调优方法,适用于实际项目落地。
825 5
|
5月前
|
存储 弹性计算 Cloud Native
云原生数据库的演进与应用实践
随着企业业务扩展,传统数据库难以应对高并发与弹性需求。云原生数据库应运而生,具备计算存储分离、弹性伸缩、高可用等核心特性,广泛应用于电商、金融、物联网等场景。阿里云PolarDB、Lindorm等产品已形成完善生态,助力企业高效处理数据。未来,AI驱动、Serverless与多云兼容将推动其进一步发展。
259 8
|
6月前
|
存储 人工智能 算法
​​向量数据库终极指南:AI开发者的进阶手册​
本文深入解析向量数据库的原理与实战应用,涵盖其在AI系统中的核心作用、关键技术(如HNSW、PQ、LSH)、相似性搜索、元数据过滤及无服务器架构优势。适合开发者和AI从业者学习提升。
1499 1