CreateDatabase API执行流程_milvus源码解析

本文涉及的产品
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
全局流量管理 GTM,标准版 1个月
云解析 DNS,旗舰版 1个月
简介: CreateDatabase API执行流程_milvus源码解析

CreateDatabase API执行流程源码解析

整体架构:

architecture.png

CreateDatabase 的数据流向:

create_database数据流向.jpg

1.客户端sdk发出CreateDatabase API请求。

from pymilvus import (
    connections,
    db,
)

_HOST = '192.168.230.71'
_PORT = '19530'

def connect_to_milvus(db_name="default"):
    print("connect to milvus")
    connections.connect(host=_HOST,
                        port=_PORT,
                        db_name=db_name,
                        )


if __name__ == '__main__':
    connect_to_milvus(db_name="default")

    if "db1" not in db.list_database():
        print("create database: db1")
        db.create_database(db_name="db1")

    print("list databases:")
    print(db.list_database())

客户端SDK向proxy发送一个CreateDatabase API请求,创建一个名为db1的数据库。

2.客户端接受API请求,将request封装为createDatabaseTask,并压入ddQueue队列。

代码路径:internal\proxy\impl.go

func (node *Proxy) CreateDatabase(ctx context.Context, request *milvuspb.CreateDatabaseRequest) (*commonpb.Status, error) {
   
   
    ......
    // request封装为task
    cct := &createDatabaseTask{
   
   
        ctx:                   ctx,
        Condition:             NewTaskCondition(ctx),
        CreateDatabaseRequest: request,
        rootCoord:             node.rootCoord,
        replicateMsgStream:    node.replicateMsgStream,
    }
    ......
    // 将task压入ddQueue队列
    if err := node.sched.ddQueue.Enqueue(cct); err != nil {
   
   

    }
    ......
    // 等待cct执行完
    if err := cct.WaitToFinish(); err != nil {
   
   

    }
}

3.执行createDatabaseTask的3个方法PreExecute、Execute、PostExecute。

PreExecute()一般为参数校验等工作。

Execute()一般为真正执行逻辑。

代码路径:internal\proxy\task_database.go

func (cdt *createDatabaseTask) Execute(ctx context.Context) error {
   
   
    var err error
    cdt.result, err = cdt.rootCoord.CreateDatabase(ctx, cdt.CreateDatabaseRequest)
    if cdt.result != nil && cdt.result.ErrorCode == commonpb.ErrorCode_Success {
   
   
        SendReplicateMessagePack(ctx, cdt.replicateMsgStream, cdt.CreateDatabaseRequest)
    }
    return err
}

从代码可以看出调用了rootCoord的CreateDatabase接口。

4.进入rootCoord的CreateDatabase接口。

代码路径:internal\rootcoord\root_coord.go

继续将请求封装为rootcoord里的createDatabaseTask

func (c *Core) CreateDatabase(ctx context.Context, in *milvuspb.CreateDatabaseRequest) (*commonpb.Status, error) {
   
   
    ......
    // 封装为createDatabaseTask
    t := &createDatabaseTask{
   
   
        baseTask: newBaseTask(ctx, c),
        Req:      in,
    }
    // 加入调度
    if err := c.scheduler.AddTask(t); err != nil {
   
   
        ......
    }
    // 等待task完成
    if err := t.WaitToFinish(); err != nil {
   
   
        ......
    }

    ......
}

5.执行createDatabaseTask的Prepare、Execute、NotifyDone方法。

Execute()为核心方法。

代码路径:internal\rootcoord\create_db_task.go

func (t *createDatabaseTask) Execute(ctx context.Context) error {
   
   
    db := model.NewDatabase(t.dbID, t.Req.GetDbName(), etcdpb.DatabaseState_DatabaseCreated)
    return t.core.meta.CreateDatabase(ctx, db, t.GetTs())
}

在这里重点研究t.core.meta.CreateDatabase()这个方法做了什么事情。

调用栈如下:

t.core.meta.CreateDatabase()(internal\rootcoord\create_db_task.go)
  |--mt.createDatabasePrivate()(internal\rootcoord\meta_table.go)
    |--mt.catalog.CreateDatabase()(同上)
      |--kc.Snapshot.Save()(internal\metastore\kv\rootcoord\kv_catalog.go)
        |--ss.MetaKv.MultiSave()(internal\metastore\kv\rootcoord\suffix_snapshot.go)
          |--kv.executeTxn()(internal\kv\etcd\etcd_kv.go)
            |--txn.Then(ops...).Commit()(使用clientv3操作etcd)

create_database堆栈.jpg

在etcd会产生2个key。

==by-dev/meta/root-coord/database/db-info/445629732221365773==

==by-dev/meta/snapshots/root-coord/database/db-info/445629732221365773_ts445630347829575684==

value的值的结构为etcdpb.DatabaseInfo,然后进行protobuf序列化后存入etcd。

因此etcd存储的是二进制数据。

&pb.DatabaseInfo{
   
   
    TenantId:    db.TenantID,
    Id:          db.ID,
    Name:        db.Name,
    State:       db.State,
    CreatedTime: db.CreatedTime,
}

dbinfo.jpg

func (kc *Catalog) CreateDatabase(ctx context.Context, db *model.Database, ts typeutil.Timestamp) error {
   
   
    // key的规则
    key := BuildDatabaseKey(db.ID)
    // value的值
    dbInfo := model.MarshalDatabaseModel(db)
    // 序列化
    v, err := proto.Marshal(dbInfo)
    if err != nil {
   
   
        return err
    }
    return kc.Snapshot.Save(key, string(v), ts)
}

跟踪BuildDatabaseKey()函数,即可以得到key的规则。

这里整理如下:

key规则:

  • 前缀/root-coord/database/db-info/{dbID}

  • 前缀/snapshots/root-coord/database/db-info/{dbID}_ts{时间戳}

默认数据库名为default,dbID为1。

ID和时间戳都是一串数字,由physicalTime+logicalTime组成。

总结:

  • CreateDatabase由proxy传递给协调器rootCoord操作etcd。
  • CreateDatabase最终会在etcd上写入2个key。
目录
相关文章
|
14天前
|
监控 安全 开发工具
鸿蒙HarmonyOS应用开发 | HarmonyOS Next-从应用开发到上架全流程解析
HarmonyOS Next是华为推出的最新版本鸿蒙操作系统,强调多设备协同和分布式技术,提供丰富的开发工具和API接口。本文详细解析了从应用开发到上架的全流程,包括环境搭建、应用设计与开发、多设备适配、测试调试、应用上架及推广等环节,并介绍了鸿蒙原生应用开发者激励计划,帮助开发者更好地融入鸿蒙生态。通过DevEco Studio集成开发环境和华为提供的多种支持工具,开发者可以轻松创建并发布高质量的鸿蒙应用,享受技术和市场推广的双重支持。
180 11
|
11天前
|
存储 人工智能 API
AgentScope:阿里开源多智能体低代码开发平台,支持一键导出源码、多种模型API和本地模型部署
AgentScope是阿里巴巴集团开源的多智能体开发平台,旨在帮助开发者轻松构建和部署多智能体应用。该平台提供分布式支持,内置多种模型API和本地模型部署选项,支持多模态数据处理。
108 4
AgentScope:阿里开源多智能体低代码开发平台,支持一键导出源码、多种模型API和本地模型部署
|
11天前
|
存储 设计模式 算法
【23种设计模式·全精解析 | 行为型模式篇】11种行为型模式的结构概述、案例实现、优缺点、扩展对比、使用场景、源码解析
行为型模式用于描述程序在运行时复杂的流程控制,即描述多个类或对象之间怎样相互协作共同完成单个对象都无法单独完成的任务,它涉及算法与对象间职责的分配。行为型模式分为类行为模式和对象行为模式,前者采用继承机制来在类间分派行为,后者采用组合或聚合在对象间分配行为。由于组合关系或聚合关系比继承关系耦合度低,满足“合成复用原则”,所以对象行为模式比类行为模式具有更大的灵活性。 行为型模式分为: • 模板方法模式 • 策略模式 • 命令模式 • 职责链模式 • 状态模式 • 观察者模式 • 中介者模式 • 迭代器模式 • 访问者模式 • 备忘录模式 • 解释器模式
【23种设计模式·全精解析 | 行为型模式篇】11种行为型模式的结构概述、案例实现、优缺点、扩展对比、使用场景、源码解析
|
11天前
|
设计模式 存储 安全
【23种设计模式·全精解析 | 创建型模式篇】5种创建型模式的结构概述、实现、优缺点、扩展、使用场景、源码解析
结构型模式描述如何将类或对象按某种布局组成更大的结构。它分为类结构型模式和对象结构型模式,前者采用继承机制来组织接口和类,后者釆用组合或聚合来组合对象。由于组合关系或聚合关系比继承关系耦合度低,满足“合成复用原则”,所以对象结构型模式比类结构型模式具有更大的灵活性。 结构型模式分为以下 7 种: • 代理模式 • 适配器模式 • 装饰者模式 • 桥接模式 • 外观模式 • 组合模式 • 享元模式
【23种设计模式·全精解析 | 创建型模式篇】5种创建型模式的结构概述、实现、优缺点、扩展、使用场景、源码解析
|
11天前
|
设计模式 存储 安全
【23种设计模式·全精解析 | 创建型模式篇】5种创建型模式的结构概述、实现、优缺点、扩展、使用场景、源码解析
创建型模式的主要关注点是“怎样创建对象?”,它的主要特点是"将对象的创建与使用分离”。这样可以降低系统的耦合度,使用者不需要关注对象的创建细节。创建型模式分为5种:单例模式、工厂方法模式抽象工厂式、原型模式、建造者模式。
【23种设计模式·全精解析 | 创建型模式篇】5种创建型模式的结构概述、实现、优缺点、扩展、使用场景、源码解析
|
1天前
|
API 数据处理 开发者
获取淘宝分类详情:深入解析taobao.cat_get API接口
淘宝开放平台推出的`taobao.cat_get` API接口,帮助开发者和商家获取淘宝、天猫的商品分类详情。该接口支持获取类目列表、属性及父类目信息,通过指定分类ID(cid)实现精准查询,并提供灵活的参数设置和高效的数据处理。使用流程包括注册账号、创建应用、获取App Key/Secret、构造请求、发送并解析响应。示例代码展示了如何用Python调用此API。开发者可借此为电商项目提供数据支持。
|
17天前
|
域名解析 弹性计算 安全
阿里云服务器租用、注册域名、备案及域名解析完整流程参考(图文教程)
对于很多初次建站的用户来说,选购云服务器和注册应及备案和域名解析步骤必须了解的,目前轻量云服务器2核2G68元一年,2核4G4M服务器298元一年,域名注册方面,阿里云推出域名1元购买活动,新用户注册com和cn域名2年首年仅需0元,xyz和top等域名首年仅需1元。对于建站的用户来说,购买完云服务器并注册好域名之后,下一步还需要操作备案和域名绑定。本文为大家展示阿里云服务器的购买流程,域名注册、绑定以及备案的完整流程,全文以图文教程形式为大家展示具体细节及注意事项,以供新手用户参考。
|
11天前
|
安全 搜索推荐 数据挖掘
陪玩系统源码开发流程解析,成品陪玩系统源码的优点
我们自主开发的多客陪玩系统源码,整合了市面上主流陪玩APP功能,支持二次开发。该系统适用于线上游戏陪玩、语音视频聊天、心理咨询等场景,提供用户注册管理、陪玩者资料库、预约匹配、实时通讯、支付结算、安全隐私保护、客户服务及数据分析等功能,打造综合性社交平台。随着互联网技术发展,陪玩系统正成为游戏爱好者的新宠,改变游戏体验并带来新的商业模式。
|
29天前
|
监控 搜索推荐 测试技术
电商API的测试与用途:深度解析与实践
在电子商务蓬勃发展的今天,电商API成为连接电商平台、商家、消费者和第三方开发者的重要桥梁。本文深入探讨了电商API的核心功能,包括订单管理、商品管理、用户管理、支付管理和物流管理,并介绍了有效的测试技巧,如理解API文档、设计测试用例、搭建测试环境、自动化测试、压力测试、安全性测试等。文章还详细阐述了电商API的多样化用途,如商品信息获取、订单管理自动化、用户数据管理、库存同步、物流跟踪、支付处理、促销活动管理、评价管理、数据报告和分析、扩展平台功能及跨境电商等,旨在为开发者和电商平台提供有益的参考。
36 0
|
21天前
|
人工智能 自然语言处理 API
Multimodal Live API:谷歌推出新的 AI 接口,支持多模态交互和低延迟实时互动
谷歌推出的Multimodal Live API是一个支持多模态交互、低延迟实时互动的AI接口,能够处理文本、音频和视频输入,提供自然流畅的对话体验,适用于多种应用场景。
68 3
Multimodal Live API:谷歌推出新的 AI 接口,支持多模态交互和低延迟实时互动

热门文章

最新文章

推荐镜像

更多