Protobuf - 更小、更快、更简单的交互式数据语言

简介: Protobuf - 更小、更快、更简单的交互式数据语言

01

概念


Protocol buffers 是 Google 的一种语言中立、平台中立,可扩展,用于序列化结构化数据的交互式数据语言。相比 JSON、XML,它更小、更快、更简单。


02

基本语法


定义一个消息类型:

新建一个 user.proto 文件:


syntax = "proto3";
package message;
message UserRequest {
    int64 uid = 1;
    string username = 2;
}


  • .protoc 文件中非空、非注释的第一行,使用关键字 syntax 指定使用的是 proto3 语法,如果未使用关键字 syntax 指定,则默认使用 proto2 语法。
  • package 关键字,用来声明消息类型的可见范围。
  • UserRequest 消息类型共有 2 个字段,每个字段包含3 个属性:数据类型、字段名称和字段编号,其中字段名称和字段编号不可重复。


字段编号从 1 到 2^29 - 1(536,870,911),不可使用预留字段编号 19000-19999,其中 1-15 占用 1 字节,应该用于频繁出现的字段。


在一个.proto文件中,可以定义多个消息类型。


03

标量数据类型


Protobuf 生成的数据类型与原始类型并不完全一致,该表格展示了定义于 .proto 文件中的类型,以及与之对应的、在自动生成的访问类中定义的类型:


.proto Type
Notes
Go Type
double

float64
float

float32
int32
使用变长编码,对于负值的效率很低,如果你的域有可能有负值,请使用sint32替代。 int32
int64
使用变长编码,对于负值的效率很低,如果你的域有可能有负值,请使用sint64替代。 int64
uint32
使用变长编码。 uint32
uint64
使用变长编码。 uint64
sint32
使用变长编码,这些编码在负值时比int32高效的多。 int32
sint64
使用变长编码,这些编码在负值时比int64高效的多。 int64
fixed32
总是4个字节,如果数值总是比总是比228大的话,这个类型会比uint32高效。 uint32

续:

fixed64
总是8个字节,如果数值总是比总是比256大的话,这个类型会比uint64高效。 uint64
sfixed32 总是4个字节。 int32
sfixed64
总是8个字节。 int64
bool

bool
string
一个字符串必须是UTF-8编码或者7-bit ASCII编码的文本。 string
bytes
可能包含任意顺序的字节数据。 []byte

04

更多用法


  • 默认值
  • enum
  • 嵌套
  • Any
  • oneof
  • map


限于篇幅,如需了解上述内容,请阅读文档。

官方文档:

https://developers.google.com/protocol-buffers/docs/proto3

中文翻译:

https://colobu.com/2017/03/16/Protobuf3-language-guide


05

安装 protoc 编译器


protoc 是 Protobuf 的编译器,结合插件将我们编写的 .proto 文件编译成我们需要的编程语言代码。


  1. 下载安装文件
    wget https://github.com/protocolbuffers/protobuf/releases/download/v3.13.0/protobuf-all-3.13.0.zip
  2. 解压缩
    unzip protobuf-all-3.13.0.zip
  3. 检查
    cd protobuf-all-3.13.0
    ./configure
  4. 编译
    make
  5. 安装
    make install


注意:安装过程中,可能会提示需要依赖库,可以根据错误提示安装依赖库。另外,如果你使用的是 macOS,系统已经预装了 protoc,无需重复安装。


06

安装 protoc 插件

protoc-gen-go(Go 代码生成插件


  1. 使用 go get 命令安装
    go get -u github.com/golang/protobuf/protoc-gen-go@v1.4.3
  2. 确保生成的 protoc-gen-go 可执行文件在相应的 bin 目录中。
  3. 编译 .proto 文件。
    protoc --go_out=. *.proto
  • --go_out:编译文件的存放目录
  • *.protoc 目标编译文件,*星号代表文件名的通配符


07

使用 proto 包的函数操作 protobuf


proto 包提供了操作 protobuf 的一系列函数,其中序列化和反序列化函数比较常用,用来将数据序列化后进行传递。


序列化:


func proto.Marshal(m protoiface.MessageV1) ([]byte, error)

Marshal returns the wire-format encoding of m.


反序列化:


func proto.Unmarshal(b []byte, m protoreflect.ProtoMessage) error

Unmarshal parses the wire-format message in b and places the result in m.


更多关于 proto 包的函数使用方法,请查阅文档:

https://pkg.go.dev/google.golang.org/protobuf/proto


08

总结


本文简单描述了 protobuf 的基本语法,如何安装 protoc 和 protoc 插件 protoc-gen-go,如何将 .proto 文件编译成 go 文件。通过阅读本文,读者应该可以完成编写.proto文件,并使用 protoc 编译器和插件生成 go 文件。





目录
相关文章
|
3月前
|
数据采集 XML 自然语言处理
Python 数据解析:从基础到高级技巧
Python 数据解析:从基础到高级技巧
49 0
|
5月前
|
Cloud Native Go 数据处理
你可能还不知道 golang 的高效编码细节
你可能还不知道 golang 的高效编码细节
|
5月前
|
NoSQL API Go
go-mongox:简单高效,让文档操作和 bson 数据构造更流畅
`go-mongox` 基于 **泛型** 对 `MongoDB` 官方框架进行了二次封装,它通过使用链式调用的方式,让我们能够丝滑地操作文档。同时,其还提供了多种类型的 `bson` 构造器,帮助我们高效的构建 `bson` 数据。
73 0
|
6月前
|
Go 开发者
Go语言自定义包:构建你的编程工具库
Go语言自定义包:构建你的编程工具库
51 0
|
1月前
|
存储 算法 数据处理
使用Python编写高效的数据处理程序
在当今信息爆炸的时代,数据处理变得越来越重要。本文将介绍如何使用Python语言编写高效的数据处理程序,包括利用Python内置的数据结构和函数、优化算法和并行处理等技术,帮助开发者更好地处理和分析大规模数据。
|
缓存 自然语言处理 分布式计算
Fury:一个基于JIT动态编译的高性能多语言原生序列化框架
Fury是一个基于JIT动态编译的多语言原生序列化框架,支持Java/Python/Golang/C++等语言,提供全自动的对象多语言/跨语言序列化能力,以及相比于别的框架最高20~200倍的性能。
Fury:一个基于JIT动态编译的高性能多语言原生序列化框架
|
15天前
|
存储 数据挖掘 物联网
Python中的实时数据分析:构建流处理应用程序
【4月更文挑战第12天】本文介绍了Python在实时数据分析中的应用,包括实时数据分析的基本概念、Python的优势及基本流程。Python凭借丰富的库(如Pandas、NumPy)、强大的数据处理工具(如PySpark、Apache Kafka)和活跃的生态系统,成为实时数据分析的理想选择。文中通过社交媒体和物联网的数据分析案例展示了Python如何从数据获取、预处理、处理、存储到结果展示的全过程。通过学习和实践,读者可以掌握使用Python进行实时数据分析的技能。
|
2月前
|
SQL 数据处理
数据处理语言思考
数据处理语言思考
17 1
|
6月前
|
搜索推荐 Go
Golang 语言怎么高效排序数据?
Golang 语言怎么高效排序数据?
20 0
|
8月前
|
XML 存储 JSON
数据序列化工具 Protobuf 编码&避坑指南
我们现在所有的协议、配置、数据库的表达都是以 protobuf 来进行承载的,所以我想深入总结一下 protobuf 这个协议,以免踩坑。 先简单介绍一下 Protocol Buffers(protobuf),它是 Google 开发的一种数据序列化协议(与 XML、JSON 类似)。它具有很多优点,但也有一些需要注意的缺点: 优点: 效率高:Protobuf 以二进制格式存储数据,比如 XML 和 JSON 等文本格式更紧凑,也更快。序列化和反序列化的速度也很快。 跨语言支持:Protobuf 支持多种编程语言,包括 C++、Java、Python 等。 清晰的结构定义:使用 prot