FlatBuffers 体验

本文涉及的产品
云解析DNS,个人版 1个月
云解析 DNS,旗舰版 1个月
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
简介:

1. 背景

最近在项目中需要使用一种高效数据序列化的工具。碰巧在几篇文章中都提到了FlatBuffers 这个库。特别是 Android 性能优化典范第四季1中两个对比图,让我对它产生浓厚的兴趣。如下:

(注:图片来自1

可见,FlatBuffers 几乎从空间和时间复杂度上完胜其他技术,我决定详细调研一下此技术。

FlatBuffers 是一个开源的跨平台数据序列化库,可以应用到几乎任何语言(C++, C#, Go, Java, JavaScript, PHP, Python),最开始是 Google 为游戏或者其他对性能要求很高的应用开发的。项目地址在 GitHub 上。官方的文档在 这里

本文将介绍一下我使用 FlatBuffers 的一些感受,希望对想要了解或者使用 FlatBuffers 的同学有一点帮组。

2. FlatBuffer 的优点

FlatBuffer 相对于其他序列化技术,例如 XML,JSON,Protocol Buffers 等,有哪些优势呢?官方文档的说法如下:

  1. 直接读取序列化数据,而不需要解析(Parsing)或者解包(Unpacking):FlatBuffer 把数据层级结构保存在一个扁平化的二进制缓存(一维数组)中,同时能够保持直接获取里面的结构化数据,而不需要解析,并且还能保证数据结构变化的前后向兼容。
  2. 高效的内存使用和速度:FlatBuffer 使用过程中,不需要额外的内存,几乎接近原始数据在内存中的大小。
  3. 灵活:数据能够前后向兼容,并且能够灵活控制你的数据结构。
  4. 很少的代码侵入性:使用少量的自动生成的代码即可实现。
  5. 强数据类性,易于使用,跨平台,几乎语言无关。

官方提供了一个性能对比表如下:

(注:来自 官方文档

在做 Android 开发的时候,JSON 是最常用的数据序列化技术。我们知道,JSON 的可读性很强,但是序列化和反序列化性能却是最差的。解析的时候,JSON 解析器首先,需要在内存中初始化一个对应的数据结构,这个事件经常会消耗 100ms ~ 200ms2;解析过程中,要产生大量的临时变量,造成 Java 虚拟机的 GC 和内存抖动,解析 20KB 的数据,大概会消耗 100KB 的临时内存2。FlatBuffers 就解决了这些问题。

3. 使用方法

简单来说,FlatBuffers 的使用方法是,首先按照使用特定的 IDL 定义数据结构 schema,然后使用编译工具 flatc 编译 schema 生成对应的代码,把生成的代码应用到工程中即可。下面详细介绍每一步。

首先,我们需要得到 flatc,这个需要从源码编辑得到。从 GitHub 上 Clone 代码,

$ git clone https://github.com/google/flatbuffers 

在 Mac 上,使用 Xcode 直接打开 build/Xcode/ 里面项目文件,编译运行,即可在项目根目录生成我们需要的 flatc 工具。也可以使用 cmake 编辑,例如在 Linux 上,运行如下命令即可:

$ cmake -G "Unix Makefiles"
$ make

首先要使用 FlatBuffers 的 IDL 定义好数据结构 Schema,编写 Schema 的详细文档在 这里。其语法和 C 语言类似,比较容易上手。我们这里引用一个简单的例子2,假设数据结构如下:

class Person {  
    String name;
     int friendshipStatus;
    Person spouse;
    List<Person>friends;
}

编写成 Schema 如下,文件名为 Person.fbs

//  Person schema

namespace com.race604.fbs;

enum FriendshipStatus:  int {Friend = 1, NotFriend}

table Person {  
  name:  string;
  friendshipStatus: FriendshipStatus = Friend;
  spouse: Person;
  friends: [Person];
}

root_type Person;

然后,使用 flatc 可以把 Schema 编译成多种编程语言,我们仅仅讨论 Android 平台,所以把 Schema 编译成 Java,命令如下:

$ ./flatc --java Person.fbs 

在当前目录生成如下文件:

.
└── com
    └── race604
        └── fbs
            ├── FriendshipStatus.java
            └── Person.java

Person 类有响应的函数直接获取其内部的属性值,使用非常简单:

Person person =  ;  
//  获取普通成员
String name = person.name();  
int friendshipStatus = person.friendshipStatus();  
//  获取数组
int length = person.friendsLength()  
for ( int i = 0; i < length; i++) {  
    Person friends = person.friends(i);
    
}

下面我们来构建一个 Person 对象,名字是 "John",其配偶(spouse)是 "Mary",还有两个朋友,分别是 "Dave" 和 "Tom",实现如下:

private ByteBuffer createPerson() {  
    FlatBufferBuilder builder =  new FlatBufferBuilder(0);
     int spouseName = builder.createString("Mary");
     int spouse = Person.createPerson(builder, spouseName, FriendshipStatus.Friend, 0, 0);

     int friendDave = Person.createPerson(builder, builder.createString("Dave"),
            FriendshipStatus.Friend, 0, 0);
     int friendTom = Person.createPerson(builder, builder.createString("Tom"),
            FriendshipStatus.Friend, 0, 0);

     int name = builder.createString("John");
     int[] friendsArr =  new  int[]{ friendDave, friendTom };
     int friends = Person.createFriendsVector(builder, friendsArr);

    Person.startPerson(builder);
    Person.addName(builder, name);
    Person.addSpouse(builder, spouse);
    Person.addFriends(builder, friends);
    Person.addFriendshipStatus(builder, FriendshipStatus.NotFriend);

     int john = Person.endPerson(builder);
    builder.finish(john);

     return builder.dataBuffer();
}

基本方法就是通过 FlatBufferBuilder 工具,往里面填写数据,详细的写法可以参考官方文档3。可见,其实写法略显繁琐,不太直观。

4. 基本原理

如官方文档的介绍,FlatBuffers 就像它的名字所表示的一样,就是把结构化的对象,用一个扁平化(Flat)的缓冲区保存,简单的来说就是把内存对象数据,保存在一个一维的数组中。借用 Facebook 文章2的一张图如下:

可见,FlatBuffers 保存在一个 byte 数组中,有一个“支点”指针(pivot point)以此为界,存储的内容分为两个部分:元数据和数据内容。其中元数据部分就是数据在前面,其长度等于对象中的字段数量,每个 byte 保存对应字段内容在数组中的索引(从支点位置开始计算)。

如图,上面的 Person 对象第一个字段是 name,其值的索引位置是 1,所以从索引位置 1 开始的字符串,就是 name 字段的值 "John"。第二个字段是 friendshipStatus,其索引值是 6,找到值为 2, 表示 NotFriend。第三个字段是 spouse,也一个 Person 对象,索引值是 12,指向的是此对象的支点位置。第四个字段是一个数组,图中表示的数组为空,所以索引值是 0。

通过上面的解析,可以看出,FlatBuffers 通过自己分配和管理对象的存储,使对象在内存中就是线性结构化的,直接可以把内存内容保存或者发送出去,加载“解析”数据只需要把 byte 数组加载到内存中即可,不需要任何解析,也不产生任何中间变量。

它与具体的机器或者运行环境无关,例如在 Java 中,对象内的内存不依赖 Java 虚拟机的堆内存分配策略实现,所以也是跨平台的。

5. 使用建议

通过前面的体验,FlatBuffers 几乎秒杀了 JSON,我也尝试使用到现在的项目中,但是最后还是放弃了,下面说说 FlatBuffers 的几点缺点:

  1. FlatBuffers 需要生成代码,对代码有侵入性;
  2. 数据序列化没有可读性,不方便 Debug;
  3. 构建 FlatBuffers 对象比较麻烦,不直观,特别是如果对象比较复杂情况下需要写大段的代码;
  4. 数据的所有内容需要使用 Schema 严格定义,灵活性不如 JSON。

我最后在项目中放弃是因为上面的第 4 点,因为在我的项目中,数据结构变化很大,不方便使用 Schema 完全定义。话又说回来,FlatBuffers 这么多好处,还是很吸引我的,可能会在其他的项目中尝试。

所以,在什么情况下选择使用 FlatBuffers 呢?个人感觉需要满足以下几点:

  1. 项目中有大量数据传输和解析,使用 JSON 成为了性能瓶颈;
  2. 稳定的数据结构定义。
目录
相关文章
|
2月前
|
缓存 编解码 测试技术
基于iOS平台的高效图片处理技术实践
【4月更文挑战第7天】 在移动应用开发领域,图片处理是一个常见且要求高性能的功能模块。特别是在iOS平台上,由于其封闭的生态系统和用户对流畅体验的高期待,开发者需采用高效的图片处理技术以满足应用的性能需求。本文将探讨一种针对iOS平台优化的图片处理流程,涉及图像加载、缓存策略、异步处理以及图形渲染等关键技术点,旨在为iOS应用提供一个低内存消耗、高效率的图片处理解决方案。
|
2月前
|
机器学习/深度学习 数据可视化 算法
《Python 语音转换简易速速上手小册》第5章 音频数据处理(2024 最新版)(下)
《Python 语音转换简易速速上手小册》第5章 音频数据处理(2024 最新版)
61 0
|
2月前
|
数据可视化 数据处理 语音技术
《Python 语音转换简易速速上手小册》第5章 音频数据处理(2024 最新版)(上)
《Python 语音转换简易速速上手小册》第5章 音频数据处理(2024 最新版)
82 0
|
2月前
|
JSON JavaScript 前端开发
Qt 5.14.2 深度解析:打造高效JSON处理利器
Qt 5.14.2 深度解析:打造高效JSON处理利器
176 0
|
2月前
|
编解码 网络协议 Unix
相较于ffmpeg我更倾向于使用socket实现推流工作
相较于ffmpeg我更倾向于使用socket实现推流工作
67 0
|
2月前
|
存储 Java 编译器
每日一博 - Protobuf vs. Protostuff:性能、易用性和适用场景分析
每日一博 - Protobuf vs. Protostuff:性能、易用性和适用场景分析
202 0
【阅读3.8w,收藏2000次】97页《Python自动化办公文档》,让您的 “办公效率” 提高100倍,拿走即用!
【阅读3.8w,收藏2000次】97页《Python自动化办公文档》,让您的 “办公效率” 提高100倍,拿走即用!
【阅读3.8w,收藏2000次】97页《Python自动化办公文档》,让您的 “办公效率” 提高100倍,拿走即用!
|
自然语言处理 Java 测试技术
序列化性能之巅:使用Fury替换Protobuf/Flatbuffers实现10倍加速
问题背景Protobuf/Flatbuffers是业界广泛使用的序列化库,服务于大量的业务场景。但随着业务场景的复杂化,Protobuf/Flatbuffers逐渐不能满足性能需求开始成为系统瓶颈,在这种情况下,用户不得不手写大量序列化逻辑来进行极致性能优化,但这带来了三个问题:大量字段手写序列化逻辑冗长易出错;手写重复序列化逻辑开发效率低下;难以处理发送端和接收端字段变更的前后兼容性问题;这里将
1607 0
|
JSON 编解码 JavaScript
IM通讯协议专题学习(五):Protobuf到底比JSON快几倍?全方位实测!
本篇将以Protobuf为基准,对比市面上的一些主流的JSON解析库,通过全方位测试来证明给你看看Protobuf到底比JSON快几倍。
649 0
IM通讯协议专题学习(五):Protobuf到底比JSON快几倍?全方位实测!
|
JSON 数据可视化 JavaScript
颜值爆表!推荐两款JSON可视化工具,配合Swagger使用真香
经常使用Swagger的小伙伴应该有所体会,Swagger对于JSON的支持真的很不友好!最近发现了两款颜值很不错的JSON可视化工具,可以优雅地展示JSON数据从而提高开发效率,推荐给大家! 聊聊Swagger 我们先来聊聊Swagger对JSON支持有哪些不友好的地方,我们为什么需要JSON可视化工具! 当我们使用Swagger提交POST请求,输入JSON请求参数时,它既不支持JSON格式校验,也不支持格式化,用起来很不方便;