folly 之 fbstring

简介: # folly folly 是 facebook 开源的一个 c++ 基础库, 主打性能, 对 boost 或是 stl 的补充。 folly 是基于 c++11 的, 大量采用现代 c++ 的特性, 是学习现代 c++ 编程的一份很好 的素材。 # fbstring fbstring 是 std::string 的一个替代品, 它们的接口是完全兼容的。而且提供了

folly

folly 是 facebook 开源的一个 c++ 基础库, 主打性能, 对 boost 或是 stl 的补充。
folly 是基于 c++11 的, 大量采用现代 c++ 的特性, 是学习现代 c++ 编程的一份很好
的素材。

fbstring

fbstring 是 std::string 的一个替代品, 它们的接口是完全兼容的。而且提供了接口在
std::string 和 fbstring 间进行转换。fbstring 的最大卖点就是速度快。

fbstring 优化点

分层存储

fbstring 对于字符串的大小, 分成 3 种方式来分配和使用内存

  1. 小于 23(包括 23)

    直接放在 fbstring 内, 不额外分配内存, 对于大量使用小字符串的情景下, 这个优化
    是相当有用的, 字符串甚至可以直接在棧上, 非常的环保。
    
  2. 24 到 255(包括 255)

    直接采用 malloc 分配内存, 字符串拷贝也会直接拷贝
    
  3. 大于 255

    考虑到大字符串拷贝消耗比较大, 所以只有在需要的时候才会做真正的拷贝, 实现的方法
    是引用计数和 copy-on-write。
    

数据结构

struct MediumLarge {
  Char * data_;
  size_t size_;
  size_t capacity_;

union {
  uint8_t bytes_[sizeof(MediumLarge)]; // For accessing the last byte.
  Char small_[sizeof(MediumLarge) / sizeof(Char)];
  MediumLarge ml_;
};

联合结构中的 bytes_ 是为了获取最后一个字节用的,最后一个字节里存储了字符串的类型,
不同的类型会有不同的操作。对于 small 的字符串,它的总的大小是 24 字节,这其中包
含了字符串数据,包含一个字符串结束'\0',以及字符串的大小。但是 fbstring 可以存储
23 个字节(不包含字符串结束符),比 24 个字节只少了一个字节,我们来看看它是怎么
做到的。最后一个字节存储了字符串的类型,因为只有 3 种字符串类型,所以只需要 2 位
就够了,还剩下 6 位,这 6 位存储的不是字符串的长度,而是还有多少 可用剩余空间
,在字符串需要变大的时候,就可以直接用这个值来判断是否需要转换成 media 类型的字
符串,但是在取 size 的时候,需要简单计算一下,当 small 字符串长度小于 23 个字符
的时候,可以在字符串的末尾直接加上'\0',作为结束符。当字符内串达到 23 个字节的时
候,最后一个字节记录的 可用剩余空间 就变成了 0(最后一个字节的 6 位),又因为
small 类型的字符串的类型值正好是 0(最后一个字节的 2 位), 所以最后一个字节就是
0,这也正好充当了字符串的结束符。

find 优化

字符串的 find 操作使用了 Boyer Moore 算法来加速, 相对于 std::string 在查找命中
和非命中的情况下都有很大的提高,我随便找了两个字符串测试了一下,大概有 2-3 倍的提高

目录
相关文章
|
4月前
|
程序员 调度 C#
协程是什么?为何说协程具有同步的编程方式又具有异步的性能?
协程是什么?为何说协程具有同步的编程方式又具有异步的性能?
76 0
|
5月前
|
自然语言处理 Java 索引
Java中的Unicode字符编码与占用比特位解析
Java中的Unicode字符编码与占用比特位解析
|
6月前
|
Go
终于掌握Go语言变量生命周期 新手进阶必读
终于掌握Go语言变量生命周期 新手进阶必读
84 0
|
11月前
|
存储 缓存 监控
深入浅出 eBPF 技术
1 eBPF 介绍eBPF 是革命性技术, 起源于 linux 内核, 能够在操作系统内核中执行沙盒程序。旨在不改变内核源码或加载内核模块的前提下安全便捷的扩展内核能力。1.1 demo 展示demo程序如下:#include <linux/bpf.h> #define SEC(NAME) __attribute__((section(NAME), used)) SEC(&quot
2317 0
深入浅出 eBPF 技术
|
存储 Ubuntu Linux
fd一个简单快速的find命令替代方案
目录 fd特点 如何在Linux中安装fd CentOS安装 命令选项 如何在Linux中使用fd
577 0
|
存储 安全 网络架构
IGMPv2:互联网组管理协议
与 ICMP 一样,IGMP 是 IP 的组成部分。所有希望接收 IP 多播的主机都需要实现它。IGMP 消息封装在 IP 数据报中,IP 协议编号为 2。本文档中描述的所有 IGMP 消息都使用 IP TTL 1 发送,并在其 IP 报头中包含 IP 路由器警报选项 [RFC 2113]。
379 0
IGMPv2:互联网组管理协议
|
网络协议 Linux 虚拟化
linux--VM虚拟机下配置IP地址(NAT模式)
linux--VM虚拟机下配置IP地址(NAT模式)
265 0
linux--VM虚拟机下配置IP地址(NAT模式)
|
编译器 Linux Ruby
Linux环境安装Protobuf
1,下载地址: https://github.com/protocolbuffers/protobuf/releases 最好是下载-all的包,因为里面的依赖文件比较全,不然还需要下载各种依赖,可能会遇到各种报错,我这里下载的是3.11.2版本,自己根据情况下面对应的版本. 2,解压编译 1, tar -zxvf protobuf-all-3.11.2.tar.gz 2, ./configure 3, make 4, make install 最后两步比较的慢,耐心等待就行,完成后运行下面的命令可以看到版本的信息 执行 protoc --version 会显示 libpro
|
资源调度 Kubernetes 网络协议
深入浅出总结Flink运行时架构。
Flink 运行时架构主要包括四个不同的组件,它们会在运行流处理应用程序时协同工作:作业管理器(JobManager)、资源管理器(ResourceManager)、任务管理器(TaskManager),以及分发器(Dispatcher)。因为 Flink 是用 Java 和 Scala 实现的,所以所有组件都会运行在Java 虚拟机上。接下来对各个组件的功能进行简单介绍i。
深入浅出总结Flink运行时架构。
|
缓存 资源调度 前端开发
electron踩坑系列之一
以electron作为基础框架,已经开发两个项目了。第一个项目,我主要负责用react写页面,第二项目既负责electron部分又负责UI部分。
1644 0
electron踩坑系列之一