一个高性能、小而美的序列化工具！-阿里云开发者社区

一个高性能、小而美的序列化工具！

2021-12-20 644

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Kryo是一个高性能的序列化/反序列化工具，由于其变长存储特性并使用了字节码生成机制，拥有较高的运行速度和较小的体积，在某些场景中成为了除Json、Protobuf之外的选择。

记录类型信息

这算是kryo的一个特点，可以把对象信息直接写到序列化数据里，反序列化的时候可以精确地找到原始类信息，不会出错，这意味着在写readxxx方法时，无需传入Class或Type类信息。

相应的，kryo提供两种读写方式。记录类型信息的writeClassAndObject/readClassAndObject方法，以及传统的writeObject/readObject方法。

线程安全

kryo的对象本身不是线程安全的，所以我们有两种选择来保障线程安全。

使用Threadlocal来保障线程安全:

实例化器

在上面注意到kryo.setInstantiatorStrategy(new Kryo.DefaultInstantiatorStrategy(new StdInstantiatorStrategy())); 这句话显示指定了实例化器。

在一些依赖了kryo的开源软件中，可能由于实例化器指定的问题而抛出空指针异常。例如hive的某些版本中，默认指定了StdInstantiatorStrategy。

public static ThreadLocal<Kryo> runtimeSerializationKryo = new ThreadLocal<Kryo>() {
    @Override
    protected synchronized Kryo initialValue() {
        Kryo kryo = new Kryo();
        kryo.setClassLoader(Thread.currentThread().getContextClassLoader());
        kryo.register(java.sql.Date.class, new SqlDateSerializer());
        kryo.register(java.sql.Timestamp.class, new TimestampSerializer());
        kryo.register(Path.class, new PathSerializer());
        kryo.setInstantiatorStrategy(new StdInstantiatorStrategy());
        ......
            return kryo;
    };
};

而StdInstantiatorStrategy在是依据JVM version信息及JVM vendor信息创建对象的，可以不调用对象的任何构造方法创建对象。

那么例如碰到ArrayList这样的对象时候，就会出问题。观察一下ArrayList的源码：

public ArrayList() {
    this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
}

既然没有调用构造器，那么这里elementData会是NULL，那么在调用类似ensureCapacity方法时，就会抛出一个异常。

 public void ensureCapacity(int minCapacity) {
     if (minCapacity > elementData.length
         && !(elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA
              && minCapacity <= DEFAULT_CAPACITY)) {
         modCount++;
         grow(minCapacity);
     }
 }

解决方案很简单，就如框架中代码写的一样，显示指定实例化器，首先使用默认无参构造策略DefaultInstantiatorStrategy，若创建对象失败再采用StdInstantiatorStrategy。

类注册

当kryo写一个对象的实例的时候，默认需要将类的完全限定名称写入。将类名一同写入序列化数据中是比较低效的，所以kryo支持通过类注册进行优化。

注册会给每一个class一个int类型的Id相关联，这显然比类名称高效，但同时要求反序列化的时候的Id必须与序列化过程中一致。这意味着注册的顺序非常重要。

但是由于现实原因，同样的代码，同样的Class在不同的机器上注册编号任然不能保证一致，所以多机器部署时候反序列化可能会出现问题。

所以kryo默认会禁止类注册，当然如果想要打开这个属性，可以通过kryo.setRegistrationRequired(true);打开。

循环引用

这是对循环引用的支持，可以有效防止栈内存溢出，kryo默认会打开这个属性。当你确定不会有循环引用发生的时候，可以通过kryo.setReferences(false);关闭循环引用检测，从而提高一些性能。

可变长存储

kryo对int和long类型都采用了可变长存储的机制，以int为例，一般需要4个字节去存储，而对kryo来说，可以通过1-5个变长字节去存储，从而避免高位都是0的浪费。

最多需要5个字节存储是因为，在变长存储int过程中，一个字节的8位用来存储有效数字的只有7位，最高位用于标记是否还需读取下一个字节，1表示需要，0表示不需要。

在对string的存储中也有变长存储的应用，string序列化的整体结构为length+内容，那么length也会使用变长int写入字符的长度。

配合缓存使用的场景

在实际开发中，class增删字段是很常见的事情，但对于kryo来说，确是不支持的，而如果恰好需要使用缓存，那么这个问题会被放得更大。

例如一个对象使用kryo序列化后，数据放入了缓存中，而这时候如果这个对象增删了一个属性，那么缓存中反序列化的时候就会报错。所以频繁使用缓存的场景，可以尽量避免kryo。

不过现在的Kryo提供了兼容性的支持，使用CompatibleFieldSerializer.class，在kryo.writeClassAndObject时候写入的信息如下:

而在读入kryo.readClassAndObject时，会先读入field names，然后匹配当前反序列化类的field和顺序再构造结果。

当然如果在做好缓存隔离的情况下，这一切都不用在意。

一个高性能、小而美的序列化工具！

Java技术栈

热门文章

最新文章

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

一个高性能、小而美的序列化工具！

Java技术栈

热门文章

最新文章

相关电子书