关于 Serializable的探讨

本文涉及的产品
Redis 开源版,标准版 2GB
推荐场景:
搭建游戏排行榜
云数据库 Tair(兼容Redis),内存型 2GB
简介: 本文探讨了Java中的Serializable接口和serialVersionUID字段。Serializable是用于对象序列化的标记接口,用于持久化、传输或缓存对象状态。serialVersionUID是一个版本控制标识,确保反序列化时类版本兼容。它主要适用于Java内置序列化,不涉及JSON等其他序列化方式。作者还分享了一个在项目中考虑使用CountMinSketch数据结构但最终选择其他方法的例子,并建议在非必要情况下,DTO和VO对象可以不实现Serializable。

前提引入

是由于软件测试上有同学提到说,什么该字段在程序刚运行时,导致jvm激增,所以吸引了我的注意

回顾代码

MybatisPlus Generator自动生成的entity中就经常带有这个,

而且我在开发代码的时候VO,以及DTO常常是直接复制对应的entity,所以也保不齐我对应的VO等对象也保留了这个(惭愧表情包),印象中之前就学过,不过忘得差不多了,所以就于此复习一下

问题

  1. 为什么要有 Serializable
  2. 其中的private static final long serialVersionUID = 1L;又有什么用?
  3. 跟序列化有关?是跟具体的某种序列化有关?还是全部?

回答

one,two

在Java中,implements Serializable和serialVersionUID是与对象序列化(serialization)相关的概念,特别是在需要将对象的状态持久化、传输或者缓存时会用到。下面详细解释这些概念以及在MyBatis-Plus中它们的使用场景。

  1. Serializable 接口
    Serializable 是一个标记接口(marker interface),没有任何方法定义,它的存在只是为了告诉JVM某个类的实例是可以被序列化的。序列化的主要用途包括:

持久化:将对象的状态保存到一个存储介质(如文件、数据库)中,以便后续可以恢复。

传输:通过网络传输对象,比如在分布式系统中,从一个JVM传递到另一个JVM。

缓存:将对象放入缓存中,以便于快速恢复对象状态。

  1. serialVersionUID 字段
    serialVersionUID 是一个静态的、最终的(final)长整型字段,用于标识序列化的版本。其作用如下:

版本控制:在反序列化时,JVM会检查传入的字节流中的serialVersionUID是否与本地对应类的serialVersionUID一致。如果一致,说明序列化的版本是兼容的,可以安全地进行反序列化。如果不一致,会抛出InvalidClassException,防止版本不兼容带来的问题。

手动定义serialVersionUID可以避免某些情况下因类的微小变动(如增加一个方法或字段)导致的反序列化失败。一个常见的定义方式是:

private static final long serialVersionUID = 1L;

three

对于不同的序列化机制,如JSON序列化、数据库存储以及其他的自定义序列化方案,serialVersionUID 并不起作用。下面详细讨论serialVersionUID在不同场景中的作用和局限性,以及其他场景中的序列化方式。

  1. JDK 自带的序列化器
    serialVersionUID 是Java内置的序列化机制的一部分,特别是用于 ObjectInputStream 和 ObjectOutputStream 时起作用。当使用这些流进行对象序列化和反序列化时,JVM会检查类的 serialVersionUID 是否匹配,以确保类的版本一致性。
  2. JSON 序列化
    在使用JSON(如通过 Gson、Jackson 或者其他库)进行序列化和反序列化时,serialVersionUID 并不起作用。这是因为JSON序列化器将对象转换为JSON字符串,并不保留Java类的版本信息。因此,在这种情况下,不需要 serialVersionUID。例如:

import com.fasterxml.jackson.databind.ObjectMapper;
public class User {
    private String name;
    private int age;
    // Getters and Setters
}
ObjectMapper objectMapper = new ObjectMapper();
User user = new User();
user.setName("John");
user.setAge(30);
// 序列化
String jsonString = objectMapper.writeValueAsString(user);
// 反序列化
User user2 = objectMapper.readValue(jsonString, User.class);
  1. Redis 存储
    当使用Redis进行数据存储时,通常也会使用JSON字符串进行序列化和反序列化。因为Redis是一个键值存储,保存的是序列化后的数据字符串,而不是Java对象本身,因此 serialVersionUID 并不起作用。
  2. 数据库存储
    对于MySQL等关系型数据库,当对象被存储时,ORM(如MyBatis、Hibernate)会将对象的字段提取出来并生成相应的SQL语句进行存储和查询。在这种情况下,对象序列化是由ORM框架处理的,serialVersionUID 也并不起作用。

serialVersionUID 的适用场景

综上所述,serialVersionUID 的适用场景主要局限于Java内置的序列化机制。当你在分布式系统中使用Java对象的原生序列化和反序列化时,serialVersionUID 可以确保不同版本的类之间的兼容性。如果你的应用程序不使用Java内置的序列化机制,而是使用JSON、XML或其他格式进行序列化,那么 serialVersionUID 并不需要关注。

举个我在项目中遇到的例子

CountMinSketch

当时我在实现一个OJ系统,其中有个类似github,leetcode的提交记录等等的情况,我是懒得放到个人主页,于是我直接放到首页中,其中对应的数据该在后端中怎么存呢?

我联想到了bitmap,可惜他只能是二值,而我们需要保留提交记录中一天提交了多少次呀,所以是不可行的,那么bitmap不行,没有其他的数据结构能同样省空间了吗?有那就CountMinSketch,但是他是概率数据结构,也就是说可能会有误差(也就是误差率以及误差距离越小那么消耗更多的空间,底层思路实现和bloomfilter类似)

这是我当时写的小测试:

public class TestCountMinScratch {
    public static void main(String[] args) {
        CountMinSketch sketch = new CountMinSketch(0.001, 0.99, 1);
        // 对数据进行更新
        sketch.add("2024-5-16",1);
        sketch.add("2024-5-16",1);
        sketch.add("2024-5-16",1);
        // 查询频率
        long frequency = sketch.estimateCount("2024-5-16");
        System.out.println("Frequency of 'example': " + frequency);
    }
}

这个是当时最后没用上的代码,最后选择用了hash结合一定的编码来进行处理,考虑到通常展示的365个天数的提交记录应该也不会很耗时间,又能具有准确性

下面是之前使用CountMinSketch的代码:

@Component
public class CountMinSketchFactory {
    /**
     * 误差率:确保与最大为真实值*(1+epsOfTotalCount)
     * 最小同理
     */
    private final static double epsOfTotalCount=0.07;
    /**
     * 置信度:置信度为 0.99 意味着我们希望在 99% 的情况下,查询估计的误差在指定的误差率范围内。
     * 也就是99%的情况在上面我们推出的范围中
     */
    private final static double confidence=0.99;
    /**
     * 在随机数生成和某些概率数据结构中(如 CountMinSketch),种子(seed) 是一个初始值,用于初始化随机数生成器或哈希函数。它的作用是确保随机过程在相同的种子下每次运行都产生相同的结果。
     */
    private final static int seed=1;
    @Autowired
    private BitmapRedisTemplate bitmapRedisTemplate;
    public CountMinSketch getCountMinSketch(Long uid) {//todo:这里是否适合双检加锁?
        String s = bitmapRedisTemplate.opsForValue().get(RedisConstant.USER_COMMIT_STATICS + uid);
        if(s==null) {
            return new CountMinSketch(epsOfTotalCount, confidence, seed);
        }else{
            return JSONUtil.toBean(s, CountMinSketch.class);
        }
    }
    public void storeCountMinSketch(Long uid,CountMinSketch countMinSketch) {
       bitmapRedisTemplate.opsForValue().set(RedisConstant.USER_COMMIT_STATICS + uid, JSONUtil.toJsonStr(countMinSketch));
    }
}

对于这个情况我原本是打算使用redis来存储的,毕竟是微服务项目,于是我开始两个方案进行对比,分别是项目应用场景1年内的情况以及放大到10年内的提交次数,在序列化到redis之后,却发现countminSketch没有任何变化,原先我还觉得这数据结构这么厉害,结果打开数据一看,什么都没有,这可能也正是json序列化与jdk序列化的区别吧,而且在这次测试中hash在时间消耗上差距并不大,所以选用了hash

最后回到前提

每个serialVersionUID都是静态且final修饰,而且他们也不会被GC所清理,而且消耗空间也不会特别大,除非类爆炸现象,可能当时我没注意听,不然这个现象不可能是一个软件测试的问题,对了有必要的话,还是保留着,毕竟难免可能之后会用到

最后再提一嘴像那些dto什么的以及vo什么的就不需要了,因为你根本不会用到把他们当做一个对象传


相关实践学习
基于Redis实现在线游戏积分排行榜
本场景将介绍如何基于Redis数据库实现在线游戏中的游戏玩家积分排行榜功能。
云数据库 Redis 版使用教程
云数据库Redis版是兼容Redis协议标准的、提供持久化的内存数据库服务,基于高可靠双机热备架构及可无缝扩展的集群架构,满足高读写性能场景及容量需弹性变配的业务需求。 产品详情:https://www.aliyun.com/product/kvstore     ------------------------------------------------------------------------- 阿里云数据库体验:数据库上云实战 开发者云会免费提供一台带自建MySQL的源数据库 ECS 实例和一台目标数据库 RDS实例。跟着指引,您可以一步步实现将ECS自建数据库迁移到目标数据库RDS。 点击下方链接,领取免费ECS&RDS资源,30分钟完成数据库上云实战!https://developer.aliyun.com/adc/scenario/51eefbd1894e42f6bb9acacadd3f9121?spm=a2c6h.13788135.J_3257954370.9.4ba85f24utseFl
相关文章
|
3月前
|
存储 Java
|
存储 Java
Serializable接口的意义和用法
Serializable接口的意义和用法
|
JSON Java 数据库连接
87. Java序列化和反序列化为什么要实现Serializable接口
87. Java序列化和反序列化为什么要实现Serializable接口
193 0
|
存储 Java Android开发
Parcelable与Serializable
跟大家分享一下Android的序列化
105 0
|
存储 缓存 算法
HttpServlet为什么要实现serializable?
HttpServlet为什么要实现serializable?
125 0
HttpServlet为什么要实现serializable?
|
存储 Java
【Java】Serializable序列化
Serializable序列化“持久化”意味着对象的“生存时间”并不取决于程序是否正在执行——它存在或“生存”于程序的每一次调用之间。通过序列化一个对象,将其写入磁盘,以后在程序再次调用时重新恢复那个对象,就能圆满实现一种“持久”效果。
162 0
|
算法 Java 安全
Serializable原理
序列化是将对象变为可传输内容的过程, 反序列化则是将可传输内容转化为对象的过程. Java原生序列化方式是通过实现Serializable接口实现的. 不实现该接口会导致无法序列化, 抛出异常如下: java.io.NotSerializableException 序列化的应用场景: 将对象转换为字节流, 用于网络传输, 例如用于RPC远程调用。
5080 0
|
Android开发 Java 存储
序列化Parcelable和Serializable的区别
Parcelable和Serializable有什么用,它们有什么差别? Parcelable和Serializable都可以实现序列化,使对象可以变为二进制流在内存中传输数据。
3159 0
|
图形学 程序员 存储