JAVA—其他—Avro序列化

简介: Avro是hadoop的一个用于序列化的组件理解特点:1. 高效2. 序列化后体积小3. 动态 动态指的是数据的结构一旦定义,可以在多处语言生成实体类

Avro是hadoop的一个用于序列化的组件

理解特点:

  1. 高效
  2. 序列化后体积小
  3. 动态 动态指的是数据的结构一旦定义,可以在多处语言生成实体类

引用jar包

<properties>

       <maven.compiler.source>8</maven.compiler.source>

       <avro.version>1.10.2</avro.version>

   </properties>



   <dependencies>

       <dependency>

           <groupId>org.apache.avro</groupId>

           <artifactId>avro</artifactId>

           <version>${avro.version}</version>

       </dependency>

   </dependencies>

引用maven插件(如不生成代码可不必引用)

<!-- avro-maven-plugin -->

           <plugin>

               <groupId>org.apache.avro</groupId>

               <artifactId>avro-maven-plugin</artifactId>

               <version>${avro.version}</version>

               <executions>

                   <execution>

                       <phase>generate-sources</phase>

                       <goals>

                           <goal>schema</goal>

                       </goals>

                       <configuration>

                           <sourceDirectory>${project.basedir}/src/main/resources/avro/</sourceDirectory>

                           <outputDirectory>${project.build.directory}/generated/avro</outputDirectory>

                       </configuration>

                   </execution>

               </executions>

           </plugin>

插件中需要配置

  1. sourceDirectory: avro文件的目录,此处的avro文件也就是定义好的数据结构
  2. outputDirectory: 插件生成的实体存放的目录


1.快速使用


package com.zy.learn;


import com.zy.learn.avro.User;

import org.apache.avro.file.DataFileReader;

import org.apache.avro.file.DataFileWriter;

import org.apache.avro.generic.GenericDatumReader;

import org.apache.avro.generic.GenericRecord;

import org.apache.avro.io.DatumReader;

import org.apache.avro.io.DatumWriter;

import org.apache.avro.specific.SpecificDatumReader;

import org.apache.avro.specific.SpecificDatumWriter;


import java.io.File;

import java.io.IOException;


/**

* @Author: Zy

* @Date: 2021/10/26 9:30

* avro测试类

*/

public class AvroTest {

   /**

    * 测试序列化

    *

    * @author Zy

    * @date 2021/10/26

    */

   public static void testSerializing() throws IOException {

       User user1 = User.newBuilder()

               .setName("zy")

               .setFavoriteNumber(10)

               .setFavoriteColor("hhh")

               .build();


       DatumWriter<User> userDatumWriter = new SpecificDatumWriter<User>(User.class);

       DataFileWriter<User> dataFileWriter = new DataFileWriter<User>(userDatumWriter);

       dataFileWriter.create(user1.getSchema(), new File("users.avro"));

       dataFileWriter.append(user1);

       dataFileWriter.close();

   }


   /**

    * 反序列化

    * @author Zy

    * @date 2021/10/28

    */

   public static void testDeserializing() throws IOException {

       GenericDatumReader<GenericRecord> userDatumReader = new GenericDatumReader<>();

       DataFileReader<GenericRecord> dataFileReader = new DataFileReader<GenericRecord>(new File("users.avro"), userDatumReader);

       GenericRecord user = null;

       while (dataFileReader.hasNext()) {

           user = dataFileReader.next(user);

           System.out.println(user);

       }

   }


   public static void main(String[] args) throws IOException {

//        testSerializing();

       testDeserializing();

   }

}


说明:

avro序列化如果使用代码生成,生成了实体后就直接使用实体作为泛型序列化和反序列化即可 类似上文例子中的测试序列化中的写法

如果没有使用代码生成,则没有实体类,此时avro提供了一个公共的类可以作为泛型,GenericRecord

目录
相关文章
|
存储 Java
【IO面试题 四】、介绍一下Java的序列化与反序列化
Java的序列化与反序列化允许对象通过实现Serializable接口转换成字节序列并存储或传输,之后可以通过ObjectInputStream和ObjectOutputStream的方法将这些字节序列恢复成对象。
|
5月前
|
JSON 网络协议 安全
【Java】(10)进程与线程的关系、Tread类;讲解基本线程安全、网络编程内容;JSON序列化与反序列化
几乎所有的操作系统都支持进程的概念,进程是处于运行过程中的程序,并且具有一定的独立功能,进程是系统进行资源分配和调度的一个独立单位一般而言,进程包含如下三个特征。独立性动态性并发性。
286 1
|
5月前
|
JSON 网络协议 安全
【Java基础】(1)进程与线程的关系、Tread类;讲解基本线程安全、网络编程内容;JSON序列化与反序列化
几乎所有的操作系统都支持进程的概念,进程是处于运行过程中的程序,并且具有一定的独立功能,进程是系统进行资源分配和调度的一个独立单位一般而言,进程包含如下三个特征。独立性动态性并发性。
307 1
|
8月前
|
存储 安全 Java
深入理解Java序列化接口及其实现机制
记住,序列化不仅仅是把对象状态保存下来那么简单,它涉及到类的版本控制、安全性和性能等多个重要方面。正确理解和实现Java序列化机制对于构建高效、安全和可维护的Java应用至关重要。
272 0
|
9月前
|
JSON Java 数据库连接
|
JSON NoSQL Java
redis的java客户端的使用(Jedis、SpringDataRedis、SpringBoot整合redis、redisTemplate序列化及stringRedisTemplate序列化)
这篇文章介绍了在Java中使用Redis客户端的几种方法,包括Jedis、SpringDataRedis和SpringBoot整合Redis的操作。文章详细解释了Jedis的基本使用步骤,Jedis连接池的创建和使用,以及在SpringBoot项目中如何配置和使用RedisTemplate和StringRedisTemplate。此外,还探讨了RedisTemplate序列化的两种实践方案,包括默认的JDK序列化和自定义的JSON序列化,以及StringRedisTemplate的使用,它要求键和值都必须是String类型。
redis的java客户端的使用(Jedis、SpringDataRedis、SpringBoot整合redis、redisTemplate序列化及stringRedisTemplate序列化)
|
存储 安全 Java
🌟Java零基础-反序列化:从入门到精通
【10月更文挑战第21天】本文收录于「滚雪球学Java」专栏,专业攻坚指数级提升,希望能够助你一臂之力,帮你早日登顶实现财富自由🚀;同时,欢迎大家关注&&收藏&&订阅!持续更新中,up!up!up!!
350 5
|
存储 安全 Java
Java编程中的对象序列化与反序列化
【10月更文挑战第22天】在Java的世界里,对象序列化和反序列化是数据持久化和网络传输的关键技术。本文将带你了解如何在Java中实现对象的序列化与反序列化,并探讨其背后的原理。通过实际代码示例,我们将一步步展示如何将复杂数据结构转换为字节流,以及如何将这些字节流还原为Java对象。文章还将讨论在使用序列化时应注意的安全性问题,以确保你的应用程序既高效又安全。
|
存储 缓存 安全
🌟Java零基础:深入解析Java序列化机制
【10月更文挑战第20天】本文收录于「滚雪球学Java」专栏,专业攻坚指数级提升,希望能够助你一臂之力,帮你早日登顶实现财富自由🚀;同时,欢迎大家关注&&收藏&&订阅!持续更新中,up!up!up!!
257 3
|
Java 数据库 对象存储
Java 序列化详解
本文详细解析了Java序列化的概念与应用。通过具体实例,深入探讨了其在对象存储和传输中的作用及实现方法,帮助读者理解如何有效利用这一特性来简化数据交换,并对其实现机制有了更深入的认识。
298 9