java实现文件分片上传并且断点续传

本文涉及的产品
云数据库 Redis 版,社区版 2GB
推荐场景:
搭建游戏排行榜
简介: 针对第一个问题,如果文件过大,上传到一半断开了,若重新开始上传的话,会很消耗时间,并且你也并不知道距离上次断开时,已经上传到哪一部分了。因此我们应该先对大文件进行分片处理,防止上面提到的问题。

一、简单的分片上传
针对第一个问题,如果文件过大,上传到一半断开了,若重新开始上传的话,会很消耗时间,并且你也并不知道距离上次断开时,已经上传到哪一部分了。因此我们应该先对大文件进行分片处理,防止上面提到的问题。
前端代码:
html复制代码<!DOCTYPE html>













ps:以上代码使用了html+js完成,请求是使用了xhr来发送请求。其中xhr.open的地址为自己本地的接口地址。由于平时测试并不需要真正上传大型文件,所以每个分片的大小定义为10KB,以此模拟大文件上传。
后端代码:
java复制代码@RestController
@RequestMapping("/file")
public class FileController {
@Autowired
private ResourceLoader resourceLoader;

@Value("${my.config.savePath}")
private String uploadPath;

private Map<String, List<File>> chunksMap = new ConcurrentHashMap<>();

@PostMapping("/upload")
public void upload(@RequestParam int currentChunk, @RequestParam int totalChunks,
                   @RequestParam MultipartFile chunk,@RequestParam String fileName) throws IOException {

    // 将分片保存到临时文件夹中
    String chunkName = chunk.getOriginalFilename() + "." + currentChunk;
    File chunkFile = new File(uploadPath, chunkName);
    chunk.transferTo(chunkFile);

    // 记录分片上传状态
    List<File> chunkList = chunksMap.get(fileName);
    if (chunkList == null) {
        chunkList = new ArrayList<>(totalChunks);
        chunksMap.put(fileName, chunkList);
    }
    chunkList.add(chunkFile);
}

@PostMapping("/merge")
public String merge(@RequestParam String fileName) throws IOException {

    // 获取所有分片,并按照分片的顺序将它们合并成一个文件
    List<File> chunkList = chunksMap.get(fileName);
    if (chunkList == null || chunkList.size() == 0) {
        throw new RuntimeException("分片不存在");
    }

    File outputFile = new File(uploadPath, fileName);
    try (FileChannel outChannel = new FileOutputStream(outputFile).getChannel()) {
        for (int i = 0; i < chunkList.size(); i++) {
            try (FileChannel inChannel = new FileInputStream(chunkList.get(i)).getChannel()) {
                inChannel.transferTo(0, inChannel.size(), outChannel);
            }
            chunkList.get(i).delete(); // 删除分片
        }
    }

    chunksMap.remove(fileName); // 删除记录
    // 获取文件的访问URL
    Resource resource = 
                resourceLoader.getResource("file:" + uploadPath + fileName); //由于是本地文件,所以开头是"file",如果是服务器,请改成自己服务器前缀
    return resource.getURI().toString();
}

}

ps: 使用一个map记录上传了哪些分片,这里将分片存在了本地的文件夹,等到分片都上传完成后合并并删除分片。用ConcurrentHashMap代替HashMap是因为它在多线程下是安全的。
以上只是一个简单的文件上传代码,但是只要在这上面另做修改就可以解决上面提到的问题。
二、解决问题

  1. 怎么避免大量的硬盘读写
    上面代码有一个弊端,就是将分片的内容存在了本地的文件夹里。而且在合并的时候判断上传是否完全也是从文件夹读取文件的。对磁盘的大量读写操作不仅速度慢,还会导致服务器崩溃,因此下面代码使用了redis来存储分片信息,避免对磁盘过多读写。(你也可以使用mysql或者其他中间件来存储信息,由于读写尽量不要在mysql,所以我使用了redis)。
    2.目标文件过大,如果在上传过程中断开了怎么办
    使用redis来存储分片内容,当断开后,文件信息还是存储在redis中,用户再次上传时,检测redis是否有该分片的内容,如果有则跳过。
  2. 前端页面上传的文件数据与原文件数据不一致该如何发现
    前端在调用上传接口时,先计算文件的校验和,然后将文件和校验和一并传给后端,后端对文件再计算一次校验和,两个校验和进行对比,如果相等,则说明数据一致,如果不一致则报错,让前端重新上传该片段。
    js计算校验和代码:
    js复制代码 // 计算文件的 SHA-256 校验和
    function calculateHash(fileChunk) {
     return new Promise((resolve, reject) => {
         const blob = new Blob([fileChunk]);
         const reader = new FileReader();
         reader.readAsArrayBuffer(blob);
         reader.onload = () => {
             const arrayBuffer = reader.result;
             const crypto = window.crypto || window.msCrypto;
             const digest = crypto.subtle.digest("SHA-256", arrayBuffer);
             digest.then(hash => {
                 const hashArray = Array.from(new Uint8Array(hash));
                 const hashHex = hashArray.map(b => b.toString(16).padStart(2, '0')).join('');
                 resolve(hashHex);
             });
         };
         reader.onerror = () => {
             reject(new Error('Failed to calculate hash'));
         };
     });
    
    }

java复制代码 public static String calculateHash(byte[] fileChunk) throws Exception {
MessageDigest md = MessageDigest.getInstance("SHA-256");
md.update(fileChunk);
byte[] hash = md.digest();
ByteBuffer byteBuffer = ByteBuffer.wrap(hash);
StringBuilder hexString = new StringBuilder();
while (byteBuffer.hasRemaining()) {
hexString.append(String.format("%02x", byteBuffer.get()));
}
return hexString.toString();
}

注意点:

这里前端和后端计算校验和的算法一定要是一致的,不然得不到相同的结果。
在前端中使用了crypto对文件进行计算,需要引入相关的js。
你可以使用script引入也可以直接下载js

html复制代码

crypto的下载地址 如果github打不开,可能需要使用npm下载了

  1. 上传过程中如果断开了应该如何判断哪些分片没有上传
    对redis检测哪个分片的下标不存在,若不存在则存入list,最后将list返回给前端
    java复制代码 boolean allChunksUploaded = true;
    List missingChunkIndexes = new ArrayList<>();
    for (int i = 0; i < hashMap.size(); i++) {
      if (!hashMap.containsKey(String.valueOf(i))) {
          allChunksUploaded = false;
          missingChunkIndexes.add(i);
      }
    
    }
    if (!allChunksUploaded) {
      return ResponseEntity.status(HttpStatus.BAD_REQUEST).body(missingChunkIndexes);
    
    }

三、完整代码
1、引入依赖
xml复制代码
io.lettuce
lettuce-core
6.1.4.RELEASE


org.springframework.boot
spring-boot-starter-data-redis

lettuce是一个Redis客户端,你也可以不引入,直接使用redisTemplat就行了
2、前端代码
html复制代码<!DOCTYPE html>













3、后端接口代码
java复制代码@RestController
@RequestMapping("/file2")
public class File2Controller {

private static final String FILE_UPLOAD_PREFIX = "file_upload:";

@Autowired
private ResourceLoader resourceLoader;

@Value("${my.config.savePath}")
private String uploadPath;
@Autowired
private ThreadLocal<RedisConnection> redisConnectionThreadLocal;

// @Autowired
// private RedisTemplate redisTemplate;

@PostMapping("/upload")
public ResponseEntity<?> uploadFile(@RequestParam("chunk") MultipartFile chunk,
                                    @RequestParam("chunkIndex") Integer chunkIndex,
                                    @RequestParam("chunkSize") Integer chunkSize,
                                    @RequestParam("chunkChecksum") String chunkChecksum,
                                    @RequestParam("fileId") String fileId) throws Exception {
    if (StringUtils.isBlank(fileId) || StringUtils.isEmpty(fileId)) {
        fileId = UUID.randomUUID().toString();
    }
    String key = FILE_UPLOAD_PREFIX + fileId;
    byte[] chunkBytes = chunk.getBytes();
    String actualChecksum = calculateHash(chunkBytes);
    if (!chunkChecksum.equals(actualChecksum)) {
        return ResponseEntity.status(HttpStatus.BAD_REQUEST).body("Chunk checksum does not match");
    }

// if(!redisTemplate.opsForHash().hasKey(key,String.valueOf(chunkIndex))) {
// redisTemplate.opsForHash().put(key, String.valueOf(chunkIndex), chunkBytes);
// }
RedisConnection connection = redisConnectionThreadLocal.get();

    Boolean flag = connection.hExists(key.getBytes(), String.valueOf(chunkIndex).getBytes());
    if (flag==null || flag == false) {
        connection.hSet(key.getBytes(), String.valueOf(chunkIndex).getBytes(), chunkBytes);
    }

    return ResponseEntity.ok(fileId);

}

public static String calculateHash(byte[] fileChunk) throws Exception {
    MessageDigest md = MessageDigest.getInstance("SHA-256");
    md.update(fileChunk);
    byte[] hash = md.digest();
    ByteBuffer byteBuffer = ByteBuffer.wrap(hash);
    StringBuilder hexString = new StringBuilder();
    while (byteBuffer.hasRemaining()) {
        hexString.append(String.format("%02x", byteBuffer.get()));
    }
    return hexString.toString();
}

@PostMapping("/merge")
public ResponseEntity<?> mergeFile(@RequestParam("fileId") String fileId, @RequestParam("fileName") String fileName) throws IOException {
    String key = FILE_UPLOAD_PREFIX + fileId;
    RedisConnection connection = redisConnectionThreadLocal.get();
    try {
        Map<byte[], byte[]> chunkMap = connection.hGetAll(key.getBytes());

// Map chunkMap = redisTemplate.opsForHash().entries(key);
if (chunkMap.isEmpty()) {
return ResponseEntity.status(HttpStatus.NOT_FOUND).body("File not found");
}

        Map<String,byte[]> hashMap = new HashMap<>();
        for(Map.Entry<byte[],byte[]> entry :chunkMap.entrySet()){
            hashMap.put((new String(entry.getKey())),entry.getValue());
        }
        // 检测是否所有分片都上传了
        boolean allChunksUploaded = true;
        List<Integer> missingChunkIndexes = new ArrayList<>();
        for (int i = 0; i < hashMap.size(); i++) {
            if (!hashMap.containsKey(String.valueOf(i))) {
                allChunksUploaded = false;
                missingChunkIndexes.add(i);
            }
        }
        if (!allChunksUploaded) {
            return ResponseEntity.status(HttpStatus.BAD_REQUEST).body(missingChunkIndexes);
        }

        File outputFile = new File(uploadPath, fileName);
        boolean flag = mergeChunks(hashMap, outputFile);
        Resource resource = resourceLoader.getResource("file:" + uploadPath + fileName);


        if (flag == true) {
            connection.del(key.getBytes());

// redisTemplate.delete(key);
return ResponseEntity.ok().body(resource.getURI().toString());
} else {
return ResponseEntity.status(555).build();
}
} catch (Exception e) {
e.printStackTrace();
return ResponseEntity.status(HttpStatus.INTERNAL_SERVER_ERROR).body(e.getMessage());
}
}

private boolean mergeChunks(Map<String, byte[]> chunkMap, File destFile) {
    try (FileOutputStream outputStream = new FileOutputStream(destFile)) {
        // 将分片按照顺序合并
        for (int i = 0; i < chunkMap.size(); i++) {
            byte[] chunkBytes = chunkMap.get(String.valueOf(i));
            outputStream.write(chunkBytes);
        }
        return true;
    } catch (IOException e) {
        e.printStackTrace();
        return false;
    }
}

}

4、redis配置
java复制代码@Configuration
public class RedisConfig {
@Value("${spring.redis.host}")
private String host;

@Value("${spring.redis.port}")
private int port;

@Value("${spring.redis.password}")
private String password;

@Bean
public RedisConnectionFactory redisConnectionFactory() {
    RedisStandaloneConfiguration config = new RedisStandaloneConfiguration();
    config.setHostName(host);
    config.setPort(port);
    config.setPassword(RedisPassword.of(password));
    return new LettuceConnectionFactory(config);
}
@Bean
public ThreadLocal<RedisConnection> redisConnectionThreadLocal(RedisConnectionFactory redisConnectionFactory) {
    return ThreadLocal.withInitial(() -> redisConnectionFactory.getConnection());
}

}

使用 redisConnectionThreadLocal 是为了避免多次建立连接,很耗时间
总结
以上就是该功能的完整代码。使用代码记得修改uploadPath,避免代码找不到目录路径。在代码最后,可以使用mysql对整个文件计算校验和,将校验和结果和文件名、文件大小、文件类型存入数据库中,在下次大文件上传前先判断是否存在。若存在就不要上传避免占用空间。

相关实践学习
基于Redis实现在线游戏积分排行榜
本场景将介绍如何基于Redis数据库实现在线游戏中的游戏玩家积分排行榜功能。
云数据库 Redis 版使用教程
云数据库Redis版是兼容Redis协议标准的、提供持久化的内存数据库服务,基于高可靠双机热备架构及可无缝扩展的集群架构,满足高读写性能场景及容量需弹性变配的业务需求。 产品详情:https://www.aliyun.com/product/kvstore &nbsp; &nbsp; ------------------------------------------------------------------------- 阿里云数据库体验:数据库上云实战 开发者云会免费提供一台带自建MySQL的源数据库&nbsp;ECS 实例和一台目标数据库&nbsp;RDS实例。跟着指引,您可以一步步实现将ECS自建数据库迁移到目标数据库RDS。 点击下方链接,领取免费ECS&amp;RDS资源,30分钟完成数据库上云实战!https://developer.aliyun.com/adc/scenario/51eefbd1894e42f6bb9acacadd3f9121?spm=a2c6h.13788135.J_3257954370.9.4ba85f24utseFl
相关文章
|
6天前
|
分布式计算 DataWorks Java
DataWorks操作报错合集之在使用MaxCompute的Java SDK创建函数时,出现找不到文件资源的情况,是BUG吗
DataWorks是阿里云提供的一站式大数据开发与治理平台,支持数据集成、数据开发、数据服务、数据质量管理、数据安全管理等全流程数据处理。在使用DataWorks过程中,可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。
20 0
|
2天前
|
Oracle Java 关系型数据库
windows 下 win11 JDK17安装与环境变量的配置(配置简单详细,包含IJ中java文件如何使用命令运行)
本文介绍了Windows 11中安装JDK 17的步骤,包括从官方网站下载JDK、配置环境变量以及验证安装是否成功。首先,下载JDK 17的安装文件,如果没有Oracle账户,可以直接解压缩文件到指定目录。接着,配置系统环境变量,新建`JAVA_HOME`变量指向JDK安装路径,并在`Path`变量中添加。然后,通过命令行(cmd)验证安装,分别输入`java -version`和`javac -version`检查版本信息。最后,作者分享了如何在任意位置运行Java代码,包括在IntelliJ IDEA(IJ)中创建的Java文件,只需去掉包声明,就可以通过命令行直接运行。
21 0
|
4天前
|
存储 监控 Java
如何在Java中实现等待文件修改后再读取数据的功能?
如何在Java中实现等待文件修改后再读取数据的功能?
11 0
|
4天前
|
存储 Java 数据格式
Java实战:轻松掌握文件重命名与路径提取技巧
Java实战:轻松掌握文件重命名与路径提取技巧
12 0
|
4天前
|
Java
如何解决使用若依前后端分离打包部署到服务器上后主包无法找到从包中的文件的问题?如何在 Java 代码中访问 jar 包中的资源文件?
如何解决使用若依前后端分离打包部署到服务器上后主包无法找到从包中的文件的问题?如何在 Java 代码中访问 jar 包中的资源文件?
19 0
|
7天前
|
存储 Java Linux
【Java EE】 文件IO的使用以及流操作
【Java EE】 文件IO的使用以及流操作
|
8天前
|
存储 缓存 安全
【专栏】如何在 Java 中创建临时文件?
【4月更文挑战第28天】本文介绍了Java中创建临时文件的两种方法:使用`File.createTempFile`和自定义创建。`File.createTempFile`能生成唯一文件名,但默认不自动删除;自定义创建则提供更大灵活性,但需手动管理。临时文件常用于数据缓存、文件上传下载和日志记录,使用时需注意文件清理、唯一性和权限设置。
|
1天前
|
Java
Java中的多线程编程:基础知识与实践
【5月更文挑战第5天】在现代软件开发中,多线程编程是一个重要的概念,尤其是在Java这样的多平台、高性能的编程语言中。通过多线程,我们可以实现并行处理,提高程序的运行效率。本文将介绍Java中多线程编程的基础知识,包括线程的概念、创建和控制方法,以及一些常见的多线程问题和解决方案。
|
4天前
|
存储 缓存 前端开发
Java串口通信技术探究3:RXTX库线程 优化系统性能的SerialPortEventListener类
Java串口通信技术探究3:RXTX库线程 优化系统性能的SerialPortEventListener类
20 3
|
4天前
|
Java
JAVA难点包括异常处理、多线程、泛型和反射,以及复杂的分布式系统知识
JAVA难点包括异常处理、多线程、泛型和反射,以及复杂的分布式系统知识。入坑JAVA因它的面向对象特性、平台无关性、强大的标准库和活跃的社区支持。
18 2