文档备案控制台

开发者社区阿里云支持与服务文章正文

同步Hive表数据报block文件不存在问题 java.io.FileNotFoundException: File does not exist

2022-12-01 1621

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 同步Hive表数据报block文件不存在问题 java.io.FileNotFoundException: File does not exist

问题描述

Hive Reader 配置readMode为hdfs方式的情况下同步Hive表数据报block文件不存在问题： java.io.FileNotFoundException: File does not exist: /user/hive/warehouse/...

问题原因

1、Hive Reader配置readMode为hdfs方式的时候，底层读取数据的方式是基于HDFS文件方式读取数据，会先在HDFS上根据表找到数据对应的Block块，然后同步。出现上面报错的原因是找到表数据对应的块的数据还没有进行同步的时候，客户侧有做表数据删除等变更操作，或者表数据块文件删除的操作都有可能导致HiveReader在读取块数据的时候发现块不存在了，然后报： File does not exist

2、出现这个报错的概率比较低，数据量少的时候，同步速度快基本不会有这个问题，数据量特别大，同步速度慢，同步过程中客户有对数据进行操作就有可能会造成这个问题。

解决方案

以HDFS模式同步的时候保证不对表数据做变更可以避免，其次就是修改readMode为JDBC模式，该模式Hive引擎底层可能会生成MapReduce任务效率比HDFS模式慢，但是不会出现上述数据文件找不到的问题。

适用范围

大数据开发治理平台 DataWorks

文章标签：

Java

分布式计算

SQL

HIVE

大数据

DataWorks

数据库连接

关键词：

Java File

文件io

io file

同步Java

文件Java

阿里云服务支持

目录

相关文章

路边两盏灯

|

9月前

|

Java 开发工具

【Azure Storage Account】Java Code访问Storage Account File Share的上传和下载代码示例

本文介绍如何使用Java通过azure-storage-file-share SDK实现Azure文件共享的上传下载。包含依赖引入、客户端创建及完整示例代码，助你快速集成Azure File Share功能。

路边两盏灯

617 6 6

AI小云

|

安全算法 Java

Java 多线程：线程安全与同步控制的深度解析

本文介绍了 Java 多线程开发的关键技术，涵盖线程的创建与启动、线程安全问题及其解决方案，包括 synchronized 关键字、原子类和线程间通信机制。通过示例代码讲解了多线程编程中的常见问题与优化方法，帮助开发者提升程序性能与稳定性。

AI小云

482 0 0

凉凉心.

|

9月前

|

Java Unix Go

【Java】（8）Stream流、文件File相关操作，IO的含义与运用

Java 为 I/O 提供了强大的而灵活的支持，使其更广泛地应用到文件传输和网络编程中。！但本节讲述最基本的和流与 I/O 相关的功能。我们将通过一个个例子来学习这些功能。

凉凉心.

348 1 1

蓝易云

|

监控 Java API

Java语言按文件创建日期排序及获取最新文件的技术

这段代码实现了文件创建时间的读取、文件列表的获取与排序以及获取最新文件的需求。它具备良好的效率和可读性，对于绝大多数处理文件属性相关的需求来说足够健壮。在实际应用中，根据具体情况，可能还需要进一步处理如访问权限不足、文件系统不支持某些属性等边界情况。

蓝易云

516 14 14

蓝易云

|

存储 Java 数据安全/隐私保护

Java技术栈揭秘：Base64加密和解密文件的实战案例

以上就是我们今天关于Java实现Base64编码和解码的实战案例介绍。希望能对你有所帮助。还有更多知识等待你去探索和学习，让我们一同努力，继续前行！

蓝易云

719 5 5

大数据文摘

|

存储 Java 编译器

深入理解Java虚拟机--类文件结构

本内容介绍了Java虚拟机与Class文件的关系及其内部结构。Class文件是一种与语言无关的二进制格式，包含JVM指令集、符号表等信息。无论使用何种语言，只要能生成符合规范的Class文件，即可在JVM上运行。文章详细解析了Class文件的组成，包括魔数、版本号、常量池、访问标志、类索引、字段表、方法表和属性表等，并说明其在Java编译与运行过程中的作用。

大数据文摘

355 0 0

大数据文摘

|

存储人工智能 Java

java之通过Http下载文件

本文介绍了使用Java实现通过文件链接下载文件到本地的方法，主要涉及URL、HttpURLConnection及输入输出流的操作。

大数据文摘

805 0 0

游客lijmi4663rgsa

|

前端开发 Cloud Native Java

Java||Springboot读取本地目录的文件和文件结构，读取服务器文档目录数据供前端渲染的API实现

博客不应该只有代码和解决方案，重点应该在于给出解决方案的同时分享思维模式，只有思维才能可持续地解决问题，只有思维才是真正值得学习和分享的核心要素。如果这篇博客能给您带来一点帮助，麻烦您点个赞支持一下，还可以收藏起来以备不时之需，有疑问和错误欢迎在评论区指出~

游客lijmi4663rgsa

970 1 1

Java||Springboot读取本地目录的文件和文件结构，读取服务器文档目录数据供前端渲染的API实现

游客kufrkwrbkmpsa

|

Java 数据库

【YashanDB知识库】kettle同步大表提示java内存溢出

在数据导入导出场景中，使用Kettle进行大表数据同步时出现“ERROR：could not create the java virtual machine!”问题，原因为Java内存溢出。解决方法包括：1) 编辑Spoon.bat增大JVM堆内存至2GB；2) 优化Kettle转换流程，如调整批量大小、精简步骤；3) 合理设置并行线程数(PARALLELISM参数)。此问题影响所有版本，需根据实际需求调整相关参数以避免内存不足。

游客kufrkwrbkmpsa

839 17 17

蓝易云

|

网络协议安全 Java

实现Java语言的文件断点续传功能的技术方案。

像这样，我们就完成了一项看似高科技、实则亲民的小工程。这样的技术实现不仅具备实用性，也能在面对网络不稳定的挑战时，稳稳地、不失乐趣地完成工作。

蓝易云

618 0 0

阿里云支持与服务

热门文章

最新文章

hive中将单行拆分成多行总结

Hive 行列转换

大数据新视界 --大数据大厂之Hive与大数据融合：构建强大数据仓库实战指南

DataGrip连接Hive执行DDL操作报错：「FAILED: ParseException line 1:5 cannot recognize input near 'show' 'indexes' 'on' in ddl statement」

hive分区与分桶

Hive实战(03)-深入了解Hive JDBC：在大数据世界中实现数据交互

java链接hive数据库实现增删改查操作

Hive 分析函数lead、lag实例应用

Hive 之 UDF 运用（包会的）

【Java】（8）Stream流、文件File相关操作，IO的含义与运用

02理解网络IO：实现服务与客户端通信

Go语言中的文件与IO：JSON、CSV、XML处理

Go语言中的文件与IO：bufio 和 scanner

Go语言中的文件与IO：文件读写

Linux的基础IO内容补充-FILE

掌握并发模型：深度揭露网络IO复用并发模型的原理。

【YashanDB知识库】个别数据库用户无法登录数据库，报错 io fail:IO.EOF

【YashanDB知识库】YashanDB JDBC驱动查询时抛出io fail：Read timed out异常

相关课程

更多

Java面试疑难点解析 - 面试技巧及语言基础

Java面试疑难点解析 - Java Web开发

Java面试疑难点解析 - 系统架构及项目设计

Java编程入门

Java面向对象编程

Java高级编程

相关电子书

更多

Spring Cloud Alibaba - 重新定义 Java Cloud-Native

The Reactive Cloud Native Arch

JAVA开发手册1.5.0

下一篇

一条命令迁移，帮你实现 OpenClaw 与 Hermes Agent 记忆互通！