开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 正文

从FTP中同步数据,提示PREVIEW_TABLE_DATA_ERROR,如何处理?

从FTP中同步数据,提示PREVIEW_TABLE_DATA_ERROR,如何处理?

展开
收起
cuicuicuic 2023-04-19 21:40:41 164 0
2 条回答
写回答
取消 提交回答
  • 公众号:网络技术联盟站,InfoQ签约作者,阿里云社区签约作者,华为云 云享专家,BOSS直聘 创作王者,腾讯课堂创作领航员,博客+论坛:https://www.wljslmz.cn,工程师导航:https://www.wljslmz.com

    在使用阿里云DataWorks进行从FTP中同步数据时,如果出现 "PREVIEW_TABLE_DATA_ERROR" 的错误提示,可能是由于以下原因导致的:

    1. FTP文件格式与DataWorks中定义的格式不匹配:在使用DataWorks进行FTP文件同步时,需要提前设置文件格式,例如CSV或XLSX格式等。如果同步时FTP文件格式与DataWorks设置的格式不匹配,就会导致 "PREVIEW_TABLE_DATA_ERROR" 的错误。您可以检查FTP文件的格式是否正确,或者修改DataWorks中的文件格式设置。

    2. 数据源中存在无法识别的特殊字符:如果FTP文件中存在一些DataWorks无法识别的特殊字符,也会导致同步过程中出现错误。您可以检查FTP文件中是否存在特殊字符,或者在DataWorks中对特殊字符进行处理。

    3. FTP连接信息设置错误:在DataWorks中需要设置FTP连接信息,包括FTP服务器地址、用户名、密码等。如果该信息设置不正确,则会导致FTP文件同步失败。您可以检查FTP连接信息设置是否正确、FTP服务是否稳定,或者尝试重新设置。

    4. FTP文件不存在或者无法访问:如果FTP文件不存在或者由于网络原因无法访问,也会导致同步失败。您可以检查FTP文件是否存在,或者在DataWorks中进行重试。

    2023-04-30 23:16:41
    赞同 展开评论 打赏
  • FTP Reader为您提供读取远程FTP文件系统数据存储的功能。在底层实现上,FTP Reader获取远程FTP文件数据,并转换为数据同步传输协议传递给Writer。本地文件内容存放的是一张逻辑意义上的二维表,例如CSV格式的文本信息。FTP Reader实现了从远程FTP文件读取数据并转为数据同步协议的功能,远程FTP文件本身是无结构化数据存储。对于数据同步而言,目前FTP Reader支持的功能如下所示:支持且仅支持读取TXT的文件,并要求TXT中的schema为一张二维表。支持类CSV格式文件,自定义分隔符。支持多种类型数据读取(使用STRING表示)、支持列裁剪和列常量。支持递归读取、支持文件名过滤。支持文本压缩,现有压缩格式为gzip、bzip2、zip、lzo和lzo_deflate。多个File可以支持并发读取。暂时不支持以下功能:单个File支持多线程并发读取,此处涉及到单个File内部切分算法。单个File在压缩情况下,从技术上无法支持多线程并发读取。 https://help.aliyun.com/document_detail/137728.html,此回答整理自钉群“DataWorks交流群(答疑@机器人)”

    2023-04-20 08:03:31
    赞同 展开评论 打赏

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

热门讨论

热门文章

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载