请问,sr 2.3版本,导入遇到错误编码格式。 abortedTaskNum数一直上升,卡在当下的offset,不动了。 报错信息如下: Error: Data quality error: Failed to iterate document stream as object. error: The input is not valid UTF-8. Row: parser current location: {"uniid":"1d58cc41769d78cf2af98f19f68e47b4","uni_type":"imei","brand":"亿ç¾è®¯èå¼åç§ææéå ","model":"","os":"ANDROID","os_version":"4.1.0","user_category":null}
有办法跳过吗?
试试修改作业配置一个容错 ,max_error_number,如果你的版本比较低不支持修改的话,就需要取消掉这个任务,然后指定offset和配置容错后重新消费。此回答整理自钉群“EMR OLAP(ClickHouse&StarRocks) 用户技术交流群”
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
阿里云EMR是云原生开源大数据平台,为客户提供简单易集成的Hadoop、Hive、Spark、Flink、Presto、ClickHouse、StarRocks、Delta、Hudi等开源大数据计算和存储引擎,计算资源可以根据业务的需要调整。EMR可以部署在阿里云公有云的ECS和ACK平台。