【问题分类】数据导入导出
【关键字】数据同步,kettle,数据迁移,java 内存溢出
【问题描述】kettle 同步大表提示 ERROR:could not create the java virtual machine!
【问题原因分析】java 内存溢出
【解决/规避方法】
①增加 JVM 的堆内存大小。编辑 Spoon.bat,增加堆大小到 2GB,如:
if "%PENTAHO_DI_JAVA_OPTIONS%"=="" set PENTAHO_DI_JAVA_OPTIONS="-Xms512m" "-Xmx512m" "-XX:MaxPermSize=256m" "-Dsun.jnu.encoding=UTF8"
其中-Xms是初始堆大小,-Xmx是最大堆大小。
②优化 Kettle 转换。检查步骤是否有优化空间,例如通过调整批量大小、优化数据库查询、减少不必要的步骤等。
③通过 PARALLELISM 参数的值合理设置并行线程数,如:
time PENTAHO_DI_JAVA_OPTIONS=-DPARALLELISM=4 sh /home/kettle/data-integration/pan.sh -file=/home/kettle/data-integration/test/dir_ktr1/public.T1.k
tr > /home/kettle/data-integration/test/logs1/public.T1.log
【影响范围】所有版本
【修复版本】-