请教一下各位大佬flink-helm-chart里面的values.yaml配置文件怎么修改有人知道吗?
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
在使用 flink-helm-chart
部署 Flink 作业时,values.yaml
文件是 Helm Chart 的核心配置文件,用于定义 Flink 集群的部署参数。以下是针对 values.yaml
文件修改的详细指导,结合您提供的知识库资料和 Flink 实时计算的相关配置要求进行说明。
基础配置部分主要用于定义 Flink 集群的核心参数,例如镜像、资源分配等。以下是一些关键字段及其作用:
image: 指定 Flink 镜像的名称和版本。
image:
repository: flink
tag: 1.15.0
pullPolicy: IfNotPresent
IfNotPresent
或 Always
。jobManager 和 taskManager: 定义 JobManager 和 TaskManager 的资源配置。
jobManager:
replicas: 1
resources:
limits:
cpu: "1"
memory: "2Gi"
taskManager:
replicas: 2
resources:
limits:
cpu: "2"
memory: "4Gi"
运行参数配置部分用于定义 Flink 作业的运行时参数,例如并行度、状态后端等。以下是一些常见配置项:
parallelism: 设置 Flink 作业的默认并行度。
parallelism: 4
state.backend: 配置状态后端存储类型(如 RocksDB 或 Gemini)。
state:
backend: gemini
gemini:
kvSeparateValueSizeThreshold: 200
autoTuneMode: ACTIVE
ACTIVE
。checkpointing: 配置检查点相关参数。
checkpointing:
interval: 60000
timeout: 300000
mode: EXACTLY_ONCE
EXACTLY_ONCE
和 AT_LEAST_ONCE
。日志配置部分用于定义 Flink 集群的日志输出行为,确保作业运行时的日志能够被正确记录和查看。
logger: 控制台是否显示数据结果。
logger:
enabled: true
printIdentifier: "flink-job-log"
false
。logLevel: 设置日志级别。
logLevel: INFO
如果您的 Flink 作业涉及数据摄入(如从 MySQL 同步到 Hologres),需要在 values.yaml
中添加数据源和目标端的配置。
source: 数据源配置。
source:
type: mysql
hostname: localhost
port: 3306
username: username
password: password
tables: holo_test.\.*
scanBinlogNewlyAddedTableEnabled: true
false
。sink: 数据目标端配置。
sink:
type: hologres
endpoint: ****.hologres.aliyuncs.com:80
dbname: cdcyaml_test
username: ${secret_values.holo-username}
password: ${secret_values.holo-password}
excludeSchemaChanges: [drop, truncate.table]
autoTuneMode
参数。scan.newly-added-table.enabled
参数,并避免同时开启 scan.binlog.newly-added-table.enabled
和 scan.newly-added-table.enabled
。通过以上配置,您可以根据实际需求灵活调整 values.yaml
文件,确保 Flink 集群的高效运行和作业的稳定执行。如果有进一步的问题,请随时补充说明!
实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。