文件可以细分为本地文件、可执行文件和远程文件三类,他们是最易使用且最为直接的数据源,非常适合在静态数据这类场合中使用。
本地文件
本地文件使用 file
元素定义。其中, path
表示数据文件的绝对路径,而 format
表示数据格式,例如 CSV
或者 TabSeparated
等。它的完整配置如下所示。
<source> <file> <path>/var/lib/clickhouse/dictionaries_lib/organization.csv</path> <format>CSV</format> </file> </source>点击复制复制失败已复制
可执行文件
可执行文件数据源属于本地文件的变种,它需要通过 cat
命令访问数据文件。对于 cache
和 complex_key_cache
类型的字典,必须使用此类型的文件数据源。可执行文件使用 executable
元素定义。其中, command
表示数据文件的绝对路径, format
表示数据格式,例如 CSV
或者 TabSeparated
等。它的完整配置如下所示:
<source> <executable> <command>cat /var/lib/clickhouse/dictionaries_lib/organization.csv</command> <format>CSV</format> </executable> </source>点击复制复制失败已复制
远程文件
远程文件与可执行文件类似,只是它将 cat
命令替换成了 post
请求,支持 HTTP
与 HTTPS
协议。远程文件使用 http
元素定义。其中, url
表示远程数据的访问地址, format
表示数据格式,例如 CSV
或者 TabSeparated
。它的完整配置如下所示:
<source> <http> <url>http://file.virtualbing.fun/organization.csv</url> <format>CSV</format> </http> </source>