开发者社区> 问答> 正文

ElasticSearch所支持动态更新及词典差异性

已解决

ElasticSearch所支持动态更新及词典差异性

展开
收起
提个问题 2024-06-12 17:13:13 13 0
1 条回答
写回答
取消 提交回答
  • 开发者社区问答官方账号
    官方回答
    采纳回答
    阿里云ElasticSearch产品支持同义词、IK冷热词典、停用词词典、analysis-aliws词典的上传更新,其他词典内容不支持:
    1. 同义词表达式支持Solr规则和WordNet规则),保存为UTF-8编码的TXT文件,在控制台上传即可,详情请参考文档
        提示: 
    •     阿里云es没有自带的同义词插件,但支持第三方插件调用远程同义词词典(如elasticsearch-analysis-dynamic-synonym插件),详见请参考文档
    •      同义词上传更新均会触发重启(包括控制台和UpdateSynonymsDicts接口更新),可以参考上述同义词动态更新实践。
    2. IK冷热词典及停用词典文件需保存为UTF-8编码的.dic的文件,请参考上传更新;不支持动态词典更新及调用其他服务上的词典,建议使用UpdateHotIkDicts接口及oss域名实现远程词典调用或自定义插件,自定义插件调用词典仅支持同es可用区下的oss私网地址。
        提示:
    • UpdateHotIkDicts接口传参sourceType,第一次使用OSS类型上传词典文件,后续更新词典文件类型使用ORIGIN进行更新词库即可。
      若之前已经完成上传的词典不加ORIGIN进行配置,会被系统删除。
    3. AliNLP分词插件需保存为aliws_ext_dict.txt文件进行上传,详情请参考文档
        提示:
    • IK和AliNLP仅支持在阿里云es实例控制台配置oss方式实现远程词典调用,其他方式不支持。
    • 除IK热更新词典,配置其他词典会触发集群重启,IK热更新首次触发重启,之后更新同名词典底层不会触发重启。
    • ik词典对词典文件的大小和个数也做了一定的限制,单个文件最大为100M,所有文件最大为200M,上传文件总数最多为50个。
    • 词典的更新不会额外收取费用。
    4. 5.x版本和8.x版本实例暂不支持安装analysis-aliws插件,请以控制台为准。

    2024-06-12 17:13:14
    赞同 1 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
开源与云:Elasticsearch应用剖析 立即下载
《Elasticsearch全观测解决方案》 立即下载
Elasticsearch全观测技术解析与应用(构建日志、指标、APM统一观测平台) 立即下载