开发者社区> 问答> 正文

阿里云Elasticsearch支持的内置中文分词器

已解决

阿里云Elasticsearch支持的内置中文分词器

展开
收起
提个问题 2024-05-24 12:05:15 36 0
1 条回答
写回答
取消 提交回答
  • 开发者社区问答官方账号
    官方回答
    目前阿里云ES支持的内置中文分词器包括analysis-ikanalysis-aliws,您需要配置对应的词典即可使用。

    IK分词器有 ik_smart 和 ik_max_word两种模式,在使用IK分词器时需要指定一种tokenizer。
    区别如下:
    • ik_smart:分词的时候只分一次,句子里面的每个字只会出现一次。
    • ik_max_word:句子的字可以反复出现。 只要在词库里面出现过的 就拆分出来。如果没有出现的单字,已经在词里面出现过,那么这个就不会以单字的形势出现。

    2024-05-24 12:05:16
    赞同 2 展开评论 打赏
归属于问产品:
检索分析服务 Elasticsearch版
进入专区
问答排行榜
最热
最新

相关电子书

更多
阿里云Elasticsearch体系架构与特性解析 立即下载
开源与云:Elasticsearch应用剖析 立即下载
《Elasticsearch全观测解决方案》 立即下载