知识分享之Golang——Bleve专用术语

简介: 知识分享之Golang篇是我在日常使用Golang时学习到的各种各样的知识的记录,将其整理出来以文章的形式分享给大家,来进行共同学习。欢迎大家进行持续关注。知识分享系列目前包含Java、Golang、Linux、Docker等等。

知识分享之Golang——Bleve专用术语

背景

知识分享之Golang篇是我在日常使用Golang时学习到的各种各样的知识的记录,将其整理出来以文章的形式分享给大家,来进行共同学习。欢迎大家进行持续关注。

知识分享系列目前包含Java、Golang、Linux、Docker等等。

开发环境

内容

Bleve专用术语:

Analyzer

Analyzer分析器将输入文本转换为Token Stream令牌流。分析器由一个或多个组成部件组成一个管道。 该管道由零个或多个 Character Filters组成, 后面跟着一个 Tokenizer, 后面跟着零或更多 Token Filters。通过该流水线运行输入文本以生成所生成的令牌流Token Stream(令牌流).

Character Filter

Character Filter字符过滤器处理输入文本以删除不需要的字符。 例如,如果您的输入文档是HTML页面,您可以使用一个字符来删除HTML标记。有时,字符过滤器会用空格替换输入字符,以避免干扰剩余文本的原始字节偏移量。

Term

term 是一个统一特征字符序列。“term”这个词通常是用来描述我们写入索引的东西或者我们在索引中寻找的东西。例如,文本“mary had a little lamb”可能会导致索引中插入3个术语:“mary”、“little”和“lamb”。

Token

令牌是在文档或字段的特定位置出现的term

Tokenizer

分词器接受输入Text并将其拆分为一个或多个Tokens。对于自然语言来说,通常希望按词的边界进行分割。

Token Filter

token filter处理token流中的每个令牌,并产生另一个令牌流。这可以是未修改的原始流(original stream unmodified),也可以添加、修改和删除标记。

Token Stream

token stream令牌流是一系列的 Tokens.

Text

Text是统一特征字符序列的通用术语。通常,单词“text”是为字符还没有被分析的用例保留的。我们从输入文本开始,然后分析它以生成要存储在索引中的术语。

本文声明:

5330898-d1c72b6c90e378f3.png
知识共享许可协议
本作品由 cn華少 采用 知识共享署名-非商业性使用 4.0 国际许可协议 进行许可。

目录
相关文章
|
自然语言处理 Java Linux
知识分享之Golang——Bleve中的Token filters各种标记过滤器
知识分享之Golang篇是我在日常使用Golang时学习到的各种各样的知识的记录,将其整理出来以文章的形式分享给大家,来进行共同学习。欢迎大家进行持续关注。 知识分享系列目前包含Java、Golang、Linux、Docker等等。
130 0
知识分享之Golang——Bleve中的Token filters各种标记过滤器
|
自然语言处理 Java Linux
知识分享之Golang——Bleve中的字符过滤器和分词规则
知识分享之Golang篇是我在日常使用Golang时学习到的各种各样的知识的记录,将其整理出来以文章的形式分享给大家,来进行共同学习。欢迎大家进行持续关注。 知识分享系列目前包含Java、Golang、Linux、Docker等等。
217 0
知识分享之Golang——Bleve中的字符过滤器和分词规则
|
Java Linux Go
知识分享之Golang——Bleve中的Text Analysis简单了解
知识分享之Golang篇是我在日常使用Golang时学习到的各种各样的知识的记录,将其整理出来以文章的形式分享给大家,来进行共同学习。欢迎大家进行持续关注。 知识分享系列目前包含Java、Golang、Linux、Docker等等。
258 0
知识分享之Golang——Bleve中的Text Analysis简单了解
|
Java Linux Go
知识分享之Golang——Bleve中提供的各类搜索方法(一)
知识分享之Golang篇是我在日常使用Golang时学习到的各种各样的知识的记录,将其整理出来以文章的形式分享给大家,来进行共同学习。欢迎大家进行持续关注。 知识分享系列目前包含Java、Golang、Linux、Docker等等。
256 0
知识分享之Golang——Bleve中提供的各类搜索方法(一)
|
存储 Java Linux
知识分享之Golang——Bleve中如何定义一个自定义文档映射对象
知识分享之Golang篇是我在日常使用Golang时学习到的各种各样的知识的记录,将其整理出来以文章的形式分享给大家,来进行共同学习。欢迎大家进行持续关注。 知识分享系列目前包含Java、Golang、Linux、Docker等等。
120 0
知识分享之Golang——Bleve中如何定义一个自定义文档映射对象
|
3月前
|
Go
Golang语言之管道channel快速入门篇
这篇文章是关于Go语言中管道(channel)的快速入门教程,涵盖了管道的基本使用、有缓冲和无缓冲管道的区别、管道的关闭、遍历、协程和管道的协同工作、单向通道的使用以及select多路复用的详细案例和解释。
140 4
Golang语言之管道channel快速入门篇
|
3月前
|
Go
Golang语言文件操作快速入门篇
这篇文章是关于Go语言文件操作快速入门的教程,涵盖了文件的读取、写入、复制操作以及使用标准库中的ioutil、bufio、os等包进行文件操作的详细案例。
71 4
Golang语言文件操作快速入门篇
|
3月前
|
Go
Golang语言之gRPC程序设计示例
这篇文章是关于Golang语言使用gRPC进行程序设计的详细教程,涵盖了RPC协议的介绍、gRPC环境的搭建、Protocol Buffers的使用、gRPC服务的编写和通信示例。
112 3
Golang语言之gRPC程序设计示例
|
3月前
|
安全 Go
Golang语言goroutine协程并发安全及锁机制
这篇文章是关于Go语言中多协程操作同一数据问题、互斥锁Mutex和读写互斥锁RWMutex的详细介绍及使用案例,涵盖了如何使用这些同步原语来解决并发访问共享资源时的数据安全问题。
100 4
|
3月前
|
Go 调度
Golang语言goroutine协程篇
这篇文章是关于Go语言goroutine协程的详细教程,涵盖了并发编程的常见术语、goroutine的创建和调度、使用sync.WaitGroup控制协程退出以及如何通过GOMAXPROCS设置程序并发时占用的CPU逻辑核心数。
72 4
Golang语言goroutine协程篇