Recoll:Unix和Linux桌面的文本搜索工具

简介:

Recoll是一个Unix和Linux桌面的文本搜索工具。Recoll可以搜索文件名和文件内的关键字。

Recoll可以为你做到以下这些。

  • 它可以搜索任何格式的文件
  • 支持通配符
  • 可以依据文件的作者、类型、大小和格式等条件进行搜索
  • 可以搜索存储在任何位置的文件,例如文件、归档文件、邮件附件等
  • 支持桌面和网站集成
  • 具备火狐插件,可索引web页的历史
  • 点击一下搜索结果就可以在本地编辑器内打开或者显示文本预览
  • 它是免费的开源的,在GPL许可下发布

在Ubuntu/Linux Mint上安装Recoll

Recoll在Ubuntu仓库里可以找到。然而,最好添加Recoll的仓库以便安装最新版本。

使用以下命令添加Recoll仓库:

sudo add-apt-repository

使用命令更新软件列表:

sudo apt-get update

现在就可以使用下面的命令安装Recoll。

sudo apt-get install recoll

对于其它的发行版,可以去下载页面下载源代码并编译安装。

启动Recoll

Recoll可以从Dash或者菜单中启动。

第一次启动时,你需要索引整个home目录。依据你 home 目录里储存的东西的多少,需要的时间不等。按下Start indexing now按钮开始索引。

假如你想更多的自定义索引,可以调整索引配置和索引计划。要做到这一点,只需要点击一下Indexing configuration或者Indexing schedule链接。假如你要稍后再去配置,你可以在Preferences(首选项)菜单里配置这些选项。

一旦索引完成,你就可以搜索文件/文件夹了。结果将根据相关性展现,并显示匹配的一小部分内容。

配置

正如上面提到的,假如你想更多的控制索引的细节,你可以调节Recoll的索引功能。 在Recoll的工具中有两个配置项

  1. 索引配置
  2. 索引计划

让我们来看一下上面这两个的简短描述。

索引配置可以让你索引时决定包含哪些目录以及排除哪些目录。默认情况下索引时将包含整个home目录。你可以在这儿从索引中添加或移除目录。

你也可以定义web历史队列以及储存web页面的最大容量。

index schedule则是可以让制定一个计划以便于进行自动索引或者当你登陆系统后就进行实时索引。

Recoll支持两种索引计划:

Cron任务 - 决定什么时候开始运行以及写入Crontab键值。

以上这个屏幕截图中,Recoll的cron任务会在每天上午12点的时候执行。设置完cron任务后,点击enable键激活它就可以咯。

启动时实时索引 - 决定是否当你登陆入系统时进行实时索引。

激活这一选项,recoll的守护程序都会随系统启动。要注意的是这一选项只有在默认索引设置的情况下才可用。


基本搜索

现在你已经对Recoll了解的足够多了。是时候去搜索一下文件或者文件夹了。这个应用的美妙之处就在于它既可以搜索文件名还可以搜索文件内的关键词。

在Recoll的用户界面中,在顶部右边的搜索栏中键入要搜索的关键字,然后点击Search按钮。

如你在上图所见,精确相关的内容将会显示还能预览到一小部分内容。你可以点击Open按钮直接打开搜索到的文件,或者在打开它之前使用预览按钮预览它。

你还可以过滤搜索结果,使用分类例如媒体、消息、其它、演示文档、电子表格或者文本等。更重要的是,你还可以选择匹配任一项、全部项、文件名或者语言等的搜索结果。

高级搜索

点击菜单栏中的高级搜索图标或者前往Tools->Advanced Search。这将打开一个新的对话窗口。在这儿你可以附加更多的限制条件来进行搜索。例如我可以搜索文件内容里含有关键字“hp”以及文件名含有“storage”的文件。

这将找到并显示文件内含有关键字“hp”且文件名含有“storage”的文件。

Unity桌面以及网站集成

这个应用支持桌面集成以及网站集成。假如你要把它集成到你的Ubuntu的Unity桌面中去,你可以用下面的命令安装recoll-lens

sudo apt-get install recoll-lens

请注意,lens限制显示结果最多显示20条。假如你要显示更多数目的搜索结果,编辑rclsearch.py,修改“if actual_results >= 20:”这一行就可以咯。

假如你使用火狐浏览器,要去搜索你每天访问的浏览历史,你可以使用这个火狐扩展。这个火狐扩展可以和Recoll一起工作去索引你全天浏览的网站。在安装完这个扩展之后,在Recoll的索引配置中从web历史标签页中激活它就可以咯。

所有的Linux都在他们的文件管理器中内建了搜索功能,以便于尽可能容易的搜索文件/文件夹。对于那些不满足于内置搜索功能并想寻找更高级文本搜索工具的人来说,Recoll是个值得一试的工具。我认为,这真是个容易使用且功能强大的工具,对基本搜索如此,对高级搜索也是如此.

欢呼吧!

原文发布时间为:2013-12-01

本文来自云栖社区合作伙伴“Linux中国”


相关文章
|
21天前
|
安全 Linux
Linux通配符及其在文件搜索和管理中的应用
Linux通配符及其在文件搜索和管理中的应用
|
8天前
|
存储 Linux 数据库
|
8天前
|
Shell Linux C语言
|
14天前
|
数据挖掘 大数据 Linux
探索Linux中的snice命令:一个虚构但启发性的数据分析工具
`snice`是一个想象中的Linux命令,用于低优先级地从大数据集中抽样数据。它结合`nice`和`sampling`,支持多种抽样策略,如随机和分层。参数包括指定样本数、策略、输入输出文件和进程优先级。示例:`snice -n 1000 -s random -i large_log.txt -o sample_log.txt`。使用时注意资源管理、数据完整性及权限,并与其它工具结合使用。虽然虚构,但体现了Linux工具在数据分析中的潜力。
|
14天前
|
安全 Ubuntu Linux
6 个受欢迎且好用的轻量级Linux桌面环境
Linux被认为是最安全的系统,但这并不意味着它不受恶意软件或其他安全漏洞的侵害。Linux系统的使用范围非常广泛,因此防范潜在威胁至关重要。在这里,将探索 2024 年适用于 Linux 的最佳防病毒软件。根据评级、功能以及与其他 Linux 发行版的兼容性列出了十款最佳防病毒软件,内容仅供分享,不做其它用途。
92 0
6 个受欢迎且好用的轻量级Linux桌面环境
|
8天前
|
存储 缓存 安全
systemd-ask-password:Linux中的安全密码获取工具
`systemd-ask-password`是Linux的密码获取工具,安全收集服务或应用所需的密码。它支持TTY和密码代理输入,有隐藏输入、密码缓存功能。参数如`--no-tty`、`--id`、`--timeout`等可定制交互方式。示例包括直接在TTY请求或通过代理。注意事项包括安全环境、权限管理和密码管理。最佳实践涉及定期更新和使用强密码,以及日志审计。
|
20天前
|
存储 Unix Linux
探索Linux中的sed命令:强大的文本处理工具
`sed`是Linux/Unix的流编辑器,用于文本替换、删除、新增等操作,无需直接编辑文件。它逐行处理输入,存储在模式空间,执行脚本后输出。主要特点是非交互、支持正则表达式和简洁语法。示例:`sed 's/apple/orange/g' example.txt`替换文本,`/error/d`删除包含"error"的行,`a\---`在每行后加"---"。使用时注意备份、测试命令和理解正则表达式。
|
22天前
|
监控 算法 Linux
Linux下工具tc详细讲解及限制IP和端口实例
TC (Traffic Control) 是Linux内核中提供的一个用于控制和管理网络流量的强大工具,它允许用户实现QoS(Quality of Service)策略,包括带宽限制、优先级控制、延迟保证等。TC基于内核的队列 discipline (qdisc) 和流量类别(class) 体系结构,允许对进入或离开网络接口的数据流进行复杂的整形和过滤。
|
22天前
|
运维 Linux 应用服务中间件
Linux之自动化运维工具ansible、ansible模块(2)
Linux之自动化运维工具ansible、ansible模块(2)
|
22天前
|
运维 Linux Shell
Linux之自动化运维工具ansible、ansible模块(1)
Linux之自动化运维工具ansible、ansible模块(1)