PyHubWeekly | 第二十二期:利用Python搭建一款无广告、保护隐私的Google搜索引擎

简介: PyHubWeekly每周定期更新,精选GitHub上优质的Python项目/小工具。我把PyHubWeekly托管到了Github,感兴趣的可以搜索Github项目PyHubWeekly[1],如果喜欢,麻烦给个Star支持一下吧。此外,欢迎大家通过提交issue来投稿和推荐自己的项目~

前言

PyHubWeekly每周定期更新,精选GitHub上优质的Python项目/小工具。

我把PyHubWeekly托管到了Github,感兴趣的可以搜索Github项目PyHubWeekly[1],如果喜欢,麻烦给个Star支持一下吧。此外,欢迎大家通过提交issue来投稿和推荐自己的项目~


本期为大家推荐GitHub上5个优质的Python项目,它们分别是:

  • textshot
  • whoogle-search
  • sphinx
  • snakeware
  • video2x

下面分别来介绍一下上述5个GitHub项目。

textshot


Star:745

3.gif

textshot[2]是一款截图识别文字的Python小工具。

关于这款工具,我已经在另外一篇文章:100行Python代码实现一款高精度免费OCR工具中进行过详细介绍。

或许textshot在识别精度并不如哪些付费的API,在包装方面不如那些商业化程度较高的OCR工具,但是,我还是很推荐学习一下这个项目。

它通过简洁、少量的代码实现了从前端到后端调用整个完整系统的开发,通过这个项目可以了解一个完成的应用涉及哪些环节,而且能够从细节学习到如何通过Python实现UI开发、实现一款截图工具、调用后端引擎。


whoogle-search


Star:870

4.png

whoogle-search[3]是一款可以自己架设,能够爬取谷歌搜索结果、无广告、不追踪、保护隐私的搜索引擎工具。

whoogle-search的安装部署方式非常丰富而且简单,可以通过Docker、Heroku、pip、手动等方式进行安装配置。

安装之后配置相应的ip和端口就可以启动whoogle-search服务。

pip安装配置为例。

安装


pip install whoogle-search

启动服务


whoogle-search --host <your ip> --port <your port>


sphinx


Star:3.3k

sphinx[4]是一款可以快速创建漂亮文档的Python工具。

之前我曾介绍过另外一款文档生成工具mkdoc,而sphinx是一款更加全面、智能、强大的文档生成工具。

它具有如下特点:

  • 输出格式全面:HTML、LaTeX、ePub、纯文本等;
  • 广泛的交叉引用:函数、类、引文、词汇表术语等;
  • 层次结构:简单定义文档树,自动链接到同级、父级和子级;
  • 代码处理:使用Pygments highlighter自动突出代码显示;
  • 扩展:自动测试代码片段,包含来自Python模块(API文档)的docstring;


snakeware


Star:1.3k

5.png

snakeware[5]是一款基于Python开发的Linux发行版操作系统。

snakeware的窗口管理器snakewm是基于pygame/pygame_gui。而且,snakeware不使用任何其他大型且不透明的软件,如systemd等。它的目标是最终拥有一组完全用Python编写的可用的用户空间应用程序和实用程序,用户将直接被引导到一个Python解释器中,可以使用该解释器对计算机执行任何想要的操作。


video2x


Star:1.3k

6.png

video2x[6]是一款视频/图片/GIF无损方法工具。

之前曾介绍过几款图片无损放大工具,例如,bigjpg、waifu2x。

而video2x就是基于waifu2x、Anime4K、SRMD和RealSR等实现的一款视频、图片、GIF无损放大工具。

示例

原GIF图像(160x120):

7.gif

经过放大4倍(640x480 )之后的结果:

8.gif

相关文章
|
6月前
|
数据采集 搜索推荐 数据管理
基于Python爬虫的垂直搜索引擎设计与实现
基于Python爬虫的垂直搜索引擎设计与实现
146 1
|
机器学习/深度学习 存储 数据挖掘
Google Colab:云端的Python编程神器
Google Colab,全名Google Colaboratory,是Google Research团队开发的一款云端编程工具,它允许任何人通过浏览器编写和执行Python代码。Colab尤其适合机器学习、数据分析和教育目的。它是一种托管式Jupyter笔记本服务,用户无需设置,就可以直接使用,同时还能获得GPU等计算资源的免费使用权限。
503 0
Google Colab:云端的Python编程神器
|
2月前
|
人工智能 缓存 搜索推荐
百度/Bing/Google搜索引擎使用技巧
本文分享了百度、Bing和Google三大搜索引擎的实用技巧,涵盖精确匹配、排除关键词、站内及文件类型搜索等,如使用双引号进行精确搜索“人工智能应用”,排除特定词如“人工智能 -游戏”,以及在特定网站如“site:baidu.com 人工智能”内查找内容等,帮助提高搜索效率和准确性。
百度/Bing/Google搜索引擎使用技巧
|
2月前
|
机器学习/深度学习 数据采集 自然语言处理
使用Python实现深度学习模型:智能广告创意生成
使用Python实现深度学习模型:智能广告创意生成
74 4
|
4月前
|
机器学习/深度学习 搜索推荐 TensorFlow
使用Python实现深度学习模型:个性化推荐与广告优化
【7月更文挑战第22天】 使用Python实现深度学习模型:个性化推荐与广告优化
183 71
|
5月前
|
Python
Python Google风格注释详解
Google风格注释是Python代码注释的一种标准化格式,它提供了一种规范的注释格式,使得代码更加易读、易于维护。Google风格注释使用三个双引号来包围注释内容,并按照一定规范编写。在注释中使用动词短语来描述函数的行为,并使用被动语态。在注释中使用正确的标点符号和缩进,使得注释易于阅读和理解。通过使用Google风格注释,我们可以为代码提供清晰的文档和说明,使得代码更加易读、易于维护。
200 3
|
6月前
|
API 算法框架/工具 异构计算
Python中Keras微调Google Gemma:定制化指令增强大语言模型LLM
Python中Keras微调Google Gemma:定制化指令增强大语言模型LLM
|
6月前
|
程序员 Python
【🔥热闻速递】Google 裁撤 Python研发团队
Google近日决定解散其Python研发团队,原因是寻求更低劳动力成本,可能转向其他国家招聘。此举可能源于美国程序员薪资高昂,相比之下,中国工程师薪资更低且效率更高。谷歌CEO Sundar Pichai已将部分团队迁移至印度。这一决策引发对公司长期可持续性和人才保留问题的讨论,暗示谷歌正面临挑战。
92 5
|
6月前
|
机器学习/深度学习 分布式计算 物联网
【Python机器学习专栏】联邦学习:保护隐私的机器学习新趋势
【4月更文挑战第30天】联邦学习是保障数据隐私的分布式机器学习方法,允许设备在本地训练数据并仅共享模型,保护用户隐私。其优势包括数据隐私、分布式计算和模型泛化。应用于医疗、金融和物联网等领域,未来将发展更高效的数据隐私保护、提升可解释性和可靠性的,并与其他技术融合,为机器学习带来新机遇。
107 0
|
6月前
|
数据采集 存储 搜索推荐
使用Python构建自定义搜索引擎:从数据抓取到索引与搜索
使用Python构建自定义搜索引擎:从数据抓取到索引与搜索
383 0