今天的“30天学习30种新技术”的主题是如何使用Python进行文章提取。这几个月来,我对文章提取很感兴趣,因为我想写一个Prismatic克隆。Prismatic创建基于用户兴趣的新闻源。提取文章的主要内容、图片和其他元信息对大多数类似Prismatic的内容发现站点很有用。本文中,我们将学习如何使用Python的goose-extractor包来完成这个任务。我们首先介绍一些基础知识,然后使用Goose Extractor 的 API 来开发一个简单的Flask应用。
Ace是一个基于Web的代码编辑器。Ace编辑器支持自定义快捷键绑定,支持多种流行语言的语法高亮显示如:PHP,Javascript,HTML,CSS,Java,Ruby,C++,Python等。提供与桌面编辑器相似或更好的体验。它其实是为著名的Cloud9 IDE 而开发,并能够轻松集成到任何网页中。