如果你对自然语言处理方面的资源感兴趣,请仔细阅读本篇文章。
网上有很多依靠深度学习方法的NLP资源,有一些资源理论深厚,十分经典,特别是斯坦福大学和牛津大学的NLP,其深度学习课程为:
但是如果你已经完成了这些,或已经在NLP中获得了基础并想要转向一些实用资源,或者只是对其他方法感兴趣,希望这篇文章能对你有所帮助。
1. 用Python进行自然语言处理—用自然语言工具包分析文本
这是一本至少从实用性和Python生态系统的双重视角介绍自然语言处理的书,它可以用于个人学习或作为自然语言处理或计算语言学课程的教科书,或作为人工智能、文本挖掘或语料库语言学课程的补充。本书通过使用自然语言工具包(NLTK)来接近NLP。
NLTK包含丰富的软件、数据和文档,可从http://nltk.org/免费下载。发行版本是由Windows,Macintosh和Unix平台提供的。我们强烈建议您下载Python和NLTP,并尝试一下示例和练习。
这是一个Jupyter笔记本并附随Jon Krohn的关于NLP深度学习的一系列精彩视频的回购协议。如果你有兴趣观看他的视频(它是通过O’Reilly的Safari平台提供的)请注册一个免费的10天试用版,。
Jon在这些笔记本和随附视频中的主要内容包括:
1.预处理用于机器学习应用的自然语言数据;
2.将自然语言转换为数字表示(使用word2vec);
3.通过训练自然语言的深层学习模型进行预测;
4.在高级TensorFlow API Keras中应用先进的NLP方法;
5.通过调整超参数来提高深度学习模型的性能。
这是以笔记本的形式出现的另一套非常棒的教程,它遵循类似于上述Krohn的轨迹。Insight AI的Emmanuel Ameisen分解了完成哪些任务需要执行哪些步骤,阅读完本文后,您将知道如何:
1.收集、准备和检查数据。
2.从建立简单的模型开始,并在必要时过渡到深度学习。
3.解释并理解你的模型,确保您实际上获取的是信息而不是噪音。
4.Keras LSTM教程-如何轻松构建强大的深度学习语言模型
本教程比之前的资源重点更多,因为它涵盖了在Keras中实施用于语言建模的LSTM。它通过附有解释、代码和视觉效果对此进行了详细的介绍说明。在本教程中,我将专注于在Keras中创建LSTM网络,简要回顾或概述LSTM的工作原理。在Keras LSTM教程中,我们将利用称为PTB语料库的大型文本数据集来实现序列到序列的文本预测模型。
这是一篇较短的教程(它是一个文章的概述),其中有使用LSTM/CNN的组合方法的代码来分析情感。该项目颠覆了体系结构,并报告了不同的结果。
我们的CNN-LSTM模型的准确度比CNN模型高3%,但比LSTM模型差3.2%。同时,我们的LSTM-CNN模型比CNN模型的性能好8.5%,比LSTM模型好2.7%。
关于该项目的结果的可靠性,我暂时无法保证。但是,其创新的情感分析方式与混合在不同的神经网络体系结构中搭配使用,使我将其纳入该列表中,希望能对读者有所启发。
相关:
本文由阿里云云栖社区组织翻译。
文章原标题《5 Fantastic Practical Natural Language Processing Resources》
作者:Matthew Mayo
译者:乌拉乌拉,审校:袁虎。
文章为简译,更为详细的内容,请查看原文文章