AI之NLP:自然语言处理技术简介(是什么/学什么/怎么用)、常用算法、经典案例之详细攻略(建议收藏)

简介: AI之NLP:自然语言处理技术简介(是什么/学什么/怎么用)、常用算法、经典案例之详细攻略(建议收藏)

NLP是什么?


NLP是一门融语言学、计算机科学、数学于一体的科学。主要内容包括如下:


如何用NLP与语言学的关键概念来描述和分析语言

NLP中的数学结构和算法是如何实现的

自然语言处理目前主流的技术与方法论

信息检索技术与大数据应用

推荐文章

NLP:自然语言处理技术的简介、发展历史、案例应用之详细攻略

Paper之ACL&EMNLP:2009年~2019年ACL计算语言学协会年会&EMNLP自然语言处理的经验方法会议历年最佳论文简介及其解读

NLP:《NLP Year in Review 2019&NLP_2019_Highlights》2019年自然语言处理领域重要进展回顾及其解读

Dataset:数据集集合(NLP方向数据集)——常见的自然语言处理数据集大集合(建议收藏,持续更新)


1、NLP前置技术解析


搭建Python开发环境

正则表达式在NLP中的基本应用

Numpy使用详解


2、python中NLP技术相关库


word2vec

nltk

jieba

Py之SnowNLP:SnowNLP中文处理包的简介、安装、使用方法、代码实现之详细攻略

NLP之word2vec:word2vec简介、安装、使用方法之详细攻略


3、NLP案例实践


3.1、机器翻译


3.2、语音识别(Automatic Speech Recognition)


NLP之ASR:语音识别技术(Automatic Speech Recognition)的简介、发展历史、案例应用之详细攻略

NLP之ASR:基于pyaudio利用python进行语音生成、语音识别总结及其案例详细攻略

NLP之ASR:基于python和机器学习算法带你玩转的语音实时识别技术


3.3、中文分词


中文分词简介


规则分词

统计分词

混合分词

中文分词工具—Jieba


3.4、词件标注与命名实体识别


词性标注

命名实体识别

实体识别(NER)


3.5、关键词提取算法


摘要提取

关键词提取技术概述

TF/IDF

TextRank

LSA/LSI/LDA算法

实战提取文本关键词


推荐文章

NLP:基于textrank4zh库对文本实现提取文本关键词、文本关键短语和文本摘要

NLP:基于snownlp库对文本实现提取文本关键词和文本摘要

NLP:基于nltk和jieba库对文本实现提取文本摘要(两种方法实现:top_n_summary和mean_scored_summary)




3.6、句法分析


文本分析

句法分析概述

句法分析的常用方法

使用Stanford Parser的PCFG算法进行句法分析


3.7、文本向量化


文本向量化概述

向量化算法woed2vec

向量化算法doc2vec、str2vec

网页文本向量化


推荐文章

NLP:利用DictVectorizer对使用字典存储的数据进行特征抽取与向量化

NLP之word2vec:利用 Wikipedia Text(中文维基百科)语料+Word2vec工具来训练简体中文词向量


3.8、文本分类


如:垃圾邮件分类、情感分析。


3.9、情感分析技术


情感分析应用

情感分析基本方法

实战电影评论情感分析


推荐文章

NLP之TEA:自然语言处理之文本情感分析的简介、算法、应用、实现流程方法、案例应用之详细攻略

NLP之情感分析:基于python编程(jieba库)实现中文文本情感分析(得到的是情感评分)


3.10、Solr搜索引擎


全文检索的原理

Solr简介与部署

Solr后台管理描述

配置Schema

Solr管理索引库


3.11、NLP中常用的机器学习算法


分类器方法

无监督学习的文本聚类

文本分类:中文垃圾邮件分类

文本聚类:用k-means对豆瓣读书数据聚类


推荐文章

NLP之TM之LDA:利用LDA算法瞬时掌握文档的主题内容—利用希拉里邮件数据集训练LDA模型并对新文本进行主题分类


3.12、NLP中常用的深度学习算法


神经网络模型

多输出层模型

反向传播算法

最优化算法

丢弃法

激活函数

实现BP算法

词嵌入算法

训练词向量实践

朴素Vanilla-RNN

LSTM网络

Attention机制

Seq2Seq模型

图模型

深度学习平台

问答机器人


推荐文章

NLP之WE之CBOW&Skip-Gram:CBOW&Skip-Gram算法概念相关论文、原理配图、关键步骤之详细攻略

NLP之WE之Skip-Gram:基于TF利用Skip-Gram模型实现词嵌入并进行可视化、过程全记录





相关文章
|
25天前
|
机器学习/深度学习 人工智能 自然语言处理
【人工智能技术专题】「入门到精通系列教程」零基础带你进军人工智能领域的全流程技术体系和实战指南(NLP自然语言处理概念介绍)
【人工智能技术专题】「入门到精通系列教程」零基础带你进军人工智能领域的全流程技术体系和实战指南(NLP自然语言处理概念介绍)
41 0
|
25天前
|
机器学习/深度学习 人工智能 运维
【人工智能技术专题】「入门到精通系列教程」打好AI基础带你进军人工智能领域的全流程技术体系(机器学习知识导论)(二)
【人工智能技术专题】「入门到精通系列教程」打好AI基础带你进军人工智能领域的全流程技术体系(机器学习知识导论)
58 1
|
25天前
|
机器学习/深度学习 人工智能 自然语言处理
【人工智能技术专题】「入门到精通系列教程」打好AI基础带你进军人工智能领域的全流程技术体系(机器学习知识导论)(一)
【人工智能技术专题】「入门到精通系列教程」打好AI基础带你进军人工智能领域的全流程技术体系(机器学习知识导论)
65 1
|
5天前
|
机器学习/深度学习 人工智能 算法
未来AI技术的发展与应用前景
随着人工智能(AI)技术的迅速发展,其在各个领域的应用前景备受关注。本文将探讨未来AI技术的发展趋势,以及其在医疗、交通、教育等领域的潜在应用,展望AI技术对未来社会的影响和改变。
12 1
|
6天前
|
存储 机器学习/深度学习 自然语言处理
R语言自然语言处理(NLP):情感分析新闻文本数据
R语言自然语言处理(NLP):情感分析新闻文本数据
16 0
|
11天前
|
人工智能 数据可视化 大数据
从埃森哲《技术展望2024》看AI拐点下的数字化趋势
从埃森哲《技术展望2024》看AI拐点下的数字化趋势
15 0
|
11天前
|
机器学习/深度学习 数据采集 人工智能
|
25天前
|
机器学习/深度学习 人工智能 自然语言处理
AI案例研究与项目实战
探索AI实践:从智能客服到图像识别、推荐系统、语音助手,再到智能仓储和金融风控,这些案例展示AI如何解决实际问题。通过NLP、深度学习、机器学习等技术,企业如阿里巴巴、京东等改善客户服务,医疗、安防领域利用图像识别创新,而个性化推荐提升用户体验。AI不仅改变交互方式,还优化仓储物流、保障金融安全,实操项目助力技术应用能力提升。
35 3
|
机器学习/深度学习 人工智能 自然语言处理
搜狗翻宝Pro机再次开挂,智能翻译硬件成中国人工智能的新风口
第五届世界互联网大会正在如火如荼的举行。
搜狗翻宝Pro机再次开挂,智能翻译硬件成中国人工智能的新风口