HanLP 自然语言处理 for nodejs
·支持中文分词(N-最短路分词、CRF分词、索引分词、用户自定义词典、词性标注),命名实体识别(中国人名、音译人名、日本人名、地名、实体机构名识别),关键词提取,自动摘要,短语提取,拼音转换,简繁转换,文本推荐,依存句法分析(MaxEnt依存句法分析、CRF依存句法分析)
谁顶住双11的世界级流量洪峰?神龙架构负责人等9位大牛现场拆解阿里秘籍
今年双11,天猫成交额再次刷新世界纪录,阿里巴巴核心系统100%上云,撑住了双11的世界级流量洪峰。在这一流量战场上,阿里可谓是华山论剑的最大赢家。18日下午,神龙架构负责人旭卿、OceanBase日照、菜鸟行易等阿里9位技术大牛现身北京望京,全面解析阿里双11的武功秘籍。来新智元 AI 朋友圈和AI大咖们一起讨论吧。
开源自然语言处理工具包hanlp中CRF分词实现详解
CRF简介
CRF是序列标注场景中常用的模型,比HMM能利用更多的特征,比MEMM更能抵抗标记偏置的问题。
[gerative-discriminative.png]
CRF训练
这类耗时的任务,还是交给了用C++实现的CRF++。
开源-NLP工具
NLP开源工具
1. AllenNLP
说明:An open-source NLP research library, built on PyTorch。官网:https://allennlp.org/github:https://github.com/huntzhan/allennlp
2. PyText
说明:PyText是基于NLP深度学习技术、通过Pytorch构建的建模框架。
Python NLP库top6的介绍和比较
文章来源:ActiveWizards
https://medium.com/activewizards-machine-learning-company/comparison-of-top-6-python-nlp-libraries-c4ce160237eb
译者 | Revolver
编辑 | 磐石
出品 | 磐创AI技术团队
自然语言处理(NLP)在今天已经变得越来越流行,尤其是在深度学习迅猛发展的大背景下变得更加引人注目。