自然语言处理--------jieba分词(文章中含有源码)

本文涉及的产品
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_高级版,每接口累计50万次
NLP自然语言处理_基础版,每接口每天50万次
简介: 自然语言处理--------jieba分词(文章中含有源码)
#TODO    jieba    一个自然语言处理工具包  ,除了jieba还有  HanLP  和  LTK
import jieba
#TODO    词、句 匹配
#全模式
seg_list=jieba.cut("我喜欢吃酸菜鱼",cut_all=True)
print("全模式:    "+"/".join(seg_list))
seg_list_1=jieba.cut("物联网是大势所趋",cut_all=False)
print(seg_list_1)
print("全模式:    "+"/".join(seg_list_1))
#精准模式,如果此处  cut  里面没有给出  cut_all=False,默认是False的
seg_list1=jieba.cut("我喜欢吃酸菜鱼",cut_all=False)
print("精准模式:    "+"/".join(seg_list1))
# TODO
seg_list1_1=jieba.cut("物联网是大势所趋")
print("精准模式:    "+"/".join(seg_list1_1))   #物/联网
# TODO 我们可以发现物联网分成了   物/联网,那是因为字典里面没有物联网这个词,我们加载一下自定义字典就可以了
jieba.load_userdict("./data/user_dic.txt")
seg_list1_1=jieba.cut("物联网是大势所趋")
print("重新加载过字典")
print("精准模式:    "+"/".join(seg_list1_1))
#搜素引擎模式
seg_list2=jieba.cut_for_search("我喜欢吃酸菜鱼")
print("引擎模式:    "+",".join(seg_list2))

image.png

由上面的代码我们可以发现jieba语料库不是特别完善,尤其是**物理物联网是大势所趋**,其中**物联网**被分成了**物/联网**,但我们重新加载语料库(字典)时我们发现这次并没有把**物联网**分开,达到了预期效果。

user_dic.txt 大波浪 10 jieba分词 n 金融字典 7 物联网 5 n

最后一行为例
for example :5是出现的频次  ,n 是名词的属性
目录
相关文章
|
7月前
|
机器学习/深度学习 人工智能 自然语言处理
springboot基于人工智能和自然语言理解技术的医院智能导医系统源码
智能导诊系统可为患者提供线上挂号智能辅助服务,患者根据提示手动输入自己的基本症状,通过智能对话方式,该系统会依据大数据一步步帮助患者“诊断”,并最终推荐就医的科室和相关专家。患者可自主选择,实现“一键挂号”。这一模式将精确的导诊服务前置,从源头上让医疗服务更高效。
466 2
|
6月前
|
机器学习/深度学习 自然语言处理 算法
分词算法在自然语言处理中的应用与性能比较
分词算法在自然语言处理中的应用与性能比较
|
5月前
|
机器学习/深度学习 自然语言处理 算法
分词算法在自然语言处理中的应用与性能比较
分词算法在自然语言处理中的应用与性能比较
|
5月前
|
机器学习/深度学习 自然语言处理 算法
分词算法在自然语言处理中的基本原理与应用场景
分词算法在自然语言处理中的基本原理与应用场景
|
7月前
|
机器学习/深度学习 自然语言处理 机器人
【Tensorflow+自然语言处理+LSTM】搭建智能聊天客服机器人实战(附源码、数据集和演示 超详细)
【Tensorflow+自然语言处理+LSTM】搭建智能聊天客服机器人实战(附源码、数据集和演示 超详细)
797 10
|
7月前
|
自然语言处理 机器人 数据库
【Python自然语言处理+tkinter图形化界面】实现智能医疗客服问答机器人实战(附源码、数据集、演示 超详细)
【Python自然语言处理+tkinter图形化界面】实现智能医疗客服问答机器人实战(附源码、数据集、演示 超详细)
226 3
|
7月前
|
机器学习/深度学习 自然语言处理 机器人
【Tensorflow+自然语言处理+RNN】实现中文译英文的智能聊天机器人实战(附源码和数据集 超详细)
【Tensorflow+自然语言处理+RNN】实现中文译英文的智能聊天机器人实战(附源码和数据集 超详细)
110 1
|
7月前
|
数据采集 自然语言处理 Python
【Python自然语言处理】文本向量化处理用户对不同类型服装评论问题(超详细 附源码)
【Python自然语言处理】文本向量化处理用户对不同类型服装评论问题(超详细 附源码)
81 1
|
7月前
|
自然语言处理 算法 数据库
【JavaScript+自然语言处理+HTML+CSS】实现Web端的智能聊天问答客服实战(附源码 超详细必看)
【JavaScript+自然语言处理+HTML+CSS】实现Web端的智能聊天问答客服实战(附源码 超详细必看)
132 0
|
7月前
|
机器学习/深度学习 存储 数据采集
【Python自然语言处理】使用SVM、随机森林法、梯度法等多种方法对病人罹患癌症预测实战(超详细 附源码)
【Python自然语言处理】使用SVM、随机森林法、梯度法等多种方法对病人罹患癌症预测实战(超详细 附源码)
108 0

热门文章

最新文章