@[toc]
Python NLP 自然语言处理
"""
基于 https://github.com/isnowfy/snownlp
$ pip install snownlp
"""
from snownlp import SnowNLP
# 分词
def snownlp_cut(text):
return SnowNLP(text).words
# 词性标准
def snownlp_tags(text):
# 返回积极情绪订单概率,高于 0.5 积极,低于消极
return SnowNLP(text).tags
# 情感分析
def snownlp_sentiments(text):
return SnowNLP(text).sentiments
# 转成拼音
def snownlp_pinyin(text):
return SnowNLP(text).pinyin
# 断句
def snownlp_sentences(text):
return SnowNLP(text).sentences
# 提取文本关键词
def snownlp_keywords(text):
return SnowNLP(text).keywords(5)
# 提取文本摘要
def snownlp_summary(text):
return SnowNLP(text).summary(5)
if __name__ == '__main__':
print(snownlp_cut('我是中国人'))
print(snownlp_cut('我是中国人,我爱北京天安门'))
print()
# 测试词性标注
for tag in snownlp_tags('我是中国人,我爱北京天安门'):
print(tag)
print(snownlp_sentiments('我是中国人,我爱北京天安门'))
print(snownlp_pinyin('我是中国人,我爱北京天安门'))
print(snownlp_sentences('我是中国人,我爱北京天安门'))
print(snownlp_keywords('我是中国人,我爱北京天安门'))
print(snownlp_summary('我是中国人,我爱北京天安门'))
输出结果预览
['我', '是', '中国', '人']
['我', '是', '中国', '人', ',', '我', '爱', '北京', '天安门']
('我', 'r')
('是', 'v')
('中国', 'ns')
('人', 'n')
(',', 'w')
('我', 'r')
('爱', 'v')
('北京', 'ns')
('天安门', 'ns')
0.9615350064732849
['wo', 'shi', 'zhong', 'guo', 'ren', ',', 'wo', 'ai', 'bei', 'jing', 'tian', 'an', 'men']
['我是中国人', '我爱北京天安门']
['天安门', '北京', '爱', '人', '中国']
['我是中国人', '我爱北京天安门']