textblob 自己训练模型

简介: textblob 实际上是封装了以下nltk,几乎所有方法都是调用的nltk库。 还是用上一篇的训练性别的例子。 #coding=utf-8import random, nltkfrom nltk.corpus import namesfrom textblob.classifiers import NLTKClassifierfrom textblob import Tex

textblob 实际上是封装了以下nltk,几乎所有方法都是调用的nltk库。

还是用上一篇的训练性别的例子。

#coding=utf-8
import random, nltk
from nltk.corpus import names
from textblob.classifiers import NLTKClassifier
from textblob import TextBlob
def gender_features(word):
    '''''提取每个单词的最后一个字母作为特征'''
    return {'last_letter': word[-1]}


# 先为原始数据打好标签
labeled_names = (
[(name, 'male') for name in names.words('male.txt')] + [(name, 'female') for name in names.words('female.txt')])
# 随机打乱打好标签的数据集的顺序,
random.shuffle(labeled_names)
# 从原始数据中提取特征(名字的最后一个字母, 参见gender_features的实现)
featuresets = [(gender_features(name), gender) for (name, gender) in labeled_names]
# 将特征集划分成训练集和测试集
train_set, test_set = featuresets[500:], featuresets[:500]
classif=NLTKClassifier(train_set)
classif.nltk_class=nltk.NaiveBayesClassifier;
blob = TextBlob("man",classifier=classif)
print blob.classify()


目录
相关文章
|
存储 应用服务中间件 调度
在StatefulSet中使用LocalVolume存储卷保持节点一致
StatefulSet是一种有状态服务,其存储卷的使用有多种方式: 使用共享存储,这时在模板中定义一个volume卷,可以给多个pod共享; 每个pod配置独立的存储卷,使用非共享存储(块存储)时需要这样配置,通过配置volumeClaimTemplates实现; 对于StatefulSet使...
5083 0
|
机器学习/深度学习 数据采集 传感器
变量施药与施肥系统变量决策数据分析与处理
变量施药与施肥系统变量决策数据分析与处理
269 3
|
5G 网络架构 索引
安装一个开源虚拟路由器VPP-20.09
安装一个开源虚拟路由器VPP-20.09
|
Kubernetes 调度 C++
Kubernetes vs Docker Swarm:容器编排工具的比较与选择
在当今云计算时代,容器技术的应用越来越广泛。而在众多容器编排工具中,Kubernetes和Docker Swarm是两个备受关注的竞争者。本文将深入比较这两个工具的特点、优势和劣势,帮助读者更好地选择适合自己的容器编排解决方案。
|
SQL 监控 关系型数据库
MySQL如何查看每个分区的数据量
通过本文的介绍,您可以使用MySQL的 `INFORMATION_SCHEMA`查询每个分区的数据量。了解分区数据量对数据库优化和管理具有重要意义,可以帮助您优化查询性能、平衡数据负载和监控数据库健康状况。希望本文对您在MySQL分区管理和性能优化方面有所帮助。
1059 1
|
机器学习/深度学习 资源调度 自然语言处理
长短时记忆网络(LSTM)完整实战:从理论到PyTorch实战演示
长短时记忆网络(LSTM)完整实战:从理论到PyTorch实战演示
18365 0
|
监控 安全 Linux
给你的linux服务器安装一个免费的杀毒软件CLAM吧!
给你的linux服务器安装一个免费的杀毒软件CLAM吧!
5243 0
|
算法 JavaScript 前端开发
JavaScript学习 -- RSA算法应用实例及公钥私钥的生成方法
JavaScript学习 -- RSA算法应用实例及公钥私钥的生成方法
591 0
|
前端开发 Java Go
vscode怎么运行程序代码的两种方法
VSCode要运行程序的代码,大致要分为两种情况而定,一种是前端的代码,另一种是后端的代码。在VSCode中,后端代码的运行,可以从VSCode打开终端,然后使用命令行工具,使用命令来运行后端代码程序,比如Python的就可以使用命令:python file.py;Golang就可以使用:go run file.go;Java的就可以使用:java file.java,具体的步骤如下
582 1