textblob 自己训练模型

简介: textblob 实际上是封装了以下nltk,几乎所有方法都是调用的nltk库。 还是用上一篇的训练性别的例子。 #coding=utf-8import random, nltkfrom nltk.corpus import namesfrom textblob.classifiers import NLTKClassifierfrom textblob import Tex

textblob 实际上是封装了以下nltk,几乎所有方法都是调用的nltk库。

还是用上一篇的训练性别的例子。

#coding=utf-8
import random, nltk
from nltk.corpus import names
from textblob.classifiers import NLTKClassifier
from textblob import TextBlob
def gender_features(word):
    '''''提取每个单词的最后一个字母作为特征'''
    return {'last_letter': word[-1]}


# 先为原始数据打好标签
labeled_names = (
[(name, 'male') for name in names.words('male.txt')] + [(name, 'female') for name in names.words('female.txt')])
# 随机打乱打好标签的数据集的顺序,
random.shuffle(labeled_names)
# 从原始数据中提取特征(名字的最后一个字母, 参见gender_features的实现)
featuresets = [(gender_features(name), gender) for (name, gender) in labeled_names]
# 将特征集划分成训练集和测试集
train_set, test_set = featuresets[500:], featuresets[:500]
classif=NLTKClassifier(train_set)
classif.nltk_class=nltk.NaiveBayesClassifier;
blob = TextBlob("man",classifier=classif)
print blob.classify()


目录
相关文章
|
8月前
|
机器学习/深度学习 弹性计算 TensorFlow
在阿里云上打造强大的模型训练服务
随着人工智能技术的迅猛发展,模型训练服务变得愈发关键。阿里云提供了一系列强大的产品,使得在云端轻松搭建、优化和管理模型训练变得更加便捷。本文将详细介绍如何使用阿里云的相关产品构建高效的模型训练服务。
534 0
|
机器学习/深度学习 TensorFlow 算法框架/工具
AIAM 模型
AIAM(Artificial Intelligence and Music)模型是一种基于深度学习的音乐生成模型。
299 3
|
5月前
|
Python
模型训练
【8月更文挑战第20天】模型训练。
58 0
|
6月前
|
存储 人工智能 自然语言处理
大模型时代
【7月更文挑战第6天】大模型时代
73 5
|
4月前
|
人工智能 自动驾驶 数据库
领域大模型的训练需要什么数据?
领域大模型的训练需要什么数据?
191 0
|
5月前
|
机器学习/深度学习 自然语言处理 数据可视化
训练模型
【8月更文挑战第1天】
56 2
|
6月前
|
机器学习/深度学习 PyTorch 算法框架/工具
大模型微调
【7月更文挑战第31天】
142 4
|
XML 数据挖掘 数据格式
|
8月前
|
机器学习/深度学习 人工智能 边缘计算
为何人们喜欢推理胜于训练大模型?
在AI和机器学习领域,越来越多的人转向重视推理而非大规模模型训练。推理的即时性和高效性使其在需要快速响应的场景中占优,如自然语言处理和图像识别。推理过程的可视化能帮助用户理解模型决策,便于调试和提升性能。此外,推理在边缘计算和移动设备上的应用降低了延迟和带宽成本,同时保护了用户隐私。相比于训练大模型的高资源消耗,推理更为节能且成本效益高,尤其在数据挖掘和新知识探索方面展现出创新潜力。推理在实际应用中与训练模型相结合,提供了性能与成本的有效平衡。随着技术进步,推理将在推动人工智能领域发展中发挥更大作用。