textblob 自己训练模型

简介: textblob 实际上是封装了以下nltk,几乎所有方法都是调用的nltk库。 还是用上一篇的训练性别的例子。 #coding=utf-8import random, nltkfrom nltk.corpus import namesfrom textblob.classifiers import NLTKClassifierfrom textblob import Tex

textblob 实际上是封装了以下nltk,几乎所有方法都是调用的nltk库。

还是用上一篇的训练性别的例子。

#coding=utf-8
import random, nltk
from nltk.corpus import names
from textblob.classifiers import NLTKClassifier
from textblob import TextBlob
def gender_features(word):
    '''''提取每个单词的最后一个字母作为特征'''
    return {'last_letter': word[-1]}


# 先为原始数据打好标签
labeled_names = (
[(name, 'male') for name in names.words('male.txt')] + [(name, 'female') for name in names.words('female.txt')])
# 随机打乱打好标签的数据集的顺序,
random.shuffle(labeled_names)
# 从原始数据中提取特征(名字的最后一个字母, 参见gender_features的实现)
featuresets = [(gender_features(name), gender) for (name, gender) in labeled_names]
# 将特征集划分成训练集和测试集
train_set, test_set = featuresets[500:], featuresets[:500]
classif=NLTKClassifier(train_set)
classif.nltk_class=nltk.NaiveBayesClassifier;
blob = TextBlob("man",classifier=classif)
print blob.classify()


目录
打赏
0
0
0
0
138
分享
相关文章
在阿里云上打造强大的模型训练服务
随着人工智能技术的迅猛发展,模型训练服务变得愈发关键。阿里云提供了一系列强大的产品,使得在云端轻松搭建、优化和管理模型训练变得更加便捷。本文将详细介绍如何使用阿里云的相关产品构建高效的模型训练服务。
717 0
|
7月前
|
模型训练
【8月更文挑战第20天】模型训练。
92 0
大模型时代
【7月更文挑战第6天】大模型时代
91 5
领域大模型的训练需要什么数据?
领域大模型的训练需要什么数据?
335 0
什么是领域大模型?
什么是领域大模型?
406 0
为何人们喜欢推理胜于训练大模型?
在AI和机器学习领域,越来越多的人转向重视推理而非大规模模型训练。推理的即时性和高效性使其在需要快速响应的场景中占优,如自然语言处理和图像识别。推理过程的可视化能帮助用户理解模型决策,便于调试和提升性能。此外,推理在边缘计算和移动设备上的应用降低了延迟和带宽成本,同时保护了用户隐私。相比于训练大模型的高资源消耗,推理更为节能且成本效益高,尤其在数据挖掘和新知识探索方面展现出创新潜力。推理在实际应用中与训练模型相结合,提供了性能与成本的有效平衡。随着技术进步,推理将在推动人工智能领域发展中发挥更大作用。
世界模型有什么用?
【2月更文挑战第16天】世界模型有什么用?
179 2
世界模型有什么用?
|
10月前
大模型,到底是什么“大”?
【1月更文挑战第19天】大模型,到底是什么“大”?
411 1
大模型,到底是什么“大”?

热门文章

最新文章

AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等