textblob 自己训练模型

简介: textblob 实际上是封装了以下nltk,几乎所有方法都是调用的nltk库。 还是用上一篇的训练性别的例子。 #coding=utf-8import random, nltkfrom nltk.corpus import namesfrom textblob.classifiers import NLTKClassifierfrom textblob import Tex

textblob 实际上是封装了以下nltk,几乎所有方法都是调用的nltk库。

还是用上一篇的训练性别的例子。

#coding=utf-8
import random, nltk
from nltk.corpus import names
from textblob.classifiers import NLTKClassifier
from textblob import TextBlob
def gender_features(word):
    '''''提取每个单词的最后一个字母作为特征'''
    return {'last_letter': word[-1]}


# 先为原始数据打好标签
labeled_names = (
[(name, 'male') for name in names.words('male.txt')] + [(name, 'female') for name in names.words('female.txt')])
# 随机打乱打好标签的数据集的顺序,
random.shuffle(labeled_names)
# 从原始数据中提取特征(名字的最后一个字母, 参见gender_features的实现)
featuresets = [(gender_features(name), gender) for (name, gender) in labeled_names]
# 将特征集划分成训练集和测试集
train_set, test_set = featuresets[500:], featuresets[:500]
classif=NLTKClassifier(train_set)
classif.nltk_class=nltk.NaiveBayesClassifier;
blob = TextBlob("man",classifier=classif)
print blob.classify()


目录
相关文章
|
8月前
|
搜索推荐 安全 UED
浅谈AARRR模型
浅谈AARRR模型
|
8月前
|
机器学习/深度学习 弹性计算 TensorFlow
在阿里云上打造强大的模型训练服务
随着人工智能技术的迅猛发展,模型训练服务变得愈发关键。阿里云提供了一系列强大的产品,使得在云端轻松搭建、优化和管理模型训练变得更加便捷。本文将详细介绍如何使用阿里云的相关产品构建高效的模型训练服务。
542 0
|
5月前
|
Python
模型训练
【8月更文挑战第20天】模型训练。
60 0
|
5月前
|
搜索推荐 语音技术
SenseVoice模型建议
8月更文挑战第4天
459 1
|
4月前
|
人工智能 安全 测试技术
MetaLlama大模型
LLaMA 是一组基础语言模型,参数范围从 7B 到 65B,在大量公开数据上训练而成,性能优异。Llama 2 为 LLaMA 的升级版,参数规模扩大至 70 亿至 700 亿,特别优化了对话功能。Code Llama 基于 Llama 2 开发,专注于代码生成,提供不同参数规模的模型。这些模型可在多种平台上运行,包括官方 API、第三方封装库如 llama.cpp 和 ollama,以及通过 Hugging Face 的 transformers 库使用。此外,还提供了详细的模型申请及使用指南,便于开发者快速上手。相关链接包括 Meta 官方页面和 GitHub 仓库。
MetaLlama大模型
|
5月前
|
人工智能 算法 搜索推荐
你觉得大模型时代该出现什么?
【8月更文挑战第11天】大模型时代展望关键技术与基础设施升级,如量子计算支持、模型优化及专用芯片;模型层面探索多模态融合与自我解释能力;应用场景涵盖智能医疗、教育及城市管理等;社会人文领域则涉及新职业培训与伦理法规建设。
|
4月前
|
人工智能 自动驾驶 数据库
领域大模型的训练需要什么数据?
领域大模型的训练需要什么数据?
215 0
|
5月前
|
机器学习/深度学习 自然语言处理 数据可视化
训练模型
【8月更文挑战第1天】
56 2
|
8月前
|
机器学习/深度学习 人工智能 边缘计算
为何人们喜欢推理胜于训练大模型?
在AI和机器学习领域,越来越多的人转向重视推理而非大规模模型训练。推理的即时性和高效性使其在需要快速响应的场景中占优,如自然语言处理和图像识别。推理过程的可视化能帮助用户理解模型决策,便于调试和提升性能。此外,推理在边缘计算和移动设备上的应用降低了延迟和带宽成本,同时保护了用户隐私。相比于训练大模型的高资源消耗,推理更为节能且成本效益高,尤其在数据挖掘和新知识探索方面展现出创新潜力。推理在实际应用中与训练模型相结合,提供了性能与成本的有效平衡。随着技术进步,推理将在推动人工智能领域发展中发挥更大作用。
|
8月前
大模型,到底是什么“大”?
【1月更文挑战第19天】大模型,到底是什么“大”?
328 1
大模型,到底是什么“大”?

热门文章

最新文章