NLP:利用DictVectorizer对使用字典存储的数据进行特征抽取与向量化

简介: NLP:利用DictVectorizer对使用字典存储的数据进行特征抽取与向量化

输出结果


image.png



实现代码


#定义一组字典列表,用来表示多个数据样本(每个字典代表一个数据样本)

from sklearn.feature_extraction import DictVectorizer

measurements = [{'city': 'Shang Hai', 'temperature': 33.}, {'city': 'Bei Jing', 'temperature': 12.}, {'city': 'Las Vegas', 'temperature': 18.}]

vec = DictVectorizer()  #初始化DictVectorizer特征抽取器

print(vec.fit_transform(measurements).toarray()) #输出转化之后的特征矩阵

print(vec.get_feature_names())                   #输出各个维度的特征含义


相关文章
|
7月前
|
存储 自然语言处理 数据可视化
自然语言入门:NLP数据读取与数据分析
本章主要内容为数据读取和数据分析,具体使用`Pandas`库完成数据读取操作,并对赛题数据进行分析构成。
324 0
|
9天前
|
存储 机器学习/深度学习 自然语言处理
R语言自然语言处理(NLP):情感分析新闻文本数据
R语言自然语言处理(NLP):情感分析新闻文本数据
24 0
|
4月前
|
机器学习/深度学习 自然语言处理 算法
19ContraBERT:顶会ICSE23 数据增强+对比学习+代码预训练模型,提升NLP模型性能与鲁棒性:处理程序变异(变量重命名)【网安AIGC专题11.15】
19ContraBERT:顶会ICSE23 数据增强+对比学习+代码预训练模型,提升NLP模型性能与鲁棒性:处理程序变异(变量重命名)【网安AIGC专题11.15】
81 1
|
8月前
|
数据采集 人工智能 自然语言处理
“超级AI助手:全新提升!中文NLP训练框架,快速上手,海量训练数据,ChatGLM-v2、中文Bloom、助您实现更智能的应用!”
“超级AI助手:全新提升!中文NLP训练框架,快速上手,海量训练数据,ChatGLM-v2、中文Bloom、助您实现更智能的应用!”
“超级AI助手:全新提升!中文NLP训练框架,快速上手,海量训练数据,ChatGLM-v2、中文Bloom、助您实现更智能的应用!”
|
8月前
|
数据采集 自然语言处理 PyTorch
全套解决方案:基于pytorch、transformers的中文NLP训练框架,支持大模型训练和文本生成,快速上手,海量训练数据!
全套解决方案:基于pytorch、transformers的中文NLP训练框架,支持大模型训练和文本生成,快速上手,海量训练数据!
全套解决方案:基于pytorch、transformers的中文NLP训练框架,支持大模型训练和文本生成,快速上手,海量训练数据!
|
9月前
|
数据采集 人工智能 自然语言处理
用于提取数据的三个开源NLP工具
用于提取数据的三个开源NLP工具
164 0
|
10月前
|
机器学习/深度学习 人工智能 自然语言处理
深度学习应用篇-自然语言处理[10]:N-Gram、SimCSE介绍,更多技术:数据增强、智能标注、多分类算法、文本信息抽取、多模态信息抽取、模型压缩算法等
深度学习应用篇-自然语言处理[10]:N-Gram、SimCSE介绍,更多技术:数据增强、智能标注、多分类算法、文本信息抽取、多模态信息抽取、模型压缩算法等
|
11月前
|
自然语言处理 数据处理
NLP数据增广不故障!清华大学提出FlipDA,轻松解决小样本任务|ACL 2022
NLP数据增广不故障!清华大学提出FlipDA,轻松解决小样本任务|ACL 2022
118 0
|
机器学习/深度学习 人工智能 自然语言处理
用维基百科的数据改进自然语言处理任务(下)
用维基百科的数据改进自然语言处理任务
186 0
用维基百科的数据改进自然语言处理任务(下)
|
存储 人工智能 自然语言处理
用维基百科的数据改进自然语言处理任务(上)
用维基百科的数据改进自然语言处理任务
131 0
用维基百科的数据改进自然语言处理任务(上)