使用Tensorboard投影进行高维向量的可视化

简介: 使用Tensorboard投影进行高维向量的可视化

Tensorflow是最受欢迎的免费开放源代码机器学习库之一,可帮助您执行各种机器学习和深度学习项目。它可以用于各种任务,包括训练,推理,可视化ML和DL模型。它还提供了各种各样的预训练模型。

TensorBoard是tensorflow的可视化工具包。它帮助我们可视化各种机器学习实验。

我们可以用TensorBoard做什么?

  • TB可以帮助我们追踪各种指标,例如机器学习训练的损失和准确性。
  • 模型图可以可视化。
  • 我们可以查看权重,偏差或其他张量的直方图。
  • 将高维嵌入图绘制到低维空间。可视化并理解它
  • 显示图像,文本和音频数据
  • 等等

640.png

如标题中所述,我们将专注于将Tensorboard嵌入式投影用于我们自己的用例以及我们自己的特征向量。

在此之前,我们来看一些词嵌入和图像特征向量的可视化示例。

Word2Vec嵌入示例

640.png

MNIST

640.png

您可以通过两种方式将projector与TB一起使用。

直接上传特征向量

使用这里加载按钮直接上传。

640.png

要加载要可视化的数据,我们必须了解加载数据的格式。为了可视化,需要以tsv格式上传特征向量。每行代表一个特征向量,并以'\ t'空格分隔。然后还必须以tsv格式添加元数据。特征向量和标签的顺序应与其映射标签以进行可视化的顺序相同。如果你也要提供该类,则在元数据中以制表符分隔的列中,可以指定该类。但是如果添加两列,则必须添加列名称。

640.png

640.png

使用代码

使用tensorboard在本地计算机上嵌入投影仪,首先需要安装tensorflow。

现在,您需要导入和加载必要的程序包和扩展。

640.png

在这里,我们导入tensorboard扩展。之后,我们从tensorflow.plugins加载projector。

然后设置一个日志目录,以便Tensorboard知道在哪里查找文件。

这个例子需要metadata.tsv和features.txt(txt格式的向量)。您可以根据自己的喜好选择两者。

640.png

在这里,我正在创建一个名为test和inside 的日志目录,使用已经创建的metadata.tsv,其中包含元数据和features.txt,其中包含特征向量。对于元数据,它与上述情况相同。但是对于features.txt,我只是将每个功能附加到列表中,并使用np.savetxt函数将其保存。

640.png

最后需要使用以下命令运行TB,就完成了

640.png

如果想直接访问TB,可以使用浏览器打开localhost:6006。

目录
相关文章
向量 (高维思考)
向量 (高维思考)
90 0
|
自然语言处理 程序员 容器
向量学习之高维思考
向量学习之高维思考
向量带来的高维思维
学习向量对于我们来说是突然的,感觉我一直在经历“降维打击”,经过十几节课的系统学习,向量似乎在我的眼里和高中时候的不太一样了。为什么这么说呢?在以前的认知里,向量就是简单的“有大小、有方向的量”,
|
机器学习/深度学习 算法 搜索推荐
高维向量检索的设计与实践(一)|学习笔记
快速学习高维向量检索的设计与实践(一)
287 0
高维向量检索的设计与实践(一)|学习笔记
|
存储 SQL 算法
高维向量检索的设计与实践(二)|学习笔记
快速学习高维向量检索的设计与实践(二)
314 0
高维向量检索的设计与实践(二)|学习笔记
|
存储 算法 数据挖掘
高维向量检索的设计与实践(三)|学习笔记
快速学习高维向量检索的设计与实践(三)
203 0
高维向量检索的设计与实践(三)|学习笔记
|
BI 数据库 开发者
高维向量检索的设计与实践|学习笔记
快速学习高维向量检索的设计与实践
129 0
高维向量检索的设计与实践|学习笔记
|
关系型数据库
《高维向量检索技术在PG中的设计与实践》电子版地址
高维向量检索技术在PG中的设计与实践
80 0
《高维向量检索技术在PG中的设计与实践》电子版地址
|
存储 算法 搜索推荐
高维向量检索技术在PG中的设计与实践 ——杨文(缁尘)
高维向量检索技术在PG中的设计与实践 ——杨文(缁尘)
高维向量检索技术在PG中的设计与实践                                    ——杨文(缁尘)
|
存储 运维 Oracle
【PostgreSQL 创新营】第一课:高维向量检索的设计与实践 答疑汇总
【PostgreSQL 创新营】第一课:高维向量检索的设计与实践 答疑汇总
512 0
【PostgreSQL 创新营】第一课:高维向量检索的设计与实践 答疑汇总
下一篇
DataWorks