《Clojure数据分析秘笈》——1.4节将JSON数据读入Incanter数据集

简介:

本节书摘来自华章社区《Clojure数据分析秘笈》一书中的第1章,第1.4节将JSON数据读入Incanter数据集,作者(美)Eric Rochester,更多章节内容可以访问云栖社区“华章社区”公众号查看

1.4 将JSON数据读入Incanter数据集
另一个越来越流行的数据格式是JavaScript Object Notation(JSON,详见http://json.org/)。与CSV相似,JSON也是无格式的文本,因此程序容易处理。它提供了相对于CSV文件关于数据的更多信息,但是代价是更冗长。JSON格式允许用更复杂的方式使数据结构化,例如层次结构或者序列层次结构。
由于JSON是比CSV更完善的数据模型,因此使用时可能需要转换数据。在这种情况下,可以将感兴趣的信息取出,在传入Incanter之前精简嵌入的映射。然而这种方法仅用于处理相当简单的数据结构。
1.4.1 准备工作
首先,在Leiningen的project.clj文件中包含以下依赖:


63f5dab23e631ddfd8f6f42bc5f8b0a5708db43d

在REPL解释器或程序中使用下列库:


513cf8225709d681cc041b349d6d8cb6016e2155

1.4.3 实现原理
和所有的Lisp语言相似,Clojure通常采用从内层到外层、从右到左的方式读取数据。接下来详细说明。clojure.core/slurp将读入文件内容并以字符串的形式返回。对于非常大的文件来说这明显不是个好主意,但是对小文件来说却很实用。clojure.data.json/read-json从slurp中得到数据,将其以JSON格式进行解析,并返回本地的Clojure数据结构。在本例中,它返回一个由向量组成的映射。maps.incanter.core/to-dataset读入一个映射序列,然后返回Incanter数据集。这将会使用映射中的键作为列名并将数据值转换成矩阵。事实上,to-dataset可以接收许多不同的数据结构。在REPL解释器上尝试(doc to-dataset)命令,或者登录http://data-sorcery.org/contents/查看Incanter文档中的详细内容。

相关文章
|
1月前
|
存储 机器学习/深度学习 数据可视化
数据集中存在大量的重复值,会对后续的数据分析和处理产生什么影响?
数据集中存在大量重复值可能会对后续的数据分析和处理产生多方面的负面影响
113 56
|
9天前
|
数据采集 监控 数据挖掘
常用电商商品数据API接口(item get)概述,数据分析以及上货
电商商品数据API接口(item get)是电商平台上用于提供商品详细信息的接口。这些接口允许开发者或系统以编程方式获取商品的详细信息,包括但不限于商品的标题、价格、库存、图片、销量、规格参数、用户评价等。这些信息对于电商业务来说至关重要,是商品数据分析、价格监控、上货策略制定等工作的基础。
|
2月前
|
数据采集 JSON 数据处理
抓取和分析JSON数据:使用Python构建数据处理管道
在大数据时代,电商网站如亚马逊、京东等成为数据采集的重要来源。本文介绍如何使用Python结合代理IP、多线程等技术,高效、隐秘地抓取并处理电商网站的JSON数据。通过爬虫代理服务,模拟真实用户行为,提升抓取效率和稳定性。示例代码展示了如何抓取亚马逊商品信息并进行解析。
抓取和分析JSON数据:使用Python构建数据处理管道
|
1月前
|
JSON 数据格式 索引
Python中序列化/反序列化JSON格式的数据
【11月更文挑战第4天】本文介绍了 Python 中使用 `json` 模块进行序列化和反序列化的操作。序列化是指将 Python 对象(如字典、列表)转换为 JSON 字符串,主要使用 `json.dumps` 方法。示例包括基本的字典和列表序列化,以及自定义类的序列化。反序列化则是将 JSON 字符串转换回 Python 对象,使用 `json.loads` 方法。文中还提供了具体的代码示例,展示了如何处理不同类型的 Python 对象。
|
1月前
|
JSON 缓存 前端开发
PHP如何高效地处理JSON数据:从编码到解码
在现代Web开发中,JSON已成为数据交换的标准格式。本文探讨了PHP如何高效处理JSON数据,包括编码和解码的过程。通过简化数据结构、使用优化选项、缓存机制及合理设置解码参数等方法,可以显著提升JSON处理的性能,确保系统快速稳定运行。
|
2月前
|
XML JSON 数据可视化
数据集学习笔记(二): 转换不同类型的数据集用于模型训练(XML、VOC、YOLO、COCO、JSON、PNG)
本文详细介绍了不同数据集格式之间的转换方法,包括YOLO、VOC、COCO、JSON、TXT和PNG等格式,以及如何可视化验证数据集。
332 1
数据集学习笔记(二): 转换不同类型的数据集用于模型训练(XML、VOC、YOLO、COCO、JSON、PNG)
|
2月前
|
JSON JavaScript Java
在Java中处理JSON数据:Jackson与Gson库比较
本文介绍了JSON数据交换格式及其在Java中的应用,重点探讨了两个强大的JSON处理库——Jackson和Gson。文章详细讲解了Jackson库的核心功能,包括数据绑定、流式API和树模型,并通过示例演示了如何使用Jackson进行JSON解析和生成。最后,作者分享了一些实用的代码片段和使用技巧,帮助读者更好地理解和应用这些工具。
178 0
在Java中处理JSON数据:Jackson与Gson库比较
|
1月前
|
JSON API 数据安全/隐私保护
拍立淘按图搜索API接口返回数据的JSON格式示例
拍立淘按图搜索API接口允许用户通过上传图片来搜索相似的商品,该接口返回的通常是一个JSON格式的响应,其中包含了与上传图片相似的商品信息。以下是一个基于淘宝平台的拍立淘按图搜索API接口返回数据的JSON格式示例,同时提供对其关键字段的解释
|
2月前
|
机器学习/深度学习 人工智能 搜索推荐
某A保险公司的 数据图表和数据分析
某A保险公司的 数据图表和数据分析
67 0
某A保险公司的 数据图表和数据分析
|
2月前
|
数据可视化 数据挖掘 大数据
Python 数据分析入门:从零开始处理数据集
Python 数据分析入门:从零开始处理数据集

热门文章

最新文章