行政区信息_JSON 解析|学习笔记

简介: 快速学习行政区信息_JSON 解析

开发者学堂课程【大数据 Spark2020版(知识精讲与实战演练)第四阶段 行政区信息_JSON 解析】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/691/detail/12119


行政区信息_JSON 解析

JSON 解析

后续任务获取每一个条数据下车点的行政区名称,要明确有多少行政区,每个行政区的范围,通过下车的经纬度判断属于哪一个行政区,数据集是 JSON 格式,将数据集解析出来。

工具介绍部分要解析 JSON,Geometry,通过 GeoJSON 解析工具解析成 Geometry 对象,通过工具介绍理解如何解析 JSON,如何解析 Geometry。在地理位置相关的数据中,要了解 Geometry。

1.JSON4S 介绍

(1)介绍

一般在 Java 中,常使用如下三个工具解析 JSON

Gson

Google 开源的 JSON 解析工具,也支持时间解析,比较人性化,易于使用,但是性能不如 Jackson ,也不如 Jackson 有积淀

Jackson

Jackson 是功能最完整的 JSON 解析工具,也是最老牌的 JSON 解析工具,性能也足够好,但是 API 在一开始支持的比较少,用起来稍微有点繁琐

FastJson

阿里巴巴的 JSON 开源解析工具,以快著称,但是某些方面用起来稍微有点反直觉

根据自身实际情况进行选择,三个工具在 scala 中解析 JSON,不太容易,因为 Scala 与 java 不同,没办法直接解析。

(2)什么是 JSON 解析

image.png

左侧是 JSON 数据,{代表对象,name 代表字段,age 代表另一个字段,name 是值是张三,是一个字符串,age 值的20,是一个数值型;正常情况下,使用对象表示数据表,将 JSON 字符串转成 scala 对象形式,这一过程称为 JSON 解析,JSON 与Scala 都有 name 和 age,JSON 解析简单来说是把 JSON 字符串中的信息抽取出来的过程就是 JSON 解析,一般转为 Scala 对象。

读取 JSON 数据的时候,读出来的是一个有格式的字符串,将这个字符串转换为对象的过程就叫做解析

可以使用 JSON4S 来解析 JSON,JSON4S 是一个其它解析工具的 Scala 封装以适应 Scala 的对象转换

JSON4S 支持 Jackson 作为底层的解析工具

导入两个包

Step 1:导入 Maven 依赖

<! -- JSON4S -->

<dependency>

<groupId>org.json4s</ groupId>

<artifactId>json4s-native_2.11</artifactId>

<version>$json4s.version}</version>

</dependency>

<! --JSoN4S的Jackson集成库-->

<dependency>

<groupId>org.json4s</ groupId>

<artifactId>json4s-jackson_2.11</artifactId>

<version>${json4s.version}</version>

</dependency>

导入放到项目中,找到 pom 文件

JSON4S 是 scala 中的 JSON 解析工具,S 是指 scala,JSON4S 不是一个解析工具,是一个上层 API,可以使用 Jackson 作为底层的解析工具,关系像 JSON4S 提高 API,Jackson 提供底层功能,

演示如何使用创建一个 scala class,叫做 JsonTest

将 class 改为 object,写出 main 方法,杜撰 JSON 字符串,name 代表名称,price 代表价格

创建 scala 对象 Product,名称要一一对应,可以对 product 类创建对象,将具体的值赋值。

解析 JSON 使用 parse,导入两个包

Parse 方法返回的并不是一个具体的对象,返回的格式是一个 JValue 类型的数据,JValue 类型的数据是 JSON4S 中表示 JSON 对象的类型,有 JValue 可以在其中查找信息,找到 name 中的值

运行,结果是 JString(Toy),与前面的 Toy 是一样的

object JsonTest {

def main(args: Array[string]): Unit = {

import org.json4s._

import org.json4s.jackson. JsonMethods._

val product =

"""

|{"name" : "Toy" , "price" : 35.35}

""".stripMargin

parse(product)\"name"

}

}

case class Product(name : String, price: Double)

通过 parse 解析 JSON,得到 JValue,通过 JValue 有一个自定义的方法\,\后面可以直接查找 name 字段中的值,也是解析的一种方式,最终希望将 JSON 转成 product 对象形式,直接取 name,不需要查找

通过 extra 将 JValue 转化成 product 类型,横线是缺少隐式转换,导入隐式转换进行隐式传递

使用 foemats 隐式转换是一种转换规则,

parse(product)\"name"

改为

parse(product).extract[Product]

//隐士转换的形式提供格式工具,例如如何解析时间字符串

implicit val formats = Serialization.formats(NoTypeHints)

//具体的解析为某一个对象

val productobj1 = parse(product).extract[ Product]

printLn(productobj1)

}

}

case class Product( name: string, price: Double)

运行

image.png

通过 read 方法直接将字符串转成对象形式,和 parse 有区别,parse 先转成 JValue,可以进行搜索,read 方法像序列化,使用 read 要导入包

def main(args : Array [string]): Unit = {

import org.json4s._

import org.json4s.jackson. JsonMethods._

import org.json4s.jackson.Serialization.{read,write}

val product =

"""

|{"name" : "Toy" ,"price" : 35.35}

""".stripMargin

//隐式转换的形式提供格式工具,例如i如I何解析时间字符串

implicit val formats = serialization.formats(NoTypeHints)

//具体的解析为某一个对象

val productobj1 = parse(product). extract[Product]

//可以通过一个方法,直接将 JSON 字符串转为对象,但是这种方式就无法进行搜索了

val productobj2 = read[Product](product)

println(productobj4

}

}

case class Product( name: string price: Double)

运行

可以将 JSON 字符串转成对象,同时可以将对象转成 JSON 字符串

创建一个对象,render 中接收的是对象,将结果 compact,转成具体的类型,将对象转成 JSON 字符串,render 将对象中一些非法值去掉,通过 compact 转成字符串,要求 render 中所传的不能说 product 对象,是一个 JValue 对象,只有一个对象,使用 write 方法将对象直接写为 JSON 字符串形式,read 理解为将一个字符串反序列化为对象,write 将一个对象序列化我字符串,字符串都是 JSON

格式

//隐士转换的形式提供格式工具,例如如I何解析时问字符串

implicit val formats = serialization.formats(NoTypeHints)

//具体的解析为某一个对象

val productobj1 = parse(product).extract[Product]

//可以通过一个方法,直按将 JSON 字符串转为对象,但是这种方式就无法进行搜索了

val productobj2 = read[Product](product)

//将对象转为 JSON 字符串

val productobj3 = Product("电视",10.5)

val jsonstr1 = compact(render( product0bj3))val jsonStr = write(productObj3)

println(jsonstr)

转换结果没有问题

image.png

相关文章
|
16天前
|
Python
查看DataFrame信息案例解析
该文介绍了如何使用pandas库查看DataFrame信息。首先,导入pandas并创建一个字典,将字典转换为DataFrame,展示了一组包含“姓名”、“年龄”和“城市”列的数据。之后,通过调用DataFrame的info()方法,显示了数据框的详细信息,包括行数、列数及每列的数据类型,如:3行3列,数据类型为1个int64和2个object。
12 0
|
29天前
|
算法 Linux C++
【Linux系统编程】解析获取和设置文件信息与权限的Linux系统调用
【Linux系统编程】解析获取和设置文件信息与权限的Linux系统调用
29 0
|
30天前
|
JSON JavaScript 前端开发
C++ 智能指针与 JSON 处理:高级编程技巧与常见问题解析
C++ 智能指针与 JSON 处理:高级编程技巧与常见问题解析
265 0
|
12天前
|
存储 JSON JavaScript
「Python系列」Python JSON数据解析
在Python中解析JSON数据通常使用`json`模块。`json`模块提供了将JSON格式的数据转换为Python对象(如列表、字典等)以及将Python对象转换为JSON格式的数据的方法。
28 0
|
30天前
|
JSON JavaScript 数据格式
【深入探究C++ JSON库】解析JSON元素的层级管理与遍历手段
【深入探究C++ JSON库】解析JSON元素的层级管理与遍历手段
90 2
|
1月前
|
XML JSON API
深入解析C++ JSON库:nlohmann::json:: parse的内部机制与应用
深入解析C++ JSON库:nlohmann::json:: parse的内部机制与应用
48 0
|
1月前
|
JSON 数据格式
人脸检测解析json的工具类face_test
人脸检测解析json的工具类face_test
14 0
|
1月前
|
JSON JavaScript 前端开发
如何在Python中解析JSON响应?
【2月更文挑战第26天】【2月更文挑战第92篇】如何在Python中解析JSON响应?
|
3月前
|
JSON PHP 数据格式
|
1月前
|
存储 JSON Apache
揭秘 Variant 数据类型:灵活应对半结构化数据,JSON查询提速超 8 倍,存储空间节省 65%
在最新发布的阿里云数据库 SelectDB 的内核 Apache Doris 2.1 新版本中,我们引入了全新的数据类型 Variant,对半结构化数据分析能力进行了全面增强。无需提前在表结构中定义具体的列,彻底改变了 Doris 过去基于 String、JSONB 等行存类型的存储和查询方式。
揭秘 Variant 数据类型:灵活应对半结构化数据,JSON查询提速超 8 倍,存储空间节省 65%

推荐镜像

更多