C# 解析“JSON“格式数据和网络实战案例 入门

本文涉及的产品
全局流量管理 GTM,标准版 1个月
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
云解析 DNS,旗舰版 1个月
简介: C# 解析“JSON“格式数据和网络实战案例 入门

实战:

前言:

解析JSON格式的数据对于爬虫来说非常重要,网页中大部分的接口基本返回的都是这个格式,如果只是想要小部分的数据可以使用字符串的分割,但是一般爬取内容基本不会小部分…如果一直使用字符串分割非常的消耗时间和内存

什么是JSON格式?

先看看长什么样子

这是一个对象格式的数据

{
  "name": "生产队的驴",
  "age": "17",
  "state": "在线",
  "id": "dpc5201314",
  "phone": "18888888888", 
}

这就是一个简单的JSON格式的数据,当然爬虫一般数据没那么点…

JSON分为两种格式 一种是对象(Objtect),另一种是数组(Array) 不同的格式解析的方法不一样 但大同小异

分辨格式:

分辨格式特别简单

这是看他前面的符号 { } 是对象 ,[ ] 是数组

对象格式:

数组格式:

{
    "employees": [
        {
            "firstName": "Bill",
            "lastName": "Gates"
        },
        {
            "firstName": "George",
            "lastName": "Bush"
        },
        {
            "firstName": "Thomas",
            "lastName": "Carter"
        }
    ]
}

{ 这是对象 }

[ 这是数组 ]

数组是可以通过下标访问的

JSON结构:

可以看到他是一个 数型 结构

访问里面的元素结需要 先拿下 树根(employees)然后这得到 树叶(firstName)

上面说到 数组是可以通过下标访问对应的内容


C#解析

简单的介绍了一下他的格式 接下来就是这么使用C#解析他了

需要使用到 Newtonsoft.Json 类库

安装即可

命名空间:

using Newtonsoft.Json.Linq;

记得导入命名空间

对象 和 数组所以的函数不一样

对象:JObject
数组:JArray

JS整理工具:

正常爬虫 返回的数据非常的乱 所以需要搭配JS工具来整理

无从下手

整理后一目了然

在线JS解析工具


对象解析:

首先需要有JSON数据,这里方便演示直接从本地导入…当然正常爬虫是从服务器上获取的…只是为了演示

StreamReader read = new StreamReader(@"C:\Users\Acer\Desktop\1.txt", Encoding.UTF8);
  //读取文本
string str =read.ReadToEnd();

文本内容

{ } 是对象 使用对象的函数解析,

JObject arr = JObject.Parse(str);
 Console.WriteLine("名字:"+arr["name"]);
  Console.WriteLine("年龄:" + arr["age"]);
  Console.WriteLine("状态:" + arr["state"]);
 Console.WriteLine("账号:" + arr["id"]);
 Console.WriteLine("手机号:" + arr["phone"]);

通过对象 获取他的节点 arr[“age”]

因为不是实战…没难度

数组解析:

这个其实还是一个 对象 里面包含了一个数组 所以需要强制转换

读取JSON:

StreamReader read = new StreamReader(@"C:\Users\Acer\Desktop\2.txt", Encoding.UTF8);    
        string str =read.ReadToEnd();

强制转格式:

JObject j = JObject.Parse(str);
JArray r = (JArray)j["employees"];
//强制转成数组 因为要获取employees

转换成功后就可以 使用下标去获取 需要的数据了

显示数据:

Console.WriteLine(r[1]["firstName"]);

第一个[ ]为下标 第二个为 获取哪个节点

如果需要显示全部数据那就可以 使用循环访问下标 获取

for (int i = 0; i < r.Count; i++)
            {
                Console.WriteLine(r[i]["firstName"]);
            }

其他节点也是一样的

for (int i = 0; i < r.Count; i++)
            {
                Console.WriteLine(r[i]["firstName"]);
                Console.WriteLine(r[i]["lastName"]+"\n");
            }


说那么多 直接加入实战…

某评论区:

数据太乱 去整理

在线JS解析工具

因为JSON是可以嵌套的 当每次想访问哪个节点时 就必须先获取上一个节点

所有的数据都包含 data (树根)上 里还嵌套着 visionCommentList 和 rootComments 其中rootComments 就是他的评论数据 他是一个数组

authorName:用户名

content:评论内容

headurl:用户头像

这是一个对象 先用对象的方式获取他

JObject j = JObject.Parse(str);

获取嵌套的节点:

string js = j["data"]["visionCommentList"]["rootComments"].ToString();
  JArray r = JArray.Parse(js);
  //剩下的就是 数组 然后使用数组的方式解析

循环下标 显示评论

for (int i = 0; i < r.Count; i++)
            {
 Console.WriteLine("\n"+r[i]["authorName"]+": "+r[i]["content"]);
            }

总结:

好像都没什么难度,在真正做爬虫的时候 找接口 和 传递的参数才是难点…

纯手打,点个赞呗~

相关文章
|
1月前
|
JSON JavaScript Java
对比JSON和Hessian2的序列化格式
通过以上对比分析,希望能够帮助开发者在不同场景下选择最适合的序列化格式,提高系统的整体性能和可维护性。
44 3
|
1月前
|
JSON 数据格式 索引
Python中序列化/反序列化JSON格式的数据
【11月更文挑战第4天】本文介绍了 Python 中使用 `json` 模块进行序列化和反序列化的操作。序列化是指将 Python 对象(如字典、列表)转换为 JSON 字符串,主要使用 `json.dumps` 方法。示例包括基本的字典和列表序列化,以及自定义类的序列化。反序列化则是将 JSON 字符串转换回 Python 对象,使用 `json.loads` 方法。文中还提供了具体的代码示例,展示了如何处理不同类型的 Python 对象。
|
1月前
|
JSON Java 数据格式
springboot中表字段映射中设置JSON格式字段映射
springboot中表字段映射中设置JSON格式字段映射
134 1
|
1月前
|
JSON 人工智能 算法
探索LLM推理全阶段的JSON格式输出限制方法
文章详细讨论了如何确保大型语言模型(LLMs)输出结构化的JSON格式,这对于提高数据处理的自动化程度和系统的互操作性至关重要。
|
1月前
|
JSON API 数据安全/隐私保护
拍立淘按图搜索API接口返回数据的JSON格式示例
拍立淘按图搜索API接口允许用户通过上传图片来搜索相似的商品,该接口返回的通常是一个JSON格式的响应,其中包含了与上传图片相似的商品信息。以下是一个基于淘宝平台的拍立淘按图搜索API接口返回数据的JSON格式示例,同时提供对其关键字段的解释
|
2月前
|
SQL 缓存 分布式计算
C#如何处理上亿级数据的查询效率
C#如何处理上亿级数据的查询效率
44 1
|
2月前
|
JSON API 数据格式
商品详情数据JSON格式示例参考(api接口)
JSON数据格式的商品详情数据通常包含商品的多个层级信息,以下是一个综合多个来源信息的JSON数据格式的商品详情数据示例参考:
|
2月前
|
中间件 数据库连接 API
C#数据分表核心代码
C#数据分表核心代码
43 0
|
2月前
|
机器学习/深度学习 JSON JavaScript
LangChain-21 Text Splitters 内容切分器 支持多种格式 HTML JSON md Code(JS/Py/TS/etc) 进行切分并输出 方便将数据进行结构化后检索
LangChain-21 Text Splitters 内容切分器 支持多种格式 HTML JSON md Code(JS/Py/TS/etc) 进行切分并输出 方便将数据进行结构化后检索
40 0
|
2月前
|
JSON JavaScript API
商品详情数据接口解析返回的JSON数据(API接口整套流程)
商品详情数据接口解析返回的JSON数据是API接口使用中的一个重要环节,它涉及从发送请求到接收并处理响应的整个流程。以下是一个完整的API接口使用流程,包括如何解析返回的JSON数据: