json中斜杠引发的惨案

简介: 最近遇到一个问题,一个json语句中包含了"/",但是toString之后发现与原字符串不一样了!这里将我研究的整个过程记录一下。

前言


最近遇到一个问题,一个json语句中包含了"/",但是toString之后发现与原字符串不一样了!这里将我研究的整个过程记录一下。


现象


代码如下:


String str1 = "{\"id\":\"1/2\"}";
Log.e("ssss", str1.hashCode() + ":" + str1);
try {
    JSONObject obj = new JSONObject(str1);
    String str2 = obj.toString();
    Log.e("ssss", str2.hashCode() + ":" + str2);
} catch (JSONException e) {
    e.printStackTrace();
}
复制代码


打印结果:

E/ssss: -1703691961:{"id":"1/2"}

E/ssss: -1233361487:{"id":"1/2"}


可以发现前后两个String不一样了,经过JSON后“/”多了一个"",所以hashcode也一样。在某些情况下就会造成一定的困扰,比如加密后传输然后解密。


探索


那么为什么会出现这种情况?一定是JSONObject的toString方法中有一些处理,我们来看一下:


@Override @NonNull public String toString() {
    try {
        JSONStringer stringer = new JSONStringer();
        writeTo(stringer);
        return stringer.toString();
    } catch (JSONException e) {
        return null;
    }
}
复制代码


可以看到创建一个JSONStringer,然后调用writeTo函数:


void writeTo(JSONStringer stringer) throws JSONException {
    stringer.object();
    for (Map.Entry<String, Object> entry : nameValuePairs.entrySet()) {
        stringer.key(entry.getKey()).value(entry.getValue());
    }
    stringer.endObject();
}
复制代码


这里将JSON的键值对对应放入JSONStringer对象,然后我们看看value函数:


public JSONStringer value(Object value) throws JSONException {
    if (stack.isEmpty()) {
        throw new JSONException("Nesting problem");
    }
    if (value instanceof JSONArray) {
        ((JSONArray) value).writeTo(this);
        return this;
    } else if (value instanceof JSONObject) {
        ((JSONObject) value).writeTo(this);
        return this;
    }
    beforeValue();
    if (value == null
            || value instanceof Boolean
            || value == JSONObject.NULL) {
        out.append(value);
    } else if (value instanceof Number) {
        out.append(JSONObject.numberToString((Number) value));
    } else {
        string(value.toString());
    }
    return this;
}
复制代码


可以看到如果value是JSONObject或JSONArray,那么又执行writeTo一层一层的解析。直到value不是JSON类型,这时候如果不是null,boolean或number类型,就会调用string函数来处理value.toString()。所以可以看到不是简单的toString,那么string函数又作了什么?


private void string(String value) {
    out.append("\"");
    for (int i = 0, length = value.length(); i < length; i++) {
        char c = value.charAt(i);
        /*
         * From RFC 4627, "All Unicode characters may be placed within the
         * quotation marks except for the characters that must be escaped:
         * quotation mark, reverse solidus, and the control characters
         * (U+0000 through U+001F)."
         */
        switch (c) {
            case '"':
            case '\\':
            case '/':
                out.append('\\').append(c);
                break;
            case '\t':
                out.append("\\t");
                break;
            case '\b':
                out.append("\\b");
                break;
            case '\n':
                out.append("\\n");
                break;
            case '\r':
                out.append("\\r");
                break;
            case '\f':
                out.append("\\f");
                break;
            default:
                if (c <= 0x1F) {
                    out.append(String.format("\\u%04x", (int) c));
                } else {
                    out.append(c);
                }
                break;
        }
    }
    out.append("\"");
}
复制代码


可以看到处理的基本都是特殊符号,如\t,\n这类的,其中也处理了“/”,在它前面加了“\”转义字符,这实际上就是将“/”变成了“/”。


为什么?


这里我们找到根源了,但是还比较诱惑,JSON为什么要这么做?在字符串中“/”并不会出现问题,为什么一定要转换一下?

在百度百科“转义字符”这里可以看到,国际上并没有规定“/”需要转义。 在json的官网中(www.json.org/ ),可以看到是有这一项:


escape
    '"'
    '\'
    '/'
    'b'
    'f'
    'n'
    'r'
    't'
    'u' hex hex hex hex
复制代码


说明这是JSON自己规定的,那么JSON为什么单独规定这么一条?

根据网上的说法,是为了防止干扰标签<></>(如<script></script>),因为一个字符串中如果出现</就会被解析成标签,这样很容易出现问题,所以将“/”进行了转义。


再看看几种情况

  • 1、如果是多个“/”,比如"{"id":"1////2"}",执行结果

E/ssss: -1134829468:{"id":"1////2"}

E/ssss: 1868680280:{"id":"1////2"}


所以无论有几个,都会转

  • 2、如果本身就是“/”呢?如"{"id":"1\/2"}"

E/ssss: -1233361487:{"id":"1/2"}

E/ssss: -1233361487:{"id":"1/2"}


可以看到就不会转义了

  • 3、"{"id":"1\//2"}",结果是

E/ssss: 420422874:{"id":"1//2"}

E/ssss: 189688958:{"id":"1//2"}


所以,我们可以得出结论,如果是“/”就不会再转义,否则都会将"/"转成"/"。


但是!!!JS


在js中使用JSON.stringify()函数却不会将“/”自动转成"/",这样就造成了问题,因为js和java两端处理并不一致。

那么我们怎么避免这种情况?防止两端不一致?

如果在JSONObject.toString之后,替换“/”为"/"呢,显然不行,因为如果本来字符串中就有"/"的话,也会被替换成"/",这样前后依然不一致。

比较好的处理方法是,在最开始将字符串中不是"/"的"/"都转成"/"。

比如在JSON.stringify()之后,执行str = str.replace(///g, "\/");即可


目录
打赏
0
0
0
0
7
分享
相关文章
如何在Python中高效实现CSV到JSON的数据转换
在实际项目中,数据格式转换是常见问题,尤其从CSV到JSON的转换。本文深入探讨了多种转换方法,涵盖Python基础实现、数据预处理、错误处理、性能优化及调试验证技巧。通过分块处理、并行处理等手段提升大文件转换效率,并介绍如何封装为命令行工具或Web API,实现自动化批量处理。关键点包括基础实现、数据清洗、异常捕获、性能优化和单元测试,确保转换流程稳定高效。
128 83
关于商品详情 API 接口 JSON 格式返回数据解析的示例
本文介绍商品详情API接口返回的JSON数据解析。最外层为`product`对象,包含商品基本信息(如id、name、price)、分类信息(category)、图片(images)、属性(attributes)、用户评价(reviews)、库存(stock)和卖家信息(seller)。每个字段详细描述了商品的不同方面,帮助开发者准确提取和展示数据。具体结构和字段含义需结合实际业务需求和API文档理解。
处理从API返回的JSON数据时返回Unicode编码字符串怎么处理
在处理API返回的JSON数据时,遇到类似`\u7f51\u7edc\u8fde\u63a5\u9519\u8bef`的Unicode编码字符串,可使用JavaScript内置方法转换为可读文字。主要方法包括:1. 使用`JSON.parse`自动解析;2. 使用`decodeURIComponent`和`escape`组合解码;3. 在API调用中直接处理响应数据。这些方法能有效处理多语言内容,确保正确显示非ASCII字符。
淘宝商品评论数据API接口详解及JSON示例返回
淘宝商品评论数据API接口是淘宝开放平台提供的一项服务,旨在帮助开发者通过编程方式获取淘宝商品的评论数据。这些数据包括评论内容、评论时间、评论者信息、评分等,对于电商分析、用户行为研究、竞品分析等领域都具有极高的价值。
|
2月前
|
解析电商商品详情API接口系列,json数据示例参考
电商商品详情API接口是电商平台的重要组成部分,提供了商品的详细信息,支持用户进行商品浏览和购买决策。通过合理的API设计和优化,可以提升系统性能和用户体验。希望本文的解析和示例能够为开发者提供参考,帮助构建高效、可靠的电商系统。
53 12
抓取和分析JSON数据:使用Python构建数据处理管道
在大数据时代,电商网站如亚马逊、京东等成为数据采集的重要来源。本文介绍如何使用Python结合代理IP、多线程等技术,高效、隐秘地抓取并处理电商网站的JSON数据。通过爬虫代理服务,模拟真实用户行为,提升抓取效率和稳定性。示例代码展示了如何抓取亚马逊商品信息并进行解析。
109 1
抓取和分析JSON数据:使用Python构建数据处理管道
拍立淘按图搜索API接口返回数据的JSON格式示例
拍立淘按图搜索API接口允许用户通过上传图片来搜索相似的商品,该接口返回的通常是一个JSON格式的响应,其中包含了与上传图片相似的商品信息。以下是一个基于淘宝平台的拍立淘按图搜索API接口返回数据的JSON格式示例,同时提供对其关键字段的解释
Python中序列化/反序列化JSON格式的数据
【11月更文挑战第4天】本文介绍了 Python 中使用 `json` 模块进行序列化和反序列化的操作。序列化是指将 Python 对象(如字典、列表)转换为 JSON 字符串,主要使用 `json.dumps` 方法。示例包括基本的字典和列表序列化,以及自定义类的序列化。反序列化则是将 JSON 字符串转换回 Python 对象,使用 `json.loads` 方法。文中还提供了具体的代码示例,展示了如何处理不同类型的 Python 对象。
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等