JavaWeb - Hutool Bug HttpResponse body 方法中文乱码

简介: JavaWeb - Hutool Bug HttpResponse body 方法中文乱码

应用代码

​HttpResponsehttpResponse= ...;
httpResponse.body();

body 源码

...
/*** 获取响应主体* * @return String* @throws HttpException 包装IO异常*/publicStringbody() throwsHttpException {
returnHttpUtil.getString(bodyBytes(), this.charset, null==this.charsetFromResponse);
}
/*** 获取响应流字节码<br>* 此方法会转为同步模式* * @return byte[]*/publicbyte[] bodyBytes() {
sync();
returnthis.bodyBytes;
}
/*** 从流中读取内容<br>* 首先尝试使用charset编码读取内容(如果为空默认UTF-8),如果isGetCharsetFromContent为true,则通过正则在正文中获取编码信息,转换为指定编码;** @param contentBytes            内容byte数组* @param charset                 字符集* @param isGetCharsetFromContent 是否从返回内容中获得编码信息* @return 内容*/publicstaticStringgetString(byte[] contentBytes, Charsetcharset, booleanisGetCharsetFromContent) {
if (null==contentBytes) {
returnnull;
    }
if (null==charset) {
charset=CharsetUtil.CHARSET_UTF_8;
    }
Stringcontent=newString(contentBytes, charset);
if (isGetCharsetFromContent) {
finalStringcharsetInContentStr=ReUtil.get(META_CHARSET_PATTERN, content, 1);
if (StrUtil.isNotBlank(charsetInContentStr)) {
CharsetcharsetInContent=null;
try {
charsetInContent=Charset.forName(charsetInContentStr);
            } catch (Exceptione) {
if (StrUtil.containsIgnoreCase(charsetInContentStr, "utf-8") ||StrUtil.containsIgnoreCase(charsetInContentStr, "utf8")) {
charsetInContent=CharsetUtil.CHARSET_UTF_8;
                } elseif (StrUtil.containsIgnoreCase(charsetInContentStr, "gbk")) {
charsetInContent=CharsetUtil.CHARSET_GBK;
                }
// ignore            }
if (null!=charsetInContent&&false==charset.equals(charsetInContent)) {
content=newString(contentBytes, charsetInContent);
            }
        }
    }
returncontent;
}
...

该死的代码

finalStringcharsetInContentStr=ReUtil.get(META_CHARSET_PATTERN, content, 1);
/*** 正则:匹配meta标签的编码信息*/publicstaticfinalPatternMETA_CHARSET_PATTERN=Pattern.compile("<meta[^>]*?charset\\s*=\\s*['\"]?([a-z0-9-]*)", Pattern.CASE_INSENSITIVE);

貌似在说如果你的内容里有 charset 关键词的话就会匹配上,好吧,上一个反例但又是合情合理的业务场景,这个用例中就出现内容里含有这个,但是不能代表说我这个解析就要用这个编码呀!

{"content":"<meta http-equiv=\\\"Content-Type\\\" content=\\\"text/html; charset=utf-8\\\"></meta>"}

解决方案

/*** byte[] 转 String UTF-8* @param content*/publicstaticStringparseString(byte[] content) throwsUnsupportedEncodingException {
returnnewString(content, CharsetNames.UTF_8);
}
目录
相关文章
|
2月前
|
消息中间件 Java Kafka
在Java中实现分布式事务的常用框架和方法
总之,选择合适的分布式事务框架和方法需要综合考虑业务需求、性能、复杂度等因素。不同的框架和方法都有其特点和适用场景,需要根据具体情况进行评估和选择。同时,随着技术的不断发展,分布式事务的解决方案也在不断更新和完善,以更好地满足业务的需求。你还可以进一步深入研究和了解这些框架和方法,以便在实际应用中更好地实现分布式事务管理。
|
2月前
|
Java
java小工具util系列5:java文件相关操作工具,包括读取服务器路径下文件,删除文件及子文件,删除文件夹等方法
java小工具util系列5:java文件相关操作工具,包括读取服务器路径下文件,删除文件及子文件,删除文件夹等方法
84 9
|
10天前
|
JSON 前端开发 Java
【Bug合集】——Java大小写引起传参失败,获取值为null的解决方案
类中成员变量命名问题引起传送json字符串,但是变量为null的情况做出解释,@Data注解(Spring自动生成的get和set方法)和@JsonProperty
|
2月前
|
安全 Java 开发者
Java中WAIT和NOTIFY方法必须在同步块中调用的原因
在Java多线程编程中,`wait()`和`notify()`方法是实现线程间协作的关键。这两个方法必须在同步块或同步方法中调用,这一要求背后有着深刻的原因。本文将深入探讨为什么`wait()`和`notify()`方法必须在同步块中调用,以及这一机制如何确保线程安全和避免死锁。
47 4
|
2月前
|
Java
深入探讨Java中的中断机制:INTERRUPTED和ISINTERRUPTED方法详解
在Java多线程编程中,中断机制是协调线程行为的重要手段。了解和正确使用中断机制对于编写高效、可靠的并发程序至关重要。本文将深入探讨Java中的`Thread.interrupted()`和`Thread.isInterrupted()`方法的区别及其应用场景。
55 4
|
2月前
|
Java 数据处理 数据安全/隐私保护
Java处理数据接口方法
Java处理数据接口方法
27 1
|
3月前
|
Java API
Java 对象释放与 finalize 方法
关于 Java 对象释放的疑惑解答,以及 finalize 方法的相关知识。
62 17
|
2月前
|
存储 Java 程序员
Java基础的灵魂——Object类方法详解(社招面试不踩坑)
本文介绍了Java中`Object`类的几个重要方法,包括`toString`、`equals`、`hashCode`、`finalize`、`clone`、`getClass`、`notify`和`wait`。这些方法是面试中的常考点,掌握它们有助于理解Java对象的行为和实现多线程编程。作者通过具体示例和应用场景,详细解析了每个方法的作用和重写技巧,帮助读者更好地应对面试和技术开发。
137 4
|
2月前
|
Java 测试技术 Maven
Java一分钟之-PowerMock:静态方法与私有方法测试
通过本文的详细介绍,您可以使用PowerMock轻松地测试Java代码中的静态方法和私有方法。PowerMock通过扩展Mockito,提供了强大的功能,帮助开发者在复杂的测试场景中保持高效和准确的单元测试。希望本文对您的Java单元测试有所帮助。
295 2
|
3月前
|
Java 开发者
在Java多线程编程中,创建线程的方法有两种:继承Thread类和实现Runnable接口
【10月更文挑战第20天】在Java多线程编程中,创建线程的方法有两种:继承Thread类和实现Runnable接口。本文揭示了这两种方式的微妙差异和潜在陷阱,帮助你更好地理解和选择适合项目需求的线程创建方式。
41 3