JavaWeb - Hutool Bug HttpResponse body 方法中文乱码

简介: JavaWeb - Hutool Bug HttpResponse body 方法中文乱码

应用代码

​HttpResponsehttpResponse= ...;
httpResponse.body();

body 源码

...
/*** 获取响应主体* * @return String* @throws HttpException 包装IO异常*/publicStringbody() throwsHttpException {
returnHttpUtil.getString(bodyBytes(), this.charset, null==this.charsetFromResponse);
}
/*** 获取响应流字节码<br>* 此方法会转为同步模式* * @return byte[]*/publicbyte[] bodyBytes() {
sync();
returnthis.bodyBytes;
}
/*** 从流中读取内容<br>* 首先尝试使用charset编码读取内容(如果为空默认UTF-8),如果isGetCharsetFromContent为true,则通过正则在正文中获取编码信息,转换为指定编码;** @param contentBytes            内容byte数组* @param charset                 字符集* @param isGetCharsetFromContent 是否从返回内容中获得编码信息* @return 内容*/publicstaticStringgetString(byte[] contentBytes, Charsetcharset, booleanisGetCharsetFromContent) {
if (null==contentBytes) {
returnnull;
    }
if (null==charset) {
charset=CharsetUtil.CHARSET_UTF_8;
    }
Stringcontent=newString(contentBytes, charset);
if (isGetCharsetFromContent) {
finalStringcharsetInContentStr=ReUtil.get(META_CHARSET_PATTERN, content, 1);
if (StrUtil.isNotBlank(charsetInContentStr)) {
CharsetcharsetInContent=null;
try {
charsetInContent=Charset.forName(charsetInContentStr);
            } catch (Exceptione) {
if (StrUtil.containsIgnoreCase(charsetInContentStr, "utf-8") ||StrUtil.containsIgnoreCase(charsetInContentStr, "utf8")) {
charsetInContent=CharsetUtil.CHARSET_UTF_8;
                } elseif (StrUtil.containsIgnoreCase(charsetInContentStr, "gbk")) {
charsetInContent=CharsetUtil.CHARSET_GBK;
                }
// ignore            }
if (null!=charsetInContent&&false==charset.equals(charsetInContent)) {
content=newString(contentBytes, charsetInContent);
            }
        }
    }
returncontent;
}
...

该死的代码

finalStringcharsetInContentStr=ReUtil.get(META_CHARSET_PATTERN, content, 1);
/*** 正则:匹配meta标签的编码信息*/publicstaticfinalPatternMETA_CHARSET_PATTERN=Pattern.compile("<meta[^>]*?charset\\s*=\\s*['\"]?([a-z0-9-]*)", Pattern.CASE_INSENSITIVE);

貌似在说如果你的内容里有 charset 关键词的话就会匹配上,好吧,上一个反例但又是合情合理的业务场景,这个用例中就出现内容里含有这个,但是不能代表说我这个解析就要用这个编码呀!

{"content":"<meta http-equiv=\\\"Content-Type\\\" content=\\\"text/html; charset=utf-8\\\"></meta>"}

解决方案

/*** byte[] 转 String UTF-8* @param content*/publicstaticStringparseString(byte[] content) throwsUnsupportedEncodingException {
returnnewString(content, CharsetNames.UTF_8);
}
目录
相关文章
|
7月前
|
JavaScript Java 大数据
基于JavaWeb的销售管理系统设计系统
本系统基于Java、MySQL、Spring Boot与Vue.js技术,构建高效、可扩展的销售管理平台,实现客户、订单、数据可视化等全流程自动化管理,提升企业运营效率与决策能力。
|
6月前
|
Java
Java语言实现字母大小写转换的方法
Java提供了多种灵活的方法来处理字符串中的字母大小写转换。根据具体需求,可以选择适合的方法来实现。在大多数情况下,使用 String类或 Character类的方法已经足够。但是,在需要更复杂的逻辑或处理非常规字符集时,可以通过字符流或手动遍历字符串来实现更精细的控制。
427 18
|
6月前
|
Java 编译器 Go
【Java】(5)方法的概念、方法的调用、方法重载、构造方法的创建
Java方法是语句的集合,它们在一起执行一个功能。方法是解决一类问题的步骤的有序组合方法包含于类或对象中方法在程序中被创建,在其他地方被引用方法的优点使程序变得更简短而清晰。有利于程序维护。可以提高程序开发的效率。提高了代码的重用性。方法的名字的第一个单词应以小写字母作为开头,后面的单词则用大写字母开头写,不使用连接符。例如:addPerson。这种就属于驼峰写法下划线可能出现在 JUnit 测试方法名称中用以分隔名称的逻辑组件。
297 4
|
7月前
|
算法 安全 Java
除了类,Java中的接口和方法也可以使用泛型吗?
除了类,Java中的接口和方法也可以使用泛型吗?
234 11
|
6月前
|
编解码 Java 开发者
Java String类的关键方法总结
以上总结了Java `String` 类最常见和重要功能性方法。每种操作都对应着日常编程任务,并且理解每种操作如何影响及处理 `Strings` 对于任何使用 Java 的开发者来说都至关重要。
395 5
|
8月前
|
算法 Java 开发者
Java 项目实战数字华容道与石头迷阵游戏开发详解及实战方法
本文介绍了使用Java实现数字华容道和石头迷阵游戏的技术方案与应用实例,涵盖GUI界面设计、二维数组操作、游戏逻辑控制及自动解法算法(如A*),适合Java开发者学习游戏开发技巧。
520 46
|
7月前
|
Java 开发者
Java 函数式编程全解析:静态方法引用、实例方法引用、特定类型方法引用与构造器引用实战教程
本文介绍Java 8函数式编程中的四种方法引用:静态、实例、特定类型及构造器引用,通过简洁示例演示其用法,帮助开发者提升代码可读性与简洁性。
|
8月前
|
存储 Java
Java LocalDateTime与hutool DateUtil实现秒转换为时分秒格式化展示。
注意:以上代码示例仅适合于处理小于24小时内(86400s) 总积 因 LocalDateTime 和 Local Time 不支持超过24小时表达而 huo tool示例虽然理论上支持但未考虑超过24小时情况下可能出现负值等异常情况处理细节需用户自行添加相关逻辑以确保正确性.
529 7
|
9月前
|
安全 Java API
Java 17 及以上版本核心特性在现代开发实践中的深度应用与高效实践方法 Java 开发实践
本项目以“学生成绩管理系统”为例,深入实践Java 17+核心特性与现代开发技术。采用Spring Boot 3.1、WebFlux、R2DBC等构建响应式应用,结合Record类、模式匹配、Stream优化等新特性提升代码质量。涵盖容器化部署(Docker)、自动化测试、性能优化及安全加固,全面展示Java最新技术在实际项目中的应用,助力开发者掌握现代化Java开发方法。
393 1
|
8月前
|
算法 Java
Java语言实现链表反转的方法
这种反转方法不需要使用额外的存储空间,因此空间复杂度为,它只需要遍历一次链表,所以时间复杂度为,其中为链表的长度。这使得这种反转链表的方法既高效又实用。
620 0