【Servlet篇】如何解决Request请求中文乱码的问题?

简介: 【Servlet篇】如何解决Request请求中文乱码的问题?

前言


前面一篇文章我们探讨了 Servlet 中的 Request 对象,Request 请求对象中封装了请求数据,使用相应的 API 就可以获取请求参数。

【Servlet篇】一文带你读懂 Request 对象

也许有小伙伴已经发现了前面的方式获取请求参数时,会出现中文乱码的情况,本文就是为了解决获取请求参数中文乱码的问题,本文以 POST 请求方式和 GET 请求方式为例,其他的请求方式类似,这里不再赘述。

问题引入


第一步:在 webapps 文件目录下创建 req.html ,在 HTML 添加表单,并且指定页面的请求方式为 get 。

<!DOCTYPE html>
<html lang="en">
<head>
  <meta charset="UTF-8">
  <title>Title</title>
</head>
<body>
<form action="/servlet-project/demo" method="get">
  <input type="text" name="username"><br>
  <input type="password" name="password"><br>
  <input type="checkbox" name="hobby" value="1"> 游泳
  <input type="checkbox" name="hobby" value="2"> 爬山 <br>
  <input type="submit">
</form>
</body>
</html>


第二步:在 Servlet 获取参数并打印。

@WebServlet("/demo")
public class ServletDemo extends HttpServlet {
    @Override
    protected void doGet(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException {
        String username = req.getParameter("username");
        System.out.println(username);
    }
    @Override
    protected void doPost(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException {
    }
}


第三步:启动服务器,在页面上输入中文。

4.1.png


第四步:查看控制台输出

4.2.png

修改 form 表单中页面发送请求的方式为 post ,继续上面的步骤进行验证。我们发现,不管是 get 请求还是 post 请求,在发送的请求中如果存在中文,那么服务器接收到的数据都会出现中文乱码的情况,具体该如何解决这个问题呢?

POST请求的解决方案


出现中文乱码的情况的原因:

在 post 请求方式中,我们通过 request 对象的 getReader() 方法来获取流中的数据,其中,页面的编码方式为 UTF-8,而 TomCat 在获取流的时候采取的是 ISO-8859-1 的编码方式,而此方式是不支持中文的。由于编码和解码的方式不相同,ISO-8859-1 编码方式不支持中文,导致了控制台出现中文乱码的情况。

要想解决这个问题,我们只需要将页面的编码方式和 TomCat 在获取流数据之前的编码方式都设置为 UTF-8。通过下面的方式设置 TomCat 获取流对象之前的编码方式:

request.setCharacterEncoding("utf-8");


示例:

@WebServlet("/demo")
public class ServletDemo extends HttpServlet {
    @Override
    protected void doGet(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException {
        //1.解决中文乱码的问题
        //设置编码方式为utf-8
        request.setCharacterEncoding("utf-8");
        String username = request.getParameter("username");
        System.out.println(username);
    }
    @Override
    protected void doPost(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException {
        this.doGet(request,response);
    }
}


此时重新发送 post 请求就会在控制台正常展示中文结果。

我们已经解决了 post 请求中文乱码的问题,但是这个方法不适用于 get 请求,接下来我们探讨 get 请求中文乱码的解决方案。

GET请求的解决方案


在 post 请求方式中,使用流的方式获取请求数据,所以出现中文乱码后我们可以通过设置流的编码方式来解决,但是这样的方式并不适用于 get 请求方式,因为 get 请求使用的并不是流的方式来获取请求数据。get 请求方式获取数据:

request.getQueryString();


get 请求方式出现乱码的原因分析:

浏览器通过 HTTP 协议发送请求和数据到服务器,在这个过程中会对中文进行 URL 编码,编码的方式为页面指定的 UTF-8,服务器接收到这个编码的数据以后会按照 ISO-8859-1 的编码方式进行 URL 解码,由于前后编码的方式不同导致了中文乱码。ISO-8859-1 本身是不支持中文的,所以即使我们修改页面的编码方式为 ISO-8859-1 编码也不能解决中文乱码的问题。

4.3.png

那么什么是 URL 编码,URL 解码呢?我们如何解决 get 请求方式中文乱码的问题?

URL 编码的大致过程是这样的,首先,将字符串按照编码的方式转换为二进制,然后每个字节转换为 2 个 16 进制的数据并在前面加上 %。

示例:将 张三 进行 URL 编码

第一步:按照 UTF-8 的方式,找到张三两个汉字对应的十进制并转换为二进制

1110 0101 1011 1100 1010 0000 1110 0100 1011 1000 1000 1001


第二步:每个字节转换为 2 为 16 进制数,并且在前面加上 %

%E5%BC%A0%E4%B8%89


Java 中提供编码和解码的 API 工具类让我们更加快速的进行编码和解码的操作。

编码:

java.net.URLEncoder.encode("需要被编码的内容","字符集(UTF-8)")

解码:

java.net.URLDecoder.decode("需要被解码的内容","字符集(UTF-8)")


知道了乱码产生的原因,我们就来解决这个问题。

4.4.png

从上图可以看出,不管使用哪一种字符集,其对应的 %E5%BC%A0%E4%B8%89 都是相同的,即二进制数据是相同的,所以我们可以将乱码的数据转化为字节,再把字节转换为正确的中文汉字,在转换的过程中保证编码的一致,这样就解决了中文乱么的问题。具体实现步骤为:

  • 获取乱码数据对应的二进制数组
  • 按照 UTF-8 的形式获取二进制数据对应的字符串


示例:

public class URLDemo {
  public static void main(String[] args) throws UnsupportedEncodingException {
        String username = "张三";
        //1. URL编码
        String encode = URLEncoder.encode(username, "utf-8");
        System.out.println(encode);
        //2. URL解码
        String decode = URLDecoder.decode(encode, "ISO-8859-1");
        System.out.println(decode); //此处打印的是对应的乱码数据
        //3. 转换为字节数据,编码
        byte[] bytes = decode.getBytes("ISO-8859-1");
        for (byte b : bytes) {
            System.out.print(b + " ");
        }
  //此处打印的是:-27 -68 -96 -28 -72 -119
        //4. 将字节数组转为字符串,解码
        String s = new String(bytes, "utf-8");
        System.out.println(s); //此处打印的是张三
    }
}


回到开始的问题,解决 get 请求中请求参数的中文乱码问题:

@WebServlet("/demo")
public class ServletDemo extends HttpServlet {
    @Override
    protected void doGet(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException {
        String username = request.getParameter("username");
        System.out.println("解决乱码前:"+username);
        byte[] bytes = username.getBytes(StandardCharsets.ISO_8859_1);
        username = new String(bytes, StandardCharsets.UTF_8);
        System.out.println("解决乱码后:"+username);
    }
    @Override
    protected void doPost(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException {
        this.doGet(request, response);
    }
}


同样,这种方式也适用于 post 请求方式解决中文乱码问题。

重点:在 TomCat 8 以后,get 请求方式的中文乱码的问题已经解决,其解决的思路就是官方将解码的方式由原来的 ISO-8859-1 转换为 UTF-8。所以,如果你的 Maven 坐标中配置的是 TomCat 8 以后的版本,get 请求方式不再出现乱码。

目录
相关文章
|
6月前
|
XML Java 数据格式
Servlet 教程 之 Servlet 客户端 HTTP 请求 3
该教程展示了如何在Servlet中处理客户端HTTP请求,特别是获取HTTP头信息。示例代码创建了一个名为`DisplayHeader`的Servlet,它扩展了`HttpServlet`并重写了`doGet`方法。在`doGet`中,使用`HttpServletRequest`的`getHeaderNames()`遍历所有头部,显示其名称和对应值。Servlet在TomcatTest项目下,通过`web.xml`配置映射到`/TomcatTest/DisplayHeader`路径。
59 14
|
6月前
|
安全 Java 网络安全
Servlet 教程 之 Servlet 客户端 HTTP 请求 2
Servlet教程介绍了如何在Servlet中处理HTTP请求,包括获取Cookie、头信息、参数、Session等。方法如:`getCookies()`、`getAttributeNames()`、`getHeaderNames()`、`getParameterNames()`等。还能获取身份验证类型、字符编码、MIME类型、请求方法、远程用户信息、URL路径、安全通道状态以及请求内容长度等。此外,可通过`getSession()`创建或获取Session,并以`Map`形式获取参数。
54 8
|
2月前
|
JavaScript Java 容器
servlet过滤器Filter简要回顾-过滤请求字符编码,/和/*和/**的区别
本文简要回顾了Servlet过滤器Filter的概念和使用,通过实例演示了如何创建过滤器以过滤请求字符编码,并解释了在web.xml中配置过滤器时使用`/`、`/*`和`/**`的区别。
servlet过滤器Filter简要回顾-过滤请求字符编码,/和/*和/**的区别
|
6月前
|
存储 Java 应用服务中间件
Servlet执行流程&生命周期&方法介绍&体系结构、Request和Response的功能详解(2)
Servlet执行流程&生命周期&方法介绍&体系结构、Request和Response的功能详解
67 2
|
6月前
|
Web App开发 XML Java
Servlet执行流程&生命周期&方法介绍&体系结构、Request和Response的功能详解(1)
Servlet执行流程&生命周期&方法介绍&体系结构、Request和Response的功能详解
113 2
|
Java 应用服务中间件
线上临时文件夹报错Failed to parse multipart servlet request; nested exception is java.lang.RuntimeException: java.nio.file.NoSuchFileException
Failed to parse multipart servlet request; nested exception is java.lang.RuntimeException: java.nio.file.NoSuchFileException、tmp、配置文件指定目录
220 0
|
6月前
Servlet 教程 之 Servlet 客户端 HTTP 请求 1
Servlet教程讲解了客户端HTTP请求,包括各种重要头信息:Accept(定义可处理的MIME类型)、Accept-Charset(指定字符集)、Accept-Encoding(处理的编码类型)、Accept-Language(首选语言)、Authorization(身份验证)、Connection(是否支持持久连接)、Content-Length(POST数据大小)、Cookie(返回cookies)、Host(指定URL的主机和端口)、If-Modified-Since(检查页面更新)、If-Unmodified-Since(条件性操作)。
36 0
|
6月前
|
应用服务中间件 Linux
org.springframework.web.multipart.MultipartException: Failed to parse multipart servlet request; nes
org.springframework.web.multipart.MultipartException: Failed to parse multipart servlet request; nes
153 0
|
6月前
Request通用方式获取请求参数及Servlet模板创建
Request通用方式获取请求参数及Servlet模板创建
53 0
|
6月前
|
Web App开发 前端开发 JavaScript
AJAX POST请求中参数以form data和request payload形式在servlet中的获取方式
AJAX POST请求中参数以form data和request payload形式在servlet中的获取方式
70 0