jsp编码问题

简介: jsp编码问题

jsp编码问题


<%@ page language="java" contentType="text/html" pageEncoding="GBK">
<%@ page pageEncoding="UTF-8">



使用contentType和pageEncoding设置编码有什么区别?


我们先来看看jsp的执行流程(该图来源于):

20201222170737184.png


从图中可以发现总的来说就是 *.jsp --> * .java --> *.class–> 返回结果内容


这里jsp需要经过3次“编码”,java web开发实战金典中是这样说的:jsp中,如果pageEncoding存在,那么jsp编码将由pageEncoding决定,否则将由contentType中的charset属性决定;如果两者都不存在,则将使用ISO-8859-1的编码方式。在jsp中,所有内容都要经过两次编码操作,第一阶段使用pageEncoding编码,第二阶段使用utf-8编码,第三阶段就是由Tomcat生成大的网页,此时使用的才是contentType.


pageEncoding是jsp文件本身的编码


contentType的charset是指服务器发送给客户端时的内容编码


JSP要经过两次的“编码”,第一阶段会用pageEncoding,第二阶段会用utf-8至utf-8,第三阶段就是由Tomcat出来的网页, 用的是contentType。


第一阶段是jsp编译成.java,它会根据pageEncoding的设定读取jsp,结果是由指定的编码方案翻译成统一的UTF-8 JAVA源码(即.java),如果pageEncoding设定错了,或没有设定,出来的就是中文乱码。


第二阶段是由JAVAC的JAVA源码至java byteCode的编译,不论JSP编写时候用的是什么编码方案,经过这个阶段的结果全部是UTF-8的encoding的java源码。


JAVAC用UTF-8的encoding读取java源码,编译成UTF-8 encoding的二进制码(即.class),这是JVM对常数字串在二进制码(java encoding)内表达的规范。


第三阶段是Tomcat(或其的application container)载入和执行阶段二的来的JAVA二进制码,输出的结果,也就是在客户端见到的,这时隐藏在阶段一和阶段二的参数contentType就发挥了功效


JSP 中 pageEncoding charset 的区别


首先,说说JSP/Servlet中的几个编码的作用。

在JSP/Servlet中主要有以下几个地方可以设置编 码,pageEncoding=“UTF-8”、contentType=“text/html;charset=UTF-8”、request.setCharacterEncoding(“UTF-8”)和 response.setCharacterEncoding(“UTF-8”),其中前两个只能用于JSP中,而后两个可以用于JSP和Servlet 中。

1、pageEncoding="UTF-8"的作用是设置JSP编译成Servlet时使用的编码。

众所周知,JSP在服务 器上是要先被编译成Servlet的。pageEncoding="UTF-8"的作用就是告诉JSP编译器在将JSP文件编译成Servlet时使用的 编码。通常,在JSP内部定义的字符串(直接在JSP中定义,而不是从浏览器提交的数据)出现乱码时,很多都是由于该参数设置错误引起的。例如,你的 JSP文件是以GBK为编码保存的,而在JSP中却指定pageEncoding=“UTF-8”,就会引起JSP内部定义的字符串为乱码。

另外,该参数还有一个功能,就是在JSP中不指定contentType参数,也不使用response.setCharacterEncoding方法时,指定对服务器响应进行重新编码的编码。


2、contentType="text/html;charset=UTF-8"的作用是指定对服务器响应进行重新编码的编码。

在不使用response.setCharacterEncoding方法时,用该参数指定对服务器响应进行重新编码的编码。


3、request.setCharacterEncoding(“UTF-8”)的作用是设置对客户端请求进行重新编码的编码。


该方法用来指定对浏览器发送来的数据进行重新编码(或者称为解码)时,使用的编码。


4、response.setCharacterEncoding(“UTF-8”)的作用是指定对服务器响应进行重新编码的编码。

服务器在将数据发送到浏览器前,对数据进行重新编码时,使用的就是该编码。


相关文章
|
存储 移动开发 数据安全/隐私保护
高效反编译luac文件
高效反编译luac文件
|
8月前
|
前端开发 JavaScript Java
现代化软件开发中的前后端分离模式
随着互联网技术的快速发展,现代化软件开发中的前后端分离模式逐渐成为主流。本文将介绍前后端分离的概念和优势,以及如何在不同的技术栈中实现这种模式。通过前后端分离,可以提高开发效率、降低耦合性,并且更好地满足用户需求。
129 0
|
JavaScript 前端开发 Java
【JCEF】基于SWT和VUE的JCEF嵌入
【JCEF】基于SWT和VUE的JCEF嵌入
349 0
|
机器学习/深度学习 存储 人工智能
思考一下,联邦学习可以训练大语言模型吗?(2)
思考一下,联邦学习可以训练大语言模型吗?
343 0
|
开发框架 缓存 安全
FreeMarker模板注入
FreeMarker模板注入
|
XML 存储 安全
XXE 漏洞任意文件读取
XXE 漏洞任意文件读取
614 0
|
开发工具 git
dirsearch web网站目录扫描工具详解
作者主页:https://www.couragesteak.com/
dirsearch web网站目录扫描工具详解
|
关系型数据库 MySQL
mysql下载源码方法
方法一 进入mysql官网:http://dev.mysql.com/downloads/mysql/ 选择相关的平台下载:     3.选择Source Code 选型后,拉倒网页下方,选择要下载的源码包         4.
12602 2
|
JavaScript Java 数据安全/隐私保护
浅谈JSP Webshell进阶免杀(一)
浅谈JSP Webshell进阶免杀
884 0