URLencode 特殊字符 转义 遇上的坑

简介:   在项目中遇到一个问题,在webveiw和原生之间进行传值的时候,出现了一些encode的小问题。看起来很简单的问题,实际上却存在不小的坑。   首先说一下目前项目的结构,在一个activity中,webview和原生之间有多种交互。

 

  在项目中遇到一个问题,在webveiw和原生之间进行传值的时候,出现了一些encode的小问题。看起来很简单的问题,实际上却存在不小的坑。

  首先说一下目前项目的结构,在一个activity中,webview和原生之间有多种交互。

  如图所示

在原生调用webview方法,这种协议已经非常常用了,直接调用loadJS();但是自定义协议这个过程,使用的拦截跳转的方式,按照预定的协议来解析数据,这里面就有一些情况,比如数据中出现了中文,webview会encode这部分内容,这就要求我们对拦截以后的内容进行decode。

见下方代码:

1   private String decodeUrl(String url) {
2             try {
3                 return URLDecoder.decode(url, "utf-8");
4             } catch (UnsupportedEncodingException e) {
5                 e.printStackTrace();
6             }
7             return "";
8         }

上面这段代码,看上去是很合理的,但是老司机们认真看看,这里面有坑。

首先看一下底层代码的decode。

   /**
     * @throws UnsupportedEncodingException if {@code     charsetName} is not supported.
     */
    public static String decode(String s, String charsetName) throws UnsupportedEncodingException {
        return UriCodec.decode(s, true, Charset.forName(charsetName), true);
    }

 

我想老司机们应该已经明白了是为啥了,就是检查异常和运行时异常的问题了。UnsupportedEncodingException 仅仅是检查时异常,而可能还有运行时异常,因此这里代码需要改为:

 1 private String decodeUrl(String url) {
 2             String decodeUrl = "";
 3             try {
 4                 decodeUrl = URLDecoder.decode(url, "utf-8");
 5             } catch (Exception e) {
 6                 e.printStackTrace();
 7             } finally {
 8                 return decodeUrl;
 9             }
10         }

 

这里对异常进行简单的介绍。

在 Java 中,所有的异常都继承了 Throwable(可抛出)。Throwable 指定代码中可用异常传播机制通过 Java 应用程序传输的任何问题的共性。
Throwable: 有两个重要的子类:Exception(异常)和 Error(错误),二者都是 Java 异常处理的重要子类,各自都包含大量子类。
Error(错误):是程序无法处理的错误,表示运行应用程序中较严重问题。大多数错误与代码编写者执行的操作无关,而表示代码运行时 JVM(Java 虚拟机)出现的问题。例如,Java虚拟机运行错误(Virtual MachineError),当 JVM 不再有继续执行操作所需的内存资源时,将出现 OutOfMemoryError。这些异常发生时,Java虚拟机(JVM)一般会选择线程终止。

。这些错误表示故障发生于虚拟机自身、或者发生在虚拟机试图执行应用时,如Java虚拟机运行错误(Virtual MachineError)、类定义错误(NoClassDefFoundError)等。这些错误是不可查的,因为它们在应用程序的控制和处理能力之 外,而且绝大多数是程序运行时不允许出现的状况。对于设计合理的应用程序来说,即使确实发生了错误,本质上也不应该试图去处理它所引起的异常状况。在 Java中,错误通过Error的子类描述。

Exception(异常):是程序本身可以处理的异常。见图:

运行时异常很常见比如 空指针、非法参数、数组越界、类转换异常、算术异常等。这些异常需要老司机们有经验有技巧的对待,写代码时动用金手指,把这些异常都捕获住。

常见的比如:

1   String  numberStr= "1";
2 try{
3   int number = Integer.valueOf(numberStr);
4 } catch(exception e){
5 e.printStackTrace();
6 } 

上面代码没有检查时异常,但是需要老司机捕获住。

 

当然实际上这里面坑还不止这些,中文符号被decode还办好,关键是一些特殊符号不好办。

有些符号在URL中是不能直接传递的,如果要在URL中传递这些特殊符号,那么就要使用他们的编码了。编码的格式为:%加字符的ASCII码,即一个百分号%,后面跟对应字符的ASCII(16进制)码值。例如 空格的编码值是"%20"。
下表中列出了一些URL特殊符号及编码。

 

实际测试中发现,只要替换调%就好了。

替换代码为:

 1  private String decodeUrl(String url) {
 2             String decodeUrl = "";
 3             try {
 4                 String transformUrl = url.replaceAll("%(?![0-9a-fA-F]{2})", "%25");
 5                 decodeUrl = URLDecoder.decode(transformUrl,"UTF-8");
 6             } catch (Exception e) {
 7                 e.printStackTrace();
 8             } finally {
 9                 LogUtil.e("my", "decodeUrl:" + decodeUrl);
10                 return decodeUrl;
11             }
12         }

 

以上代码,通过了表格8种符号 全半角形式以及日文韩文的测试,传值和decode都是正常的。

 

 

 

目录
相关文章
用html+javascript打造公文一键排版系统14:为半角和全角字符相互转换功能增加英文字母、阿拉伯数字、标点符号、空格选项
用html+javascript打造公文一键排版系统14:为半角和全角字符相互转换功能增加英文字母、阿拉伯数字、标点符号、空格选项
|
6月前
|
Shell Perl
用sed如果原字符串或新字符串中包含特殊字符(如正斜杠/或其他特殊字符),需要用\进行转义
用sed如果原字符串或新字符串中包含特殊字符(如正斜杠/或其他特殊字符),需要用\进行转义
799 7
|
11月前
|
移动开发 编译器 C#
C# 常用的“转义符”对字符串的使用与讲解
C# 常用的“转义符”对字符串的使用与讲解
|
监控 Python
一日一技:批量转义正则表达式中的特殊符号
一日一技:批量转义正则表达式中的特殊符号
100 0
[oeasy]python0051_ 转义_escape_字符_character_单引号_双引号_反引号_ 退格键
[oeasy]python0051_ 转义_escape_字符_character_单引号_双引号_反引号_ 退格键
115 0
[oeasy]python0051_ 转义_escape_字符_character_单引号_双引号_反引号_ 退格键
url参数+,&,=,/等转义编码
  url出现了有+,空格,/,?,%,#,&,= 等特殊符号的时候,可能在服务器端无法获得正确的参数值。 案例:   如果我们想让barcodevalue的参数是http://www.baidu.
7087 0
|
JavaScript Java Apache
java后台对前端输入的特殊字符进行转义
转自:http://www.cnblogs.com/yangzhilong/p/5667165.html     java后台对前端输入的特殊字符进行转义   HTML: 常见的帮助类有2个:一个是spring的HtmlUtils,另外一个是apache.
2929 0
|
机器学习/深度学习
JavaWeb - 正则表达式中需要转义的字符
JavaWeb - 正则表达式中需要转义的字符
123 0
JavaWeb - 正则表达式不以某个字符开头
JavaWeb - 正则表达式不以某个字符开头
865 0