Java实现的URL编码和解码技术

简介:

Java 实现的 URL 编码和解码技术


当编写 “ 网络爬虫” 或下载器时,在 Java 中实现 URL 编码和解码是一个很常见的要求。本文的重点是创建用于对所传递的 URL 进行编码和解码的模块。

Main 方法

 
  1. public static void main(String[] args) {   
  2.  
  3.           // TODO Auto-generated method stub   
  4.  
  5.           String url="https%3A%2F%2Fr1---sn-ci5gup-cags.googlevideo.com%2Fvideoplayback%3Fpcm2cms%3Dyes%26mime%3Dvideo%252Fmp4%26pl%3D21%26itag%3D22%26\u0026itag=43\u0026type=video%2Fwebm%3B+codecs%3D%22vp8.0%2C+vorbis%22\u0026quality=medium";   
  6.  
  7.           String url2="https://r1---sn-ci5gup-cags.googlevideo.com/videoplayback?pcm2cms=yes&mime=video/mp4&pl=21&itag=22&&itag=43&type=video/webm; codecs=\"vp8.0, vorbis\"&quality=medium";   
  8.  
  9.           String decodeURL = decode(url);   
  10.  
  11.           System.out.println("Decoded URL: "+decodeURL);   
  12.  
  13.           String encodeURL = encode(url2);   
  14.  
  15.           System.out.println("Encoded URL2: "+encodeURL);   
  16.  
  17.      } 

它是如何工作的?

  • url 是一个变量,保存着我们希望解码的已被编码的 URL
  • url2 是保存着我们希望编码的 url 的变量
  • 调用 decode 方法,该方法解码和打印 URL
  • 调用 encode 方法,该方法编码和打印 url2

Encode 方法

 
  1. public static String encode(String url)   
  2.  
  3. {   
  4.  
  5.           try {   
  6.  
  7.                String encodeURL=URLEncoder.encode( url, "UTF-8" );   
  8.  
  9.                return encodeURL;   
  10.  
  11.           } catch (UnsupportedEncodingException e) {   
  12.  
  13.                return "Issue while encoding" +e.getMessage();   
  14.  
  15.           }   
  16.  

它是如何工作的

  • 使用名为 URLEncoder 的预定义 Java 类的 encode 方法
  • URLEncoder 类的 encode 方法需要两个参数:

第一个参数定义的是待编码的 URL

第二个参数定义的是使用的编码方案

  • 编码之后,将返回编码后的 URL 结果
 
  1. public static String decode(String url)   
  2.  
  3. {   
  4.  
  5.           try {   
  6.  
  7.                String prevURL="";   
  8.  
  9.                String decodeURL=url;   
  10.  
  11.                while(!prevURL.equals(decodeURL))   
  12.  
  13.                {   
  14.  
  15.                     prevURL=decodeURL;   
  16.  
  17.                     decodeURL=URLDecoder.decode( decodeURL, "UTF-8" );   
  18.  
  19.                }   
  20.  
  21.                return decodeURL;   
  22.  
  23.           } catch (UnsupportedEncodingException e) {   
  24.  
  25.                return "Issue while decoding" +e.getMessage();   
  26.  
  27.           }   
  28.  

Decode 方法

 
  1. public static String decode(String url){ 
  2.     try { 
  3.         String prevURL="";   
  4.         String decodeURL=url;   
  5.         while(!prevURL.equals(decodeURL)) 
  6.         { 
  7.             prevURL=decodeURL;   
  8.             decodeURL=URLDecoder.decode( decodeURL, "UTF-8" );   
  9.         }   
  10.         return decodeURL;   
  11.     } catch (UnsupportedEncodingException e) { 
  12.         return "Issue while decoding" +e.getMessage();   
  13.     }   

它是如何工作的

  • 因为相同的 URL 可以被多次编码,所以我们需要一直对它进行解码直到不能再解码为止。举个例子,"video%252Fmp4" 是两次编码的结果。第一次解码后,我们得到 "video%2Fmp4"。要得到正确的结果 "video/mp4",我们需要再解码一次。
  • 使用名为 URLEncoder 的预定义 Java 类的 decode 方法来解码
  • URLDecoder 类的 decode 方法需要两个参数:

第一个参数定义需要解码的 URL

第二个参数定义使用的解码方案

  • 解码后,返回已解码的 URL.
  • 创建两个变量:prevURL 为空串,decodeURL 包含待解码的 URL
 
  1. Variable State:   
  2.  
  3. prevURL = ""   
  4.  
  5. decodeURL ="somethingvideo%252Fmp4" 
  • 创建一个重复执行的步骤,直到 prevURL 与 decodeURL 的值相等
  • 将 decodeURL 的值赋值给 prevURL,将传递的 URL 解码后的值赋给 decodeURL
 
  1. Variable State: 
  2.  
  3. prevURL = "somethingvideo%252Fmp4" 
  4.  
  5. decodeURL ="somethingvideo%2Fmp4" 
  • 如你所见,prevURL 的值不等于 decodeURL 的值,我们再次执行
 
  1. Variable State: 
  2.  
  3. prevURL = "somethingvideo%2Fmp4" 
  4.  
  5. decodeURL ="somethingvideo/mp4" 
  • 再一次
 
  1. Variable State: 
  2.  
  3. prevURL = "somethingvideo/mp4" 
  4.  
  5. decodeURL ="somethingvideo/mp4" 
  • 现在,prevURL 的值等于 decodeURL 的值了,得到了正确的解码结果。

输出

 
  1. Decoded URL: https://r1---sn-ci5gup-cags.googlevideo.com/videoplayback?pcm2cms=yes&mime=video/mp4&pl=21&itag=22&&itag=43&type=video/webm; codecs="vp8.0, vorbis"&quality=medium   
  2.  
  3.  Encoded URL2: https%3A%2F%2Fr1---sn-ci5gup-cags.googlevideo.com%2Fvideoplayback%3Fpcm2cms%3Dyes%26mime%3Dvideo%2Fmp4%26pl%3D21%26itag%3D22%26%26itag%3D43%26type%3Dvideo%2Fwebm%3B+codecs%3D%22vp8.0%2C+vorbis%22%26quality%3Dmedium 

完整的程序

 
  1. package com.cooltrickshome;  import java.io.UnsupportedEncodingException;  import java.net.URLDecoder;  import java.net.URLEncoder;  public class URLEncodeDecode {     
  2.    public static void main(String[] args) {   
  3.           // TODO Auto-generated method stub            String url="https%3A%2F%2Fr1---sn-ci5gup-cags.googlevideo.com%2Fvideoplayback%3Fpcm2cms%3Dyes%26mime%3Dvideo%252Fmp4%26pl%3D21%26itag%3D22%26\u0026itag=43\u0026type=video%2Fwebm%3B+codecs%3D%22vp8.0%2C+vorbis%22\u0026quality=medium";   
  4.           String url2="https://r1---sn-ci5gup-cags.googlevideo.com/videoplayback?pcm2cms=yes&mime=video/mp4&pl=21&itag=22&&itag=43&type=video/webm; codecs=\"vp8.0, vorbis\"&quality=medium";   
  5.           String decodeURL = decode(url);   
  6.           System.out.println("Decoded URL: "+decodeURL);   
  7.           String encodeURL = encode(url2);   
  8.           System.out.println("Encoded URL2: "+encodeURL);   
  9.      }   
  10.      public static String decode(String url)   
  11.      {   
  12.                try {   
  13.                     String prevURL="";   
  14.                     String decodeURL=url;   
  15.                     while(!prevURL.equals(decodeURL))   
  16.                     {   
  17.                          prevURL=decodeURL;   
  18.                          decodeURL=URLDecoder.decode( decodeURL, "UTF-8" );   
  19.                     }   
  20.                     return decodeURL;   
  21.                } catch (UnsupportedEncodingException e) {   
  22.                     return "Issue while decoding" +e.getMessage();   
  23.                }   
  24.      }   
  25.      public static String encode(String url)   
  26.      {   
  27.                try {   
  28.                     String encodeURL=URLEncoder.encode( url, "UTF-8" );   
  29.                     return encodeURL;   
  30.                } catch (UnsupportedEncodingException e) {   
  31.                     return "Issue while encoding" +e.getMessage();   
  32.                }   
  33.      }   



作者:OSC-协作翻译

来源:51CTO

相关文章
|
21天前
|
NoSQL Java 数据库连接
深入探索 Java 后台开发的核心技术
【4月更文挑战第5天】本文探讨了Java后台开发的关键技术,包括Spring框架与Spring Boot的使用,MyBatis和Hibernate的ORM选择,关系型与NoSQL数据库的适用场景,线程池与异步处理在并发中的作用,微服务架构及RESTful API设计。这些核心技术有助于开发者打造稳定、高性能的Java后台系统,适应不断发展的云计算和人工智能需求。
|
28天前
|
存储 SQL Java
【Java技术指南】「JPA编程专题」让你不再对JPA技术中的“持久化型注解”感到陌生了(二)
【Java技术指南】「JPA编程专题」让你不再对JPA技术中的“持久化型注解”感到陌生了
44 1
|
28天前
|
缓存 Java C#
【JVM故障问题排查心得】「Java技术体系方向」Java虚拟机内存优化之虚拟机参数调优原理介绍(一)
【JVM故障问题排查心得】「Java技术体系方向」Java虚拟机内存优化之虚拟机参数调优原理介绍
79 0
|
2天前
|
SQL Java 数据库连接
Java从入门到精通:2.3.1数据库编程——学习JDBC技术,掌握Java与数据库的交互
ava从入门到精通:2.3.1数据库编程——学习JDBC技术,掌握Java与数据库的交互
|
2天前
|
设计模式 存储 前端开发
Java从入门到精通:2.2.1学习Java Web开发,了解Servlet和JSP技术,掌握MVC设计模式
Java从入门到精通:2.2.1学习Java Web开发,了解Servlet和JSP技术,掌握MVC设计模式
|
2天前
|
Java API
Java从入门到精通:2.1.5深入学习Java核心技术之文件操作
Java从入门到精通:2.1.5深入学习Java核心技术之文件操作
|
2天前
|
并行计算 算法 安全
Java从入门到精通:2.1.3深入学习Java核心技术——掌握Java多线程编程
Java从入门到精通:2.1.3深入学习Java核心技术——掌握Java多线程编程
|
8天前
|
Java 关系型数据库 MySQL
一套java+ spring boot与vue+ mysql技术开发的UWB高精度工厂人员定位全套系统源码有应用案例
UWB (ULTRA WIDE BAND, UWB) 技术是一种无线载波通讯技术,它不采用正弦载波,而是利用纳秒级的非正弦波窄脉冲传输数据,因此其所占的频谱范围很宽。一套UWB精确定位系统,最高定位精度可达10cm,具有高精度,高动态,高容量,低功耗的应用。
一套java+ spring boot与vue+ mysql技术开发的UWB高精度工厂人员定位全套系统源码有应用案例
|
9天前
|
存储 数据可视化 安全
Java全套智慧校园系统源码springboot+elmentui +Quartz可视化校园管理平台系统源码 建设智慧校园的5大关键技术
智慧校园指的是以物联网为基础的智慧化的校园工作、学习和生活一体化环境,这个一体化环境以各种应用服务系统为载体,将教学、科研、管理和校园生活进行充分融合。无处不在的网络学习、融合创新的网络科研、透明高效的校务治理、丰富多彩的校园文化、方便周到的校园生活。简而言之,“要做一个安全、稳定、环保、节能的校园。
34 6
|
9天前
|
监控 前端开发 算法
Java技术体系
Java技术体系(韩顺平老师整理)
10 0

热门文章

最新文章