Java获取URL中的顶级域名domain的工具类

本文涉及的产品
.cn 域名,1个 12个月
简介:

方式一:

复制代码
 1 import java.net.MalformedURLException;
 2 import java.net.URL;
 3 import java.util.Arrays;
 4 import java.util.HashSet;
 5 import java.util.Set;
 6 import java.util.regex.Pattern;
 7 
 8 public class URLUtil {
 9 
10     private final static Set<String> PublicSuffixSet = new HashSet<String>(
11             Arrays.asList(new String(
12                     "com|org|net|gov|edu|co|tv|mobi|info|asia|xxx|onion|cn|com.cn|edu.cn|gov.cn|net.cn|org.cn|jp|kr|tw|com.hk|hk|com.hk|org.hk|se|com.se|org.se")
13                     .split("\\|")));
14 
15     private static Pattern IP_PATTERN = Pattern.compile("(\\d{1,3}\\.){3}(\\d{1,3})");
16 
17     /**
18      * 获取url的顶级域名
19      * @param url
20      * @return
21      */
22     public static String getDomainName(URL url) {
23         String host = url.getHost();
24         if (host.endsWith(".")){
25             host = host.substring(0, host.length() - 1);
26         }
27         if (IP_PATTERN.matcher(host).matches()){
28             return host;
29         }
30 
31         int index = 0;
32         String candidate = host;
33         for (; index >= 0;) {
34             index = candidate.indexOf('.');
35             String subCandidate = candidate.substring(index + 1);
36             if (PublicSuffixSet.contains(subCandidate)) {
37                 return candidate;
38             }
39             candidate = subCandidate;
40         }
41         return candidate;
42     }
43 
44     /**
45      * 获取url的顶级域名
46      * @param url
47      * @return
48      * @throws MalformedURLException
49      */
50     public static String getDomainName(String url) throws MalformedURLException {
51         return getDomainName(new URL(url));
52     }
53 
54     /**
55      * 判断两个url顶级域名是否相等
56      * @param url1
57      * @param url2
58      * @return
59      */
60     public static boolean isSameDomainName(URL url1, URL url2) {
61         return getDomainName(url1).equalsIgnoreCase(getDomainName(url2));
62     }
63 
64     /**
65      * 判断两个url顶级域名是否相等
66      * @param url1
67      * @param url2
68      * @return
69      * @throws MalformedURLException
70      */
71     public static boolean isSameDomainName(String url1, String url2)
72             throws MalformedURLException {
73         return isSameDomainName(new URL(url1), new URL(url2));
74     }
75     
76     public static void main(String[] args) throws Exception {
77         String urlStr = "http://news.hexun.com/2017-09-23/190978248.html";
78         getDomainName(urlStr);
79         getDomainName(new URL(urlStr));
80     }
81 
82 }
复制代码

方式二:

复制代码
 1 import java.net.MalformedURLException;
 2 import java.net.URL;
 3 import java.util.regex.Matcher;
 4 import java.util.regex.Pattern;
 5 
 6 public class DomainUtils {
 7     /**
 8      * 获取url的顶级域名
 9      * @param
10      * @return
11      */
12     public static String getTopDomain(String url){
13         try{
14             //获取值转换为小写
15             String host = new URL(url).getHost().toLowerCase();//news.hexun.com
16             Pattern pattern = Pattern.compile("[^\\.]+(\\.com\\.cn|\\.net\\.cn|\\.org\\.cn|\\.gov\\.cn|\\.com|\\.net|\\.cn|\\.org|\\.cc|\\.me|\\.tel|\\.mobi|\\.asia|\\.biz|\\.info|\\.name|\\.tv|\\.hk|\\.公司|\\.中国|\\.网络)");
17             Matcher matcher = pattern.matcher(host);
18             while(matcher.find()){
19                 return matcher.group();
20             }
21         }catch(MalformedURLException e){
22             e.printStackTrace();
23         }
24         return null;
25     }
26     public static void main(String[] args) {
27         System.out.println(getTopDomain("http://news.hexun.com/2017-09-23/190978248.html"));//hexun.com
28 
29     }
30 }
复制代码

 


本文转自SummerChill博客园博客,原文链接:http://www.cnblogs.com/DreamDrive/p/7594305.html,如需转载请自行联系原作者

相关文章
|
6天前
|
设计模式 缓存 算法
编写高效的Java工具类:实用技巧与设计模式
编写高效的Java工具类:实用技巧与设计模式
|
4天前
|
并行计算 Java API
Java中的并发工具类详解
Java中的并发工具类详解
|
5天前
|
设计模式 缓存 算法
编写高效的Java工具类:实用技巧与设计模式
编写高效的Java工具类:实用技巧与设计模式
|
10天前
|
Java
JAVA工具类匹配重复或者连续的字符和符号
JAVA工具类匹配重复或者连续的字符和符号
10 2
|
11天前
|
算法 Java
基于java雪花算法工具类SnowflakeIdUtils-来自chatGPT
基于java雪花算法工具类SnowflakeIdUtils-来自chatGPT
15 3
|
15天前
|
数据采集 Java 开发者
JAVA网络编程深度探索:URL与URLConnection的精湛技艺
Java网络编程核心在于URL和URLConnection。URL是资源的唯一标识,用于定位网络资源,支持解析、编码解码及参数操作。URLConnection则实现数据交换,允许GET/POST请求,可定制请求头、设置超时,是网络交互的关键。两者结合,适用于网络爬虫等场景,深入学习能提升编程技巧并揭示网络编程奥秘。
|
15天前
|
XML JSON 搜索推荐
【高手过招】JAVA网络编程对决:URL与URLConnection的高级玩法,你敢挑战吗?
【6月更文挑战第22天】在Java网络编程中,URL与URLConnection是核心工具,高手利用它们进行高级操作。从定制请求头(如User-Agent和Authorization)以适应不同场景,到利用POST请求发送复杂数据,甚至是通过设置代理(HTTP或SOCKS)穿越网络障碍,以及运用异步处理和流操作提升效率,每个技巧都是提升网络交互的关键。通过深入学习和实践,开发者可以在网络编程领域不断提升,应对各种挑战。
|
12天前
|
Java easyexcel
java开发excel导入导出工具类基于EasyExcel
java开发excel导入导出工具类基于EasyExcel
22 1
|
15天前
|
Java
【思维导图】JAVA网络编程思维升级:URL与URLConnection的逻辑梳理,助你一臂之力!
【6月更文挑战第22天】Java网络编程中,URL是资源定位器,用于解析和创建网络地址;URLConnection接口负责建立到URL资源的连接。示例展示了如何使用URL类获取协议、主机、端口和路径,以及如何通过HttpURLConnection进行GET/POST请求,设置超时并处理响应。思维导图概述了从创建URL到设置请求属性、发送请求及处理响应的完整流程,帮助理解两者在网络编程中的作用。
|
15天前
|
缓存 安全 Java
【技术前沿】JAVA网络编程黑科技:URL与URLConnection的创新应用,带你飞越极限!
【6月更文挑战第22天】Java的URL和URLConnection在现代网络编程中扮演关键角色,不仅用于基本HTTP请求,还在微服务(弹性自动化调用)、智能缓存策略、异步处理和安全增强方面展现创新应用。例如,它们支持动态服务发现、HTTP缓存控制、非阻塞I/O和HTTPS加密,助力开发者构建高效、安全的网络解决方案。通过掌握这些技术,可以提升项目性能,应对云计算和大数据时代的挑战。