Java获取URL中的顶级域名domain的工具类

简介:

方式一:

复制代码
 1 import java.net.MalformedURLException;
 2 import java.net.URL;
 3 import java.util.Arrays;
 4 import java.util.HashSet;
 5 import java.util.Set;
 6 import java.util.regex.Pattern;
 7 
 8 public class URLUtil {
 9 
10     private final static Set<String> PublicSuffixSet = new HashSet<String>(
11             Arrays.asList(new String(
12                     "com|org|net|gov|edu|co|tv|mobi|info|asia|xxx|onion|cn|com.cn|edu.cn|gov.cn|net.cn|org.cn|jp|kr|tw|com.hk|hk|com.hk|org.hk|se|com.se|org.se")
13                     .split("\\|")));
14 
15     private static Pattern IP_PATTERN = Pattern.compile("(\\d{1,3}\\.){3}(\\d{1,3})");
16 
17     /**
18      * 获取url的顶级域名
19      * @param url
20      * @return
21      */
22     public static String getDomainName(URL url) {
23         String host = url.getHost();
24         if (host.endsWith(".")){
25             host = host.substring(0, host.length() - 1);
26         }
27         if (IP_PATTERN.matcher(host).matches()){
28             return host;
29         }
30 
31         int index = 0;
32         String candidate = host;
33         for (; index >= 0;) {
34             index = candidate.indexOf('.');
35             String subCandidate = candidate.substring(index + 1);
36             if (PublicSuffixSet.contains(subCandidate)) {
37                 return candidate;
38             }
39             candidate = subCandidate;
40         }
41         return candidate;
42     }
43 
44     /**
45      * 获取url的顶级域名
46      * @param url
47      * @return
48      * @throws MalformedURLException
49      */
50     public static String getDomainName(String url) throws MalformedURLException {
51         return getDomainName(new URL(url));
52     }
53 
54     /**
55      * 判断两个url顶级域名是否相等
56      * @param url1
57      * @param url2
58      * @return
59      */
60     public static boolean isSameDomainName(URL url1, URL url2) {
61         return getDomainName(url1).equalsIgnoreCase(getDomainName(url2));
62     }
63 
64     /**
65      * 判断两个url顶级域名是否相等
66      * @param url1
67      * @param url2
68      * @return
69      * @throws MalformedURLException
70      */
71     public static boolean isSameDomainName(String url1, String url2)
72             throws MalformedURLException {
73         return isSameDomainName(new URL(url1), new URL(url2));
74     }
75     
76     public static void main(String[] args) throws Exception {
77         String urlStr = "http://news.hexun.com/2017-09-23/190978248.html";
78         getDomainName(urlStr);
79         getDomainName(new URL(urlStr));
80     }
81 
82 }
复制代码

方式二:

复制代码
 1 import java.net.MalformedURLException;
 2 import java.net.URL;
 3 import java.util.regex.Matcher;
 4 import java.util.regex.Pattern;
 5 
 6 public class DomainUtils {
 7     /**
 8      * 获取url的顶级域名
 9      * @param
10      * @return
11      */
12     public static String getTopDomain(String url){
13         try{
14             //获取值转换为小写
15             String host = new URL(url).getHost().toLowerCase();//news.hexun.com
16             Pattern pattern = Pattern.compile("[^\\.]+(\\.com\\.cn|\\.net\\.cn|\\.org\\.cn|\\.gov\\.cn|\\.com|\\.net|\\.cn|\\.org|\\.cc|\\.me|\\.tel|\\.mobi|\\.asia|\\.biz|\\.info|\\.name|\\.tv|\\.hk|\\.公司|\\.中国|\\.网络)");
17             Matcher matcher = pattern.matcher(host);
18             while(matcher.find()){
19                 return matcher.group();
20             }
21         }catch(MalformedURLException e){
22             e.printStackTrace();
23         }
24         return null;
25     }
26     public static void main(String[] args) {
27         System.out.println(getTopDomain("http://news.hexun.com/2017-09-23/190978248.html"));//hexun.com
28 
29     }
30 }
复制代码

 


本文转自SummerChill博客园博客,原文链接:http://www.cnblogs.com/DreamDrive/p/7594305.html,如需转载请自行联系原作者

相关实践学习
基于函数计算快速搭建Hexo博客系统
本场景介绍如何使用阿里云函数计算服务命令行工具快速搭建一个Hexo博客。
相关文章
|
1月前
|
存储 网络协议 网络安全
oss自定义域名绑定(Custom Domain Binding)
阿里云OSS支持自定义域名绑定,让用户可通过自有域名访问存储文件。步骤包括:1) 确保域名已备案并在阿里云验证;2) 在OSS控制台选择Bucket,绑定自定义域名并验证备案号;3)(可选)配置SSL证书;4) 在DNS服务商处设置CNAME记录;5)(可选)启用CDN加速。此功能有助于提升品牌识别度、安全性和文件预览体验。
72 1
|
1月前
Mybatis+mysql动态分页查询数据案例——分页工具类(Page.java)
Mybatis+mysql动态分页查询数据案例——分页工具类(Page.java)
22 1
|
4月前
|
安全 算法 Java
Java之并发工具类的详细解析
3. 并发工具类 3.1 并发工具类-Hashtable Hashtable出现的原因 : 在集合类中HashMap是比较常用的集合对象,但是HashMap是线程不安全的(多线程环境下可能会存在问题)。为了保证数据的安全性我们可以使用Hashtable,但是Hashtable的效率低下。
29 0
|
1月前
Mybatis+mysql动态分页查询数据案例——工具类(MybatisUtil.java)
Mybatis+mysql动态分页查询数据案例——工具类(MybatisUtil.java)
15 1
|
6天前
|
安全 Java
深入理解 Java 多线程和并发工具类
【4月更文挑战第19天】本文探讨了Java多线程和并发工具类在实现高性能应用程序中的关键作用。通过继承`Thread`或实现`Runnable`创建线程,利用`Executors`管理线程池,以及使用`Semaphore`、`CountDownLatch`和`CyclicBarrier`进行线程同步。保证线程安全、实现线程协作和性能调优(如设置线程池大小、避免不必要同步)是重要环节。理解并恰当运用这些工具能提升程序效率和可靠性。
|
26天前
|
JSON Java 网络安全
Java使用hutool工具类发送网络请求
Java使用hutool工具类发送网络请求
41 0
|
1月前
|
JSON Java API
|
1月前
|
Java 应用服务中间件
解决tomcat启动报错:无法在web.xml或使用此应用程序部署的jar文件中解析绝对的url [http:java.sun.com/jsp/jstl/core]
解决tomcat启动报错:无法在web.xml或使用此应用程序部署的jar文件中解析绝对的url [http:java.sun.com/jsp/jstl/core]
131 1
|
2月前
|
Java Linux 数据安全/隐私保护
Java【代码 16】将word、excel文件转换为pdf格式和将pdf文档转换为image格式工具类分享(Gitee源码)aspose转换中文乱码问题处理
【2月更文挑战第3天】Java 将word、excel文件转换为pdf格式和将pdf文档转换为image格式工具类分享(Gitee源码)aspose转换中文乱码问题处理
101 0
|
2月前
|
安全 算法 Java
Java Collections工具类:常用方法与技巧
Java Collections工具类:常用方法与技巧

热门文章

最新文章