Hive的parse_url函数使用
parse_url(url, partToExtract[, key]) - extracts a part from a URL
解析URL字符串
partToExtract的选项包含[HOST,PATH,QUERY,REF,PROTOCOL,FILE,AUTHORITY,USERINFO]
举例 :
select parse_url('http://hujiang.com/category/12258437290?query=test', 'PROTOCOL') from dual;
--http
select parse_url('http://hujiang.com/category/12258437290?query=test', 'HOST') from dual;
---hujiang.com
select parse_url('http://hujiang.com/category/12258437290?query=test', 'REF') from dual;
---空
select parse_url('http://hujiang.com/category/12258437290?query=test', 'PATH') from dual;
---/category/12258437290
select parse_url('http://hujiang.com/category/12258437290?query=test', 'QUERY') from dual;
---query=test
select parse_url('http://hujiang.com/category/12258437290?query=test', 'FILE') from dual;
---/category/12258437290?query=test
select parse_url('http://hujiang.com/category/12258437290?query=test', 'AUTHORITY') from dual;
---hujiang.com
select parse_url('http://hujiang.com/category/12258437290?query=test', 'USERINFO') from dual;
---空