开发者社区> sky-heaven> 正文
阿里云
为了无法计算的价值
打开APP
阿里云APP内打开

牛人博客!!!各大招聘网站信息实时查询浏览【转】

简介: 转自:http://www.cnblogs.com/zhaopei/p/4368417.html 阅读目录   效果图: 第一、分析url 智联招聘: 猎聘网: 前程无忧: 第二、用到了HtmlAgilityPack.
+关注继续查看

转自:http://www.cnblogs.com/zhaopei/p/4368417.html

阅读目录

      最近听得较多的跳槽、面试之类的,相信很多园友也开始蠢蠢欲动了,有的甚至早已经开始了。最近我也在琢磨着换工作的事。说得俗套点,人在外面不就为了那么点工资么。现在找工作大部分都是通过在网上投简历,然后等电话 通知面试的。然,现在的招聘网站也是比较多。一个一个的在各大网站切换的流量招聘信息 实属麻烦。之前看到过一篇博文。《找工作神器,提取各大网站有效的招聘信息(前程无忧、智联招聘、猎聘网)》感觉这想法挺好的。把各大网站信息集中起来浏览,第一省了来回切换,第二还不容易重复投简历。本想拿来用用的,无奈没有提供源码下载,且是客户端版本。于是就只能自己动手,丰衣足食了~。(网站就是强大,可以大家一起分享●0●^_^)

     合并查询本来就是为了简单方便,所以也就没有弄很复杂了,一个页面搞定。如果同学们有什么好的想法,可以建议建议。

效果图:

就一个简单的关键字输入框、工作地点的选择和信息来源网站。

其实看上去很简单,实现起来也很简单。~~代码不多,难度也很小。很多时候需要的技术不是很多,想法更重要。

不想往下看的可以直接用用 演示地址 ,同学们求工作给推荐推荐,上海 浦东 .net。 私密我,或Q我。

 

第一、分析url

进入招聘网站的时候url大串大串的,我们需要用的的就三个。搜索关键字、地址和页码。

智联招聘:

http://sou.zhaopin.com/jobs/searchresult.ashx?jl=地址&kw=关键字&p=页码

jl=地址

kw=关键字

p=页码

然后地址的话 直接中文地址就ok了

猎聘网:

http://www.liepin.com/zhaopin/?key=关键字&dqs=地址&curPage=页码

key=关键字

dqs=地址

curPage=页码

地址有一个对应的编号

("北京", "010");
("上海", "020");
("广州", "050020");...等等  也是在猎聘网选择地址的地方右键 审查元素可以看到,如下:

前程无忧:

http://search.51job.com/jobsearch/search_result.php?jobarea=地址&keyword=关键字&curr_page=页码

jobarea=地址 [和猎聘一样的查找方法]

keyword=关键字

curr_page=页码

第二、用到了HtmlAgilityPack.DLL HTML解析组件

在之前我发过的 博客转发小工具 有提过HtmlAgilityPack。这里再简单的说说用法。

复制代码
case ZhaopinType.猎聘网:
    var htmlWeb = new HtmlWeb();
    htmlWeb.OverrideEncoding = Encoding.GetEncoding("UTF-8");
    HtmlAgilityPack.HtmlDocument response = htmlWeb.Load(url);
    #region MyRegion
    var ulS = response.DocumentNode.SelectNodes("//*[@id='sojob']/div[2]/div/div/ul/li");
    foreach (var item in ulS)
    {
        var xpath = item.XPath;
        string titleName, infourl, company, city, date, salary, salary_em, source;
        titleName = item.SelectSingleNode(xpath + "/a").Attributes["title"].Value;
        infourl = item.SelectSingleNode(xpath + "/a").Attributes["href"].Value;
        company = item.SelectSingleNode(xpath + "/a/dl/dt[@class='company']").InnerText;
        city = item.SelectSingleNode(xpath + "/a/dl/dt[@class='city']/span").InnerText;
        date = item.SelectSingleNode(xpath + "/a/dl/dt[@class='date']/span").InnerText;
        salary = item.SelectSingleNode(xpath + "/a/dl/dt[@class='salary']/span").InnerText;
        salary_em = item.SelectSingleNode(xpath + "/a/dl/dt[@class='salary']/em").InnerText;
        source = "猎聘网";

        zpInfoList.Add(
            new ZhaopinInfo()
            {
                city = city,
                company = company,
                date = date,
                info_url = infourl,
                salary = salary,
                salary_em = salary_em,
                titleName = titleName,
                source = source
            });
    }
    #endregion
    break;
复制代码

1.设置访问url页面的编码

 htmlWeb.OverrideEncoding = Encoding.GetEncoding("UTF-8");

设置编码为UTF-8,具体看对应页面采用的编码。

2.元素路径下的元素集合

var ulS = response.DocumentNode.SelectNodes("//*[@id='sojob']/div[2]/div/div/ul/li");

SelectNodes方法里面的这串字符串怎么来?

右键审查元素 Copy XPath 就ok了。不过如果js有动态修改document树的话 那么这个路径就不准了,需要自己微调下。

3、取标签的属性值 Attributes

如:取a标签的title值。

titleName = item.SelectSingleNode(xpath + "/a").Attributes["title"].Value;

4.取标签的中间的文本 InnerText

company = item.SelectSingleNode(xpath + "/a/dl/dt[@class='company']").InnerText;

5.过滤选择特定的id 或 class

XPath 中 标签名后面加上中括号 和@ 如: "/a/dl/dt[@class='company']"

第三、浏览器滚动条的onscroll事件

js获取滚动条距离浏览器顶部,底部的高度,兼容ie和firefox

取窗口可视范围的高度[浏览器可见区域高度]

复制代码
//取窗口可视范围的高度[浏览器可见区域高度]
        getClientHeight: function () {
            var clientHeight = 0;
            if (document.body.clientHeight && document.documentElement.clientHeight) {
                var clientHeight = (document.body.clientHeight < document.documentElement.clientHeight) ? document.body.clientHeight : document.documentElement.clientHeight;
            } else {
                var clientHeight = (document.body.clientHeight > document.documentElement.clientHeight) ? document.body.clientHeight : document.documentElement.clientHeight;
            }
            return clientHeight;
        }
复制代码

取窗口滚动条高度[滚动条距离顶部的高度]

复制代码
  getScrollTop: function () {
            var scrollTop = 0;
            if (document.documentElement && document.documentElement.scrollTop) {
                scrollTop = document.documentElement.scrollTop;
            } else if (document.body) {
                scrollTop = document.body.scrollTop;
            }
            return scrollTop;
        }
复制代码

 

取文档内容实际高度

  getScrollHeight: function () {
            return Math.max(document.body.scrollHeight, document.documentElement.scrollHeight);
        }

 

滚动条距离底部的高度

getScrollbheight: function () { return this.getScrollHeight() - this.getScrollTop() - this.getClientHeight(); }

 

 取滚动条距离底部的高度,当滚动条到最底部的时候,通过ajax异步请求后台,加载下一页数据,这样就可以免了翻页的麻烦了。

 

ps:用jquery 更加简洁(感谢@Samguist

if ($(window).scrollTop() == $(document).height() - $(window).height()) {
// ajax异步加载数据
}

 

 

 

基本上就是这样简单,没什么难度。记得有什么好工作通知一声哦~^_^ ^_^   ***** 点击本人求职信息*****

环境:vs2013   数据库:无   插件:HtmlAgilityPack   演示地址  源码下载  (源码都下了 顺手点个赞呗~)

【作者】张昺华
【新浪微博】 张昺华--sky
【twitter】 @sky2030_
【facebook】 张昺华 zhangbinghua
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利.

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
35-博客网站数据库-博文信息数据操作(二)
35-博客网站数据库-博文信息数据操作(二)
26 0
使用新版 CODING 静态网站服务 创建 Hexo 博客
产品介绍 CODING 静态网站服务是 CODING 联合腾讯云 Serverless 团队,为开发者提供的便捷、稳定、高拓展性的静态网站资源托管服务。无需自建服务器,即可一键部署网站应用,将静态网站分发至全网节点,轻松为您的网站业务增添稳定、高并发、快速访问等能力。
378 0
利用码云备份博客源文件
本期来讲讲自己搭建的hexo博客以及个人网站的源文件备份问题。Github是国际的代码托管平台,非常丰富的开源代码库,但是目前私有库是收费的,而码云是开源中国的Git代码托管平台,支持免费的私有库。因此,利用码云来备份博客或者个人网站源文件是非常不错的选择。
1352 0
Hexo+GitHub搭建个人博客网站
前言 今天,带大家利用Hexo和GitHub搭建属于自己的个人博客。 配一张图 Hexo Hexo 是一个快速、简洁且高效的博客框架。Hexo 使用 Markdown(或其他渲染引擎)解析文章,在几秒内,即可利用靓丽的主题生成静态网页。
2262 0
博客主站搬迁
博客主站已移至https://standhr.github.io/。此博客以后只会转载主站文章。
855 0
网上投简历的潜规则,真黑!-中国所有招聘网站(转)
网上投简历的潜规则,真黑!-中国所有招聘网站 现在中国所有招聘网站(以智联招聘、前程无忧、中华英才网等为例)都是以人事经理为中心,因为他们是付费的一方,较少从免费的求职者角度考虑,如果我们从求职者立场或者中立立场来看中国招聘网站的生意模式及运作流程,将这个求职者并不知晓的事情公布出来,你就会更好清醒认识招聘网站,也更好的实际的利用人才网站求职:  一、 人才网站与企业人事经理的生意模式对求职者影响:     人才网站的行规是企业人事经理支付600元,可以在一个月内发布一定的职位让求职者投递简历, 可以搜索查看人才网站简历库的简历,还可以下载一定数量的简历主动与求职者联系。
1053 0
“天涯博客”“江西福利彩票网”等网站被挂马
据瑞星“云安全”系统统计,6月9日,共有1,697,327人次的网民遭到网页挂马攻击,瑞星共截获了334,006个挂马网址。 Backdoor.Win32.Gpigeon2007.cyr(灰鸽子后门病毒)“云安全”系统共收到48106次用户上报。
1151 0
趋势科技:Web2.0网站将成黑客首要攻击目标
网络安全软件厂商趋势科技发布“2009年网络安全趋势预测”表示,今年Web 2.0社交网站使用率大增,加上使用者认知不足,预计Web 2.0网站将成为黑客攻击首要目标。 趋势科技称,去年包括大规模Web入侵攻击、AUTORUN恶意程式、社会工程学诈骗手法与区域性资料安全威胁,显示网络罪犯纷纷使用新媒体或针对旧媒体进行改良,用以谋取利益。
4080 0
+关注
sky-heaven
我是一个技术爱好者,喜欢分享交流技术心得
1191
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
低代码开发师(初级)实战教程
立即下载
阿里巴巴DevOps 最佳实践手册
立即下载
冬季实战营第三期:MySQL数据库进阶实战
立即下载