Jsoup如何抓取需要登录才能显示的html页面?-问答-阿里云开发者社区-阿里云

开发者社区> 问答> 正文

Jsoup如何抓取需要登录才能显示的html页面?

小旋风柴进 2016-03-12 11:23:19 2060
Connection.Response res = Jsoup.connect("http://www.example.com/login.php")
.data("username", "myUsername", "password", "myPassword")
.method(Method.POST)
.execute();
Document doc = res.parse();
//这儿的SESSIONID需要根据要登录的目标网站设置的session Cookie名字而定
String sessionId = res.cookie("SESSIONID"); 
在上面的代码成功登录后,就可以利用登录的cookie来保持会话,抓取网页内容了
Document objectDoc = Jsoup.connect("http://www.example.com/otherPage")
.cookie("SESSIONID", sessionId)
.get();
上面的一段代码是在网上找到的,但今天刚接触Jsoup,不知道怎么获取目标网页的SESSIONID,求助
分享到
取消 提交回答
全部回答(1)
  • 小旋风柴进
    2019-07-17 19:00:31

    获取目标网页的SESSIONID
    request.getSession().getId()

    0 0
云计算
使用钉钉扫一扫加入圈子
+ 订阅

时时分享云计算技术内容,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。

推荐文章