如何使用python selenium采集领英帖子数据?

我最近在分析社媒求职情感倾向,看看ai是否改变了大家的求职意向,怎么采集相关数据呢?据说brightdata有相应的领英接口可以用

展开
收起
py世界 2026-01-28 16:57:29 35 分享 版权
1 条回答
写回答
取消 提交回答
  • 分享编程故事~

    selenium是用途比较广的自动化工具了,一般会在python使用selenium库对chrome进行自动化操作,实现网页抓取解析,但存在的问题是,如果要采集领英这类复杂网站,会出现ip限制、人机验证等情况。
    处理的方式要么自己配置ip代理,模拟真人访问行为,但不可避免会被识别到,另一种方式是接入亮数据的网页抓取浏览器api,这也是一种浏览器,不过部署在云上,亮数据进行了网页解锁和ip池切换部署,所以不需要你在selenium脚本中去处理反爬问题。
    selenium使用这个api也不难,需要先申请api配置信息SBR_WEBDRIVER,然后通过remote方法请求来操作浏览器即可。

    2026-01-28 18:33:04
    赞同 72 展开评论
问答分类:

大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。

还有其他疑问?
咨询AI助理