开发者社区 问答 正文

如何实现从一个url抓取底下所有url并保存为文本? 400 报错

如何实现从一个url抓取底下所有url并保存为文本? 400 报错

假如说,我输入http://www.taobao.com,底下还有一系列的子url请求。怎么在linux系统上把这些url都抓出来呢?要抓出来进行分析(上面截图是httpwatch的抓包截图)

展开
收起
爱吃鱼的程序员 2020-06-03 14:56:51 412 分享 版权
1 条回答
写回答
取消 提交回答
  • https://developer.aliyun.com/profile/5yerqm5bn5yqg?spm=a2c6h.12873639.0.0.6eae304abcjaIB

    下载页面,正则匹配所有的http请求,然后遍历下载######不行,这个没办法。是用curl下来,然后匹配http吗?这些没有全部的子url请求。

    2020-06-03 17:12:51
    赞同 展开评论
问答标签:
问答地址: