开发者社区> 余二五> 正文
阿里云
为了无法计算的价值
打开APP
阿里云APP内打开

python mechanize实现百度搜索

简介:
+关注继续查看

利用Python mechanize模块模拟浏览器实现百度搜索

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
# -*- coding:utf-8 -*-
import mechanize
import sys
reload(sys)
sys.setdefaultencoding('utf8')
br=mechanize.Browser()
br.set_handle_equiv(True)
br.set_handle_redirect(True)
br.set_handle_referer(True)
br.set_handle_robots(False)
br.set_handle_gzip(False)
br.set_handle_refresh(mechanize._http.HTTPRefreshProcessor(), max_time=1)
br.addheaders=[('User-agent','Mozilla/5.0 (X11; U; Linux i686; en-US;rv:1.9.0.1) Gecko/2008071615 Fedora/3.0.1-1.fc9 Firefox/3.0.1')]
br.open('
for form in br.forms():
    print form 
br.select_form(name='f')
br.form['wd']='python'
br.submit()
for link in br.links():
    print link.url+':'+link.text

在开头的地方要加上sys模块并设置utf8编码,否则会报ascii编码错误,通过open打开的链接,打印返回的form框架,获取name是f的form,并将关键字字段wd设置要搜索的内容,提交即可,通过br.response().read()可以返回完整的内容,这段代码在返回内容上过滤出链接的内容










本文转自 无心低语 51CTO博客,原文链接:http://blog.51cto.com/fengzhankui/1946336,如需转载请自行联系原作者

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
百度人脸识别:最简单的Python调用
百度人脸识别:最简单的Python调用
0 0
python批量下载百度图片
python批量下载百度图片
0 0
【PYTHON】——如何抓取百度图片到本地
本篇文章主要介绍一下如何抓取百度图片到本地, 从而实现快速找图的需求
0 0
Python小应用 百度接口实现图片文字识别,并打包成安装包软件
整体是用Python实现,所需要使用的第三方库包括aip、PIL、keyboard、pyinstaller,如未安装,可在CMD中使用pip install Baidu-AIP/pillow/keyboard/pyinstaller指令安装。
0 0
Python编程:通过百度文字识别提取表格数据
Python编程:通过百度文字识别提取表格数据
0 0
Python爬虫:利用百度短网址缩短url
Python爬虫:利用百度短网址缩短url
0 0
Python进阶篇:百度指数解密【抓包|JS逆向|数据区分】
Python进阶篇:百度指数解密【抓包|JS逆向|数据区分】
0 0
python+百度api将人物头像动漫化
python+百度api将人物头像动漫化
0 0
+关注
文章
问答
文章排行榜
最热
最新
相关电子书
更多
给运维工程师的Python实战课
立即下载
Python 脚本速查手册
立即下载
ACE 区域技术发展峰会:Flink Python Table API入门及实践
立即下载