人生苦短,我用python-阿里云开发者社区

开发者社区> 开发与运维> 正文

人生苦短,我用python

简介: 大道至简的python 小白我本科学的是城乡规划,考研是农学的森林经理,读研究生的时候闲着无聊,就想学一门编程语言,就听了某大神的建议:首先c语言入门,然后学java就好了。

大道至简的python


小白我本科学的是城乡规划,考研是农学的森林经理,读研究生的时候闲着无聊,就想学一门编程语言,就听了某大神的建议:首先c语言入门,然后学java就好了。可是小白我学了不久就感觉枯燥啊(什么指针,类,对象,搞得无聊,还不能写出像样的项目),碰巧数学建模中遇到要找大量数据的问题,然后自己找啊找啊找数据然后整理啊整理数据这个就弄了我们小组一天的时间,后来在网上看到了‘爬虫’这个神器的东西,决定试一试,就这样,让我了解到了python,从此就爱上了她。废话不多说,先让大家感受下:

直接上个代码:

from bs4 import BeautifulSoup
import requests

url = 'https://movie.douban.com/annual2015/#2'
wb_data = requests.get(url)
soup = BeautifulSoup(wb_data.text,'lxml')
titles = soup.select('div.title.clearfix')
names = soup.select('div.sub-title')
grades = soup.select('span.rank')

for title, name, grade in zip(titles, names, grades):
    ti = title.get_text()
    na = name.get_text()
    gr = grade.get_text()
    data = {
        'title': ti.replace('\n',''),
        'name': na.replace('\n',''),
        'grade': gr.replace('\n','')
    }
    print(data)

这是豆瓣网的一页:

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:
开发与运维
使用钉钉扫一扫加入圈子
+ 订阅

集结各类场景实战经验,助你开发运维畅行无忧

其他文章