开发者社区> 问答> 正文

Urllib.request不适用于python 3.如何使用beautifulsoup?

我正在努力学习如何抓取一个网站,并且我一直碰到urllib.request,这对我不起作用。

import urllib.request
import bs4 as bs
sauce = urllib.request.urlopen('https://www.goat.com/collections/just-dropped').read()
soup = bs.BeautifulSoup(sauce, 'lxml')
print(soup)

展开
收起
一码平川MACHEL 2019-01-23 16:24:43 2639 0
1 条回答
写回答
取消 提交回答
  • 如前所述,您可以requests真正使用该库来获取页面内容。

    首先,你必须安装requests和bs4通过pip。这将解决ModuleNotFoundError你的问题。

    pip install bs4
    pip install requests
    然后他就是你获取数据的代码:

    import requests
    from bs4 import BeautifulSoup
    sauce = requests.get('https://www.goat.com/collections/just-dropped')
    soup = BeautifulSoup(sauce.text, 'lxml')
    print(soup)


    import requests
    import bs4 as bs
    sauce = requests.get('https://www.goat.com/collections/just-dropped').text
    soup = bs.BeautifulSoup(sauce, 'lxml')
    print(soup)

    2019-07-17 23:26:43
    赞同 展开评论 打赏
问答分类:
问答标签:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
From Python Scikit-Learn to Sc 立即下载
Data Pre-Processing in Python: 立即下载
双剑合璧-Python和大数据计算平台的结合 立即下载