开发者社区> 问答> 正文

Urllib.request不适用于python 3.如何使用beautifulsoup?

python小能手 2019-01-23 16:24:43 657

我正在努力学习如何抓取一个网站,并且我一直碰到urllib.request,这对我不起作用。

import urllib.request
import bs4 as bs
sauce = urllib.request.urlopen('https://www.goat.com/collections/just-dropped').read()
soup = bs.BeautifulSoup(sauce, 'lxml')
print(soup)

Python
分享到
取消 提交回答
全部回答(1)
  • python小能手
    2019-07-17 23:26:43

    如前所述,您可以requests真正使用该库来获取页面内容。

    首先,你必须安装requests和bs4通过pip。这将解决ModuleNotFoundError你的问题。

    pip install bs4
    pip install requests
    然后他就是你获取数据的代码:

    import requests
    from bs4 import BeautifulSoup
    sauce = requests.get('https://www.goat.com/collections/just-dropped')
    soup = BeautifulSoup(sauce.text, 'lxml')
    print(soup)


    import requests
    import bs4 as bs
    sauce = requests.get('https://www.goat.com/collections/just-dropped').text
    soup = bs.BeautifulSoup(sauce, 'lxml')
    print(soup)

    0 0

集结各类场景实战经验,助你开发运维畅行无忧

推荐文章
相似问题