开发者社区> 问答> 正文

无法从网页中删除容器

一码平川MACHEL 2019-01-23 13:38:43 433

我正在尝试从电子商务网页上练习网络报废。我已经确定了容器的类名(包含每个产品的单元格)'c3e8SH'。然后,我使用以下代码来废弃该网页中的所有容器。之后,我用来len(containers)检查网页中的容器数量。

然而,它返回0.

import bs4
from urllib.request import urlopen as uReq
from bs4 import BeautifulSoup as soup

my_url = 'https://www.lazada.sg/catalog/?spm=a2o42.home.search.1.488d46b5mJGzEu&q=switch%20games&_keyori=ss&from=search_history&sugg=switch%20games_0_1'

# opening up connection, grabbing the page
uClient = uReq(my_url)
page_html = uClient.read()
uClient.close()

#html parsing
page_soup = soup(page_html, 'html.parser')

#grabs each product
containers = page_soup.find_all('div', class_='c3e8SH')
len(containers)

容器
分享到
取消 提交回答
全部回答(1)
  • 一码平川MACHEL
    2019-07-17 23:26:35

    没有确定div。

    'c3e8SH'

    你能再次查看网站吗?


    尝试使用其他解析器。我推荐lxml。所以你创建的page_soup行将是: page_soup = soup(page_html, 'lxml')

    0 0
+ 订阅

云原生时代,是开发者最好的时代

推荐文章
相似问题
推荐课程