我正在尝试从电子商务网页上练习网络报废。我已经确定了容器的类名(包含每个产品的单元格)'c3e8SH'。然后,我使用以下代码来废弃该网页中的所有容器。之后,我用来len(containers)检查网页中的容器数量。
然而,它返回0.
import bs4
from urllib.request import urlopen as uReq
from bs4 import BeautifulSoup as soup
# opening up connection, grabbing the page
uClient = uReq(my_url)
page_html = uClient.read()
uClient.close()
#html parsing
page_soup = soup(page_html, 'html.parser')
#grabs each product
containers = page_soup.find_all('div', class_='c3e8SH')
len(containers)
没有确定div。
'c3e8SH'
你能再次查看网站吗?
尝试使用其他解析器。我推荐lxml。所以你创建的page_soup行将是: page_soup = soup(page_html, 'lxml')
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。