我是Python的新手,我试图建立一个脚本,提取一些文本从一个网站和粘贴到一个谷歌电子表格。 文本是包装在网站标签中的标题。我使用了BeautifulSoup(并导入了pygspread)来提取像这样的标题:
target_url = 'WEBSITE URL'
r = requests.get(target_url)
soup = BeautifulSoup(r.text, 'html.parser')
seminarTitles = soup.findAll("a",{"class":"eventCardHead--title"})
for title in seminarTitles:
print(title.text)
这将提取a标记之间的标题并打印它们。但是,我想要将列表项粘贴到谷歌工作表中,而不是打印,因此我需要使用像["Title1","Title2",…]这样的标题来正确地格式化列表。但是有了这些代码,列表仍然包含所有的a标记。但是如何使用(title.text)操作来格式化列表,或者如何立即创建一个正确格式化的列表? 问题来源StackOverflow 地址:/questions/59465490/python-beautifulsoup-create-or-modify-a-list-of-anchor-text-without-anchor-ta
我认为这是您想要的:
target_url = 'WEBSITE URL'
r = requests.get(target_url)
soup = BeautifulSoup(r.text, 'html.parser')
seminarTitles = soup.findAll("a",{"class":"eventCardHead--title"})
Titles = []
for title in seminarTitles:
Titles.append(title.text)
print(Titles)
输出:
["Title1","Title2",...]
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。