开发者社区> 问答> 正文

创建或修改一个没有锚标记的锚文本列表

我是Python的新手,我试图建立一个脚本,提取一些文本从一个网站和粘贴到一个谷歌电子表格。 文本是包装在网站标签中的标题。我使用了BeautifulSoup(并导入了pygspread)来提取像这样的标题:

target_url = 'WEBSITE URL'
r = requests.get(target_url)
soup = BeautifulSoup(r.text, 'html.parser')

seminarTitles = soup.findAll("a",{"class":"eventCardHead--title"})

for title in seminarTitles:
   print(title.text)

这将提取a标记之间的标题并打印它们。但是,我想要将列表项粘贴到谷歌工作表中,而不是打印,因此我需要使用像["Title1","Title2",…]这样的标题来正确地格式化列表。但是有了这些代码,列表仍然包含所有的a标记。但是如何使用(title.text)操作来格式化列表,或者如何立即创建一个正确格式化的列表? 问题来源StackOverflow 地址:/questions/59465490/python-beautifulsoup-create-or-modify-a-list-of-anchor-text-without-anchor-ta

展开
收起
kun坤 2019-12-25 16:12:10 684 0
1 条回答
写回答
取消 提交回答
  • 我认为这是您想要的:

    target_url = 'WEBSITE URL'
    r = requests.get(target_url)
    soup = BeautifulSoup(r.text, 'html.parser')
    
    seminarTitles = soup.findAll("a",{"class":"eventCardHead--title"})
    Titles = []
    for title in seminarTitles:
       Titles.append(title.text)
    
    print(Titles)
    

    输出:

    ["Title1","Title2",...]
    
    2019-12-25 16:59:07
    赞同 展开评论 打赏
问答分类:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载