开发者社区 问答 正文

创建或修改一个没有锚标记的锚文本列表

我是Python的新手,我试图建立一个脚本,提取一些文本从一个网站和粘贴到一个谷歌电子表格。 文本是包装在网站标签中的标题。我使用了BeautifulSoup(并导入了pygspread)来提取像这样的标题:

target_url = 'WEBSITE URL'
r = requests.get(target_url)
soup = BeautifulSoup(r.text, 'html.parser')

seminarTitles = soup.findAll("a",{"class":"eventCardHead--title"})

for title in seminarTitles:
   print(title.text)

这将提取a标记之间的标题并打印它们。但是,我想要将列表项粘贴到谷歌工作表中,而不是打印,因此我需要使用像["Title1","Title2",…]这样的标题来正确地格式化列表。但是有了这些代码,列表仍然包含所有的a标记。但是如何使用(title.text)操作来格式化列表,或者如何立即创建一个正确格式化的列表? 问题来源StackOverflow 地址:/questions/59465490/python-beautifulsoup-create-or-modify-a-list-of-anchor-text-without-anchor-ta

展开
收起
kun坤 2019-12-25 16:12:10 701 分享
分享
版权
举报
1 条回答
写回答
取消 提交回答
  • 我认为这是您想要的:

    target_url = 'WEBSITE URL'
    r = requests.get(target_url)
    soup = BeautifulSoup(r.text, 'html.parser')
    
    seminarTitles = soup.findAll("a",{"class":"eventCardHead--title"})
    Titles = []
    for title in seminarTitles:
       Titles.append(title.text)
    
    print(Titles)
    

    输出:

    ["Title1","Title2",...]
    
    2019-12-25 16:59:07 举报
    赞同 评论

    评论

    全部评论 (0)

    登录后可评论
问答分类:
问答地址:
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等