开发者社区> 问答> 正文

将表格数据转换成json格式

我用漂亮的汤刮维基百科信息表。有没有办法将表数据转换成json ?我想要从wikipedia获取像date这样的表数据,并将其转换为json。我可以完美地使用bs4,但不能将其创建为json 问题来源StackOverflow 地址:/questions/59384659/convert-table-data-to-json-format

展开
收起
kun坤 2019-12-26 14:32:42 587 0
1 条回答
写回答
取消 提交回答
  • 使用panda,您可以像下面这样转换表。还可以看看熊猫。to_json,您可以将json转换成许多不同的方向来满足您的需求。

    import requests
    import csv
    from bs4 import BeautifulSoup
    import pandas as pd
    
    def getContent(link, filename, whichtable=0):
        result1 = requests.get(link)
        src1 = result1.content
        soup = BeautifulSoup(src1,'lxml')
        table = soup.find_all('table')[whichtable]
        with open(filename,'w',newline='') as f:
            writer = csv.writer(f)
            for tr in table('tr'):
                #print(tr)
                row = [t.get_text(strip=True)for t in tr(['td','th'])]
                writer.writerow(row)
    
    getContent('https://en.wikipedia.org/wiki/List_of_highest-grossing_films', 'what.csv', whichtable=0)
    
    df = pd.read_csv('what.csv')
    df.to_json()
    
    2019-12-26 14:33:13
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载