我用漂亮的汤刮维基百科信息表。有没有办法将表数据转换成json ?我想要从wikipedia获取像date这样的表数据,并将其转换为json。我可以完美地使用bs4,但不能将其创建为json 问题来源StackOverflow 地址:/questions/59384659/convert-table-data-to-json-format
使用panda,您可以像下面这样转换表。还可以看看熊猫。to_json,您可以将json转换成许多不同的方向来满足您的需求。
import requests
import csv
from bs4 import BeautifulSoup
import pandas as pd
def getContent(link, filename, whichtable=0):
result1 = requests.get(link)
src1 = result1.content
soup = BeautifulSoup(src1,'lxml')
table = soup.find_all('table')[whichtable]
with open(filename,'w',newline='') as f:
writer = csv.writer(f)
for tr in table('tr'):
#print(tr)
row = [t.get_text(strip=True)for t in tr(['td','th'])]
writer.writerow(row)
getContent('https://en.wikipedia.org/wiki/List_of_highest-grossing_films', 'what.csv', whichtable=0)
df = pd.read_csv('what.csv')
df.to_json()
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。