文档备案控制台

开发者社区问答正文

从Excel读取时Pandas合并的单元格问题

所以我有一个奇怪的样式的xls文件，但是我无能为力，所以我只需要解析它。

如您所见，我有一些合并的单元格。我想做的是为合并的单元格填充空值（“填充”），但还要保持空单元格不变。

像这样

EIM，C，NI1 Enescu_Ioan，EIM，S，NI11，Enescu_Ioan EIM，C，NI1 Enescu_Ioan，空EIM，C，NI1 Enescu_Ioan EIM，S，NI11，Enescu_Ioan EIM，C，NI1，Enescu_Ioan空方式I现在加载文件是这样。

xl = pd.ExcelFile("data/file.xls")
df = xl.parse(0, header=None)

我也尝试过这样打开文件并访问合并的单元格，但是我得到了一个空列表。

book = xlrd.open_workbook("data/file.xls")
book.sheet_by_index(0).merged_cells # This is empty []

有什么办法可以实现？谢谢！

编辑

关于这个问题可能会有一些困惑，所以我会尽力解释。附件图像是较大文件的子集，其中各列可能以不同顺序出现。我想要实现的是一种区分合并单元格NAN值（在合并单元格中只有第一列具有值，其余均为nan）和空单元格NAN的方法。

问题来源：stackoverflow

展开

收起

is大龙 2020-03-24 17:56:57 3646 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

is大龙

设法找到修复

def read_excel(path):
    excel = None
    if path.endswith('xlsx'):
        excel = pd.ExcelFile(xlrd.open_workbook(path), engine='xlrd')
    elif path.endswith('xls'):
        excel = pd.ExcelFile(xlrd.open_workbook(path, formatting_info=True), engine='xlrd')
    else:
        raise ValueError("Could not read this type of data")
    return excel

def parse_excel(excel_file):
    sheet_0 = excel_file.book.sheet_by_index(0)
    df = excel_file.parse(0, header=None)
    return sheet_0, df

def fill_merged_na(sheet, dataframe):
    for e in sheet.merged_cells:
        rl, rh, cl, ch = e
        base_value = sheet.cell_value(rl, cl)
        dataframe.iloc[rl:rh, cl:ch] = base_value
    return dataframe

一些重要的位会打开formatting_info设置为True的excel文件，以读取格式，例如合并的单元格和fill_merged_na函数，该函数仅填充合并的nan值，但保留初始的空单元格。

回答来源：stackoverflow

2020-03-24 17:57:06

赞同展开评论

问答分类：

云解析DNS

问答标签：

excel单元格 Pandas excel excel pandas excel合并 Pandas合并

问答地址：

开发者社区 > 云计算 > 问答

相关问答

请问阿里云RPA如何在Excel表格中单元格里目标中输入？

437

2

0

无影云桌面中使用Excel拷贝单元格内容时内容变成了图片

504

1

0

阿里云RPA Excel获取单元格的值是字符串格式的，我要加什么步骤把数据类型变成数字呢？

566

1

0

控件获取excel单元格的值，含有英文字母截断了

227

0

0

阿里云网盘与相册两个独立的 EXCEL表格，可以其中的一个表格单元格去映射另外一个表格中单元格吗？

166

1

0

阿里云RPA获得excel单元格的值只能是字符串吗？

218

1

0

智能媒体管理中Excel 转 Pdf ，单元格强制换行，转出后 pdf 变成_x00D_，什么原因？

380

0

0

请问现在阿里云rpa封装的excel工具支持设置单元格边框么？

265

3

0

如代码，在阿里云RPA这个发布的机器人读取excel单元格总出错，但是在编辑模式都正常是为什么？

2408

4

0

【宜搭-标准版】创建表单以excel形式导入的时候无法导入存在合并单元格的，以下表单如何实现？

668

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

矩阵账号批量直播，单套软件最多能同时运营几个账号？

能不能靠谱点？每天更新，自己发现不了问题？测试人员都栽了吗？

完全没有直播经验，上手 AI 直播需要多久？

动态变量话术引擎对直播有什么作用？

在vs code安装Qoder CN，登录并订阅了个人专业版，无法使用，急急急

相关文章

阿里云云解析DNS从零到一：从基础解析到智能调度与安全防护的完全指南

阿里云云解析DNS完全使用指南：从基础配置到智能调度与安全防护

一个域名的双栖价值：从“永久茶”到“永久查”，开发者如何用阿里云为品牌托底

阿里云云解析DNS完全使用指南：从基础配置到智能调度与安全防护

阿里云云解析DNS对接使用完全指南：从基础配置到API自动化运维

还有其他疑问?