文档备案控制台

开发者社区问答正文

如果所有列都包含特定模式，请在pandas数据框中选择行问

我有以下数据框

id pattern1 pattern2 pattern3
1 a-b-c a-b-- a-b-c
2 a-a-- a-b-- a-c--
3 a-v-- a-m-- a-k--
4 a-b-- a-n-- a-n-c
我想过滤包含模式的行 - 在所有列的末尾。在这种情况下，输出将是

2 a-a-- a-b-- a-c--
3 a-v-- a-m-- a-k--
到目前为止，我只能想到做类似以下的事情

df[(len(df['pattern1'].str.split('--')[1])==0) & \
(len(df['pattern2'].str.split('--')[1])==0) & \
(len(df['pattern3'].str.split('--')[1])==0)]
这不起作用。另外，我不能写所有列的名称，因为tehre是20列。如何过滤该行中所有列与特定模式/条件匹配的行？

展开

收起

一码平川MACHEL 2019-01-18 10:17:56 1656 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

一码平川MACHEL
首先将“id”设置为索引（如果尚未完成）。
df = df.set_index('id')
检查每个字符串的一个选项是使用applymap调用str.endswith：
df[df.applymap(lambda x: x.endswith('--')).all(1)]
pattern1 pattern2 pattern3
id
2 a-a-- a-b-- a-c--
3 a-v-- a-m-- a-k--
另一个选择是apply调用pd.Series.str.endswith每一列：
df[df.apply(lambda x: x.str.endswith('--')).all(1)]
pattern1 pattern2 pattern3
id
2 a-a-- a-b-- a-c--
3 a-v-- a-m-- a-k--
最后，为了提高性能，您可以使用logical_and.reduce以下方法在列表理解中进行AND掩码：
m = np.logical_and.reduce([df[c].str.endswith('--') for c in df.columns])
m = np.logical_and.reduce([
```
[x.endswith('--') for x in df[c]] for c in df.columns])
```
m
array([False, True, True, False])
df[m]
pattern1 pattern2 pattern3
id
2 a-a-- a-b-- a-c--
3 a-v-- a-m-- a-k--
如果还有其他列，但您只想考虑那些名为“pattern *”的列，则可以filter在DataFrame上使用：
u = df.filter(like='pattern')
现在重复使用上面的选项u，例如，第一个选项将是
df[u.applymap(lambda x: x.endswith('--')).all(1)]
2019-07-17 23:25:49

赞同展开评论

问答分类：

Python

问答标签：

Pandas数据框 Pandas列 Pandas行列Pandas数据框

问答地址：

开发者社区 > 开发与运维 > 问答

相关问答

pandas数据分组中选中—列，或列的子集是什么意思呢？

501

1

0

pandas中按索引提取单行的数值和提取区域行数值的方法是什么？

481

1

0

pandas中使用列prince的均值都NA进行填充和清除city字段的字符空格的方法是什么？

394

1

0

pandas中设置索引列和按照索引列排序的方法是什么？

431

1

0

Pandas中删除列索引的语法是什么？

333

1

0

Pandas中调用什么删除某行？

350

0

0

Pandas中调用什么删除指定列？

344

1

0

Pandas中调用什么添加指定列？

330

1

0

Pandas中merge（）做什么连接时，连接的数据是两个DataFrame key列数据的并集？

353

1

0

Pandas中merge（）最终连接的数据是两个DataFrame key列数据的什么？

415

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

CoPAW配置后，对话，出现 AGENT_UNKNOWN_ERROR 如何解决

copaw安装后，出现这个情况，在设置模型的过程中出现这个问题，如何解决

Qwen OpenAI-Responses 兼容模式有问题

copaw安装后选择ollma为啥报错不能安装相关模型？

建议通义灵码参考字节的trae ，可以自主选择一些开源的模型

相关文章

ABoVE：加拿大西北地区土壤有机质的燃烧严重程度，2014-2015 年

9.9元定制专属AI员工：阿里云OpenClaw三步极速部署指南

UV实战教程，我啥要从Anaconda切换到uv来管理包？

基于伪造人力资源更新的凭证窃取攻击链分析与防御

数据采集效率翻倍？关键在爬虫工具的这几步配置

相关解决方案

更多

基于数据闪回，快速恢复数据

海量异构数据预处理破局之道

分析 Agent 实现一键 AI 数据洞察

多模态数据信息提取

数据守护：防勒索攻击数据保障

还有其他疑问?