使用Pandas Dataframe列中的字典对象重新分配子字符串

下面的问题已得到简化。

该解决方案应适用于较大的数据集和较大的词典。

给定pandas.DataFrame

import pandas as pd

pd.DataFrame(data = {'foo': [1223, 2931, 3781], 
'bar': ["34 fake st, footown", "88 real crs, barrington", "28 imaginary st, bazington"]})



|    |   foo | bar                        |
|---:|------:|:---------------------------|
|  0 |  1223 | 34 fake st, footown        |
|  1 |  2931 | 88 real crs, barrington    |
|  2 |  3781 | 28 imaginary st, bazington |

和一个字典对象：

my_dictionary = {'st':'street', 'crs':'crescent'}

用my_dictionary替换pandas.DataFrame的一列中包含的子字符串的最佳方法是什么？

我期望有一个结果如下的pandas.DataFrame：

|    |   foo | bar                             |
|---:|------:|:--------------------------------|
|  0 |  1223 | 34 fake street, footown         |
|  1 |  2931 | 88 real crescent, barrington    |
|  2 |  3781 | 28 imaginary street, bazington  |

我尝试了以下方法：

for key, val in my_dictionary.items():
    df.bar.loc[df.bar.str.contains(key)] = df.bar.loc[df.bar.str.contains(key)].apply(lambda x: x.replace(key,val))

df.bar

用给定的输出。

SettingWithCopyWarning: 
A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  self._setitem_with_indexer(indexer, value)
0           34 fake street, footown
1      88 real crescent, barrington
2    28 imaginary street, bazington
Name: bar, dtype: object

我如何在不收到上述警告消息的情况下执行重新分配；而不使用.copy（）吗？

问题来源：stackoverflow

df["bar"] = df["bar"].replace(my_dictionary, regex=True) print (df) foo bar 0 1223 34 fake street, footown 1 2931 88 real crescent, barrington 2 3781 28 imaginary street, bazington

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

使用Pandas Dataframe列中的字典对象重新分配子字符串

相关文章