开发者社区> 问答> 正文

试图从excel解析数据时,数据是在某种格式

我对正则表达式不太熟悉。我试图从excel文件(df1)的某个列中提取所有这些格式的货币和数值($##,###|$#,###|$####|#### ###### ###### ###### ###### ###### #)。我一直得到下面的回溯错误

import re
import pandas as pd
df1= pd.read_excel(r'C:\Users\user.name\Desktop\py_extractnumbers.xlsx', sheet_name = 0)
rows = len(df1)
print(str('Begin loop'))
for i in range(rows):
    NoteValue = df1.loc[i]['Comments']
    compilecheck = re.compile(r'\d\d\d\d'|r'\d,\d\d\d'|r'$\d,\d\d\d'|r'$\d\d,\d\d\d'|r'$\d\d\d\d')
    test= compilecheck.search(str(NoteValue))
    if test != None:
        result = str(test)
        df1['Amount']= df1['Amount'].astype(str)
        df1.at[i,'Amount']=result
        df1.at[i,'Amount']  
        print(str(result))
    else:
        pass

回溯错误

TypeError: unsupported operand type(s) for |: 'str' and 'str'

问题来源StackOverflow 地址:/questions/59380432/attempting-to-parse-out-data-from-excel-when-the-data-is-in-a-certain-format

展开
收起
kun坤 2019-12-28 14:17:31 388 0
1 条回答
写回答
取消 提交回答
  • 技术架构师 阿里云开发者社区技术专家博主 CSDN签约专栏技术博主 掘金签约技术博主 云安全联盟专家 众多开源代码库Commiter

    正则表达式内使用$,这个是特殊字符

    2020-01-04 22:52:56
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
神龙云服务器产品及技术深度解析 立即下载
弹性创造价值:基于ECS的最佳性价比实践解析 立即下载
又快又稳:阿里云下一代虚拟交换机解析 立即下载

相关镜像