使用python提取excle数据 , 进行处理并写回

简介: 使用python提取excle数据 , 进行处理并写回
import pandas as pd
def open_excel(file_path,sheet_name,old_line,new_line):
    df = pd.read_excel(file_path, sheet_name=sheet_name)
    processed_data = []
    # 迭代DataFrame中的每一行
    for index, row in df.iterrows():
        # 提取当前行的'data'字段值
        data_value = row[f'{old_line}']
        run(data_value, processed_data)
    # 将处理后的数据列表转换为pandas Series,以便可以赋值给DataFrame的列
    processed_series = pd.Series(processed_data, index=df.index)
    # 将处理后的Series赋值回原来的DataFrame的'data'列
    df[f'{new_line}'] = processed_series
    # 保存回Excel文件,注意这会覆盖原始文件,请确保备份或允许覆盖
    df.to_excel(file_path, index=False, sheet_name=sheet_name)
    print(processed_data)
    print("处理完成,数据已写回Excel文件。")
def run(data_value,processed_data):
    
    # 处理数据 , 这里写入处理方式
    try:
        data = len(data_value)
    except Exception as e:
        data = ''
        print(e)
    processed_data.append(data)
if __name__ == '__main__':
    # 替换为你的Excel文件路径
    file_path = r"D:\Users\lenovo\Desktop\cc.xlsx"
    # 替换为你的工作表名,如果是默认的话通常是'Sheet1'
    sheet_name = 'Sheet1'
    # 替换为你的Excel文件中要处理的列名
    old_line = '评论'
    # 替换为你的Excel文件中要替换的列名
    new_line = 'aa'
    open_excel(file_path, sheet_name, old_line, new_line)


相关文章
|
2天前
|
算法 数据挖掘 数据处理
搜索新境界:Python二分查找变种实战,精准定位数据不是梦!
【7月更文挑战第13天】二分查找算法以O(log n)效率在有序数组中查找数据。基础算法通过不断分割数组对比中间元素。Python实现变种包括:1) 查找目标值的第一个出现位置,找到后向左搜索;2) 查找目标值的最后一个出现位置,找到后向右搜索。这些变种在数据分析和索引构建等场景中极具价值,提升处理效率。
|
3天前
|
存储 算法 搜索推荐
算法进阶之路:Python 归并排序深度剖析,让数据排序变得艺术起来!
【7月更文挑战第12天】归并排序是高效稳定的排序算法,采用分治策略。Python 实现包括递归地分割数组及合并已排序部分。示例代码展示了如何将 `[12, 11, 13, 5, 6]` 分割并归并成有序数组 `[5, 6, 11, 12, 13]`。虽然 $O(n log n)$ 时间复杂度优秀,但需额外空间,适合大规模数据排序。对于小规模数据,可考虑其他算法。**
15 4
|
2天前
|
数据格式 Python
Python代码示例,读取excel表格,将行数据转为列数据。(10)
【7月更文挑战第10天】Python代码示例,读取excel表格,将行数据转为列数据。
16 2
|
5天前
|
算法 Python
深度剖析!Python中图的DFS与BFS遍历,让你的数据搜索快到飞起
【7月更文挑战第10天】在数据结构和算法中,图遍历是核心概念,Python支持DFS和BFS来探索图。DFS递归深入节点,利用栈,先访问深处;BFS使用队列,层次遍历,先访问最近节点。
18 1
|
1天前
|
数据可视化 Python
时间序列分析是一种统计方法,用于分析随时间变化的数据序列。在金融、经济学、气象学等领域,时间序列分析被广泛用于预测未来趋势、检测异常值、理解周期性模式等。在Python中,`statsmodels`模块是一个强大的工具,用于执行各种时间序列分析任务。
时间序列分析是一种统计方法,用于分析随时间变化的数据序列。在金融、经济学、气象学等领域,时间序列分析被广泛用于预测未来趋势、检测异常值、理解周期性模式等。在Python中,`statsmodels`模块是一个强大的工具,用于执行各种时间序列分析任务。
7 0
|
1天前
|
机器学习/深度学习 PyTorch TensorFlow
在深度学习中,数据增强是一种常用的技术,用于通过增加训练数据的多样性来提高模型的泛化能力。`albumentations`是一个强大的Python库,用于图像增强,支持多种图像变换操作,并且可以与深度学习框架(如PyTorch、TensorFlow等)无缝集成。
在深度学习中,数据增强是一种常用的技术,用于通过增加训练数据的多样性来提高模型的泛化能力。`albumentations`是一个强大的Python库,用于图像增强,支持多种图像变换操作,并且可以与深度学习框架(如PyTorch、TensorFlow等)无缝集成。
8 0
|
1天前
|
Python
在Python中,`multiprocessing`模块提供了一种在多个进程之间共享数据和同步的机制。
在Python中,`multiprocessing`模块提供了一种在多个进程之间共享数据和同步的机制。
4 0
|
4天前
|
机器学习/深度学习 数据可视化 数据处理
探索Python中的数据维数【从二维到高维数据的处理与应用】
【7月更文挑战第7天】了解Python在数据科学中的作用,特别是处理不同维度数据。NumPy和Pandas是核心工具,前者提供多维数组,后者支持二维数据结构如DataFrame。高维数据如图像和文本可以用OpenCV、Pillow、NLTK等处理。处理高维数据涉及降维技术,如PCA和t-SNE,以应对计算复杂性和过拟合。未来趋势包括自动化特征工程和深度学习的进一步发展。
11 0
|
4天前
|
数据可视化 数据挖掘 数据处理
Python对Excel两列数据进行运算【从基础到高级的全面指南】
【7月更文挑战第6天】使用Python的`pandas`库处理Excel数据,涉及安装`pandas`和`openpyxl`,读取数据如`df = pd.read_excel('data.xlsx')`,进行运算如`df['Sum'] = df['Column1'] + df['Column2']`,并将结果写回Excel。`pandas`还支持数据筛选、分组、可视化、异常处理和性能优化。通过熟练运用这些功能,可以高效分析Excel表格。
9 0
|
6天前
|
机器学习/深度学习 运维 算法
Python基于局部离群因子LOF算法(LocalOutlierFactor)实现信用卡数据异常值检测项目实战
Python基于局部离群因子LOF算法(LocalOutlierFactor)实现信用卡数据异常值检测项目实战