备案控制台登录注册

开发者社区数据库文章正文

如何快速创建千万行CSV 数据？

2024-01-31 209 发布于黑龙江

版权

举报

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 如何快速创建千万行CSV 数据？

大家好，我是阿萨。这几天做测试的过程中，遇到了一个难题，那就是需要测试原数据是千万行数据级别的原始数据。而且还必须是有意义的数据。

之前阿萨介绍过创建假数据的几种方式：

自动生成测试数据—Faker

如何使用Postgresql 造数据？

这两种方式都是可以选择的。

但是阿萨觉得都太费事了。如果我有少量数据，如何快速造出千万行数据？

阿萨喜欢用python， python 的pandas 本身就是为大数据做准备的，再加上裂变，岂不是就可以很很轻松弄出数据了。

前提，必须有模板数据，比如100行原始数据。

下面我们看下代码：

import pandas as pd# 请把CSV替换成对应的列名称df = pd.read_csv("Result.csv", names=["Column1","Column1", "Column1", "Column1", "Column1"                                          , "Column1", "Column1", "Column1"                                          , "Column1" , "Column1", "Column1", "Column1", "Column1"                                          , "Column1", "Column1", "Column1", "Column1","Column1"                                          , "Column1" , "Column1", "Column1"                                          , "Column1", "Column1", "Column1"                                          , "Column1", "Column1"], skiprows=[0],)#根据自己的数据量去调整次数for x in range(0, 10):    df1=df.copy()    df=pd.concat([df,df1],ignore_index=True)        df.to_csv('Result2.csv')

赶紧执行下，几分钟就好了。

真是太厉害了。

大家有需要的话，赶紧尝试一下。

如果觉得阿萨的内容对你有帮助，欢迎围观点赞。

文章标签：

Python

关系型数据库

PostgreSQL

大数据

阿萨聊测试

+关注

目录

打赏

0

0

0

0

80

相关文章

sunrr

|

6月前

|

存储 Python

【10月更文挑战第18天】CSV文件

sunrr

238 2 2

渐暖

|

11月前

|

Java Apache

导出csv格式的文件

导出csv格式的文件

渐暖

117 0 0

shliang0603

|

8月前

|

索引 Python

python pandas 把数据保存成csv文件，以及读取csv文件获取指定行、指定列数据

该文档详细介绍了如何使用Python的Pandas库处理图像数据集，并将其保存为CSV文件。示例数据集位于`test_data`目录中，包含5张PNG图片，每张图片名中的数字代表其标签。文档提供了将这些数据转换为CSV格式的具体步骤，包括不同格式的数据输入方法（如NumPy数组、嵌套列表、嵌套元组和字典），以及如何使用`pd.DataFrame`和`to_csv`方法保存数据。此外，还展示了如何读取CSV文件并访问其中的每一行和每一列数据，包括获取列名、指定列数据及行数据的操作方法。

shliang0603

240 1 1

qq2108462953

|

8月前

|

存储 Python

使用CSV模块读取CSV文件--含代码

使用CSV模块读取CSV文件--含代码

qq2108462953

92 0 0

aliyun4039404917-28667

|

数据挖掘 Python

大神是这样处理 CSV 数据的

大神是这样处理 CSV 数据的

aliyun4039404917-28667

110 0 0

生信补给站

|

数据处理

R|批量循环处理同一格式文件-csv,txt,excel

R|批量循环处理同一格式文件-csv,txt,excel

生信补给站

152 0 0

过分的规定

|

数据处理 Python

多线程操作CSV文件并且将CSV文件转成XLSX文件

多线程操作CSV文件并且将CSV文件转成XLSX文件

过分的规定

275 0 0

hacker707-25874

|

存储数据格式索引

【python基础教程】csv文件的写入与读取

CSV (Comma Separated Values)，即逗号分隔值（也称字符分隔值，因为分隔符可以不是逗号），是一种常用的文本格式，用以存储表格数据，包括数字或者字符。很多程序在处理数据时都会碰到csv这种格式的文件。python自带了csv模块，专门用于处理csv文件的读取

hacker707-25874

418 0 0

【python基础教程】csv文件的写入与读取

程序媛三妹ya

|

数据采集 Python

Pandas 合并多个 (300多个) Excel 文件，并输出为 CSV 文件

Pandas 合并多个 (300多个) Excel 文件，并输出为 CSV 文件

程序媛三妹ya

382 0 0

Iric

|

关系型数据库数据库 PostgreSQL

导出CSV文件

导出CSV文件

Iric

421 0 0

热门文章

最新文章

Zabbix自定义KEY报错ZBX_NOTSUPPORTED: Unsupported item key.

7个聚合导航网站，资源、工具、素材应有尽有！

Ubuntu 18.04 网络配置介绍

TCP的几个状态 (SYN, FIN, ACK, PSH, RST, URG)

JS获取音频的总时长，解决Audio元素duration为NaN || Infinity 问题

ASP.NET Core 2 学习笔记（十）视图

GNU make manual 翻译( 九十八)

Undelete Plus 2.53

检测锁死进程的ID

微软开窍！Win10 Redstone再改显示缩放

开源项目：一行代码，批量 PDF 转 Word 轻松搞定！

南京大学与阿里云联合启动人工智能人才培养合作计划，已将通义灵码引入软件学院课程体系

weixin163基于微信小程序的校园二手交易平台系统设计与开发ssm(文档+源码)_kaic

weixin168“返家乡”高校暑期社会实践微信小程序设计与开发ssm(文档+源码)_kaic

鸿蒙开发难题多到崩溃？然而 10 亿终端暗藏财富密码-卓伊凡

FlashTokenizer: 基于C++的高性能分词引擎，速度可以提升8-15倍

LLM 不断提升智能下限，MCP 不断提升创意上限

阿里云可观测 2025 年 3 月产品动态

GraalVM 24 正式发布阿里巴巴贡献重要特性 —— 支持 Java Agent 插桩

PaperBench：OpenAI开源AI智能体评测基准，8316节点精准考核复现能力

相关电子书

更多

低代码开发师（初级）实战教程

冬季实战营第三期：MySQL数据库进阶实战

阿里巴巴DevOps 最佳实践手册

下一篇

阿里云oss简介和如何对接使用

你好，我是AI助理

可以解答问题、推荐解决方案等