- 增加记录:在第二的位置增加一条记录
esproc
A4:添加一条记录(“:”前表示字段值,“:”后表示字段),其中2表示第二条记录的位置
A5:计算运算时间(interval():计算时间间隔。@ms表示以毫秒为单位)
python:
import time
import pandas as pd
import datetime
import numpy as np
import random
s=time.time()
data = pd.read_csv("C:/Users/Sean/Desktop/esproc_vs_python/EMPLOYEE.txt",sep="t")
values=[100,"wang","lao","Femal","CA","1999-01-01","2009-03-04","HR",3000]
line_dic={}
for i in range(len(data.columns)):
line_dic[data.columns[i]]=values[i]
line = pd.DataFrame(line_dic,index=[1])
data = pd.concat([data.loc[:0],line,data.loc[1:]],ignore_index=True)
print(data)
e=time.time()
print(e-s)
用pd.concat([df1,df2,…,dfn))达到新增记录的目的,dataframe结构的记录是从0开始计数的,如df.loc[1:]表示切片取出第二条以后的所有记录
最后计算出运算耗时。
结果:
esproc
- 删除记录:删除第 2 条记录
A4:删除第2条记录
python:
import time
import pandas as pd
import datetime
import numpy as np
import random
s=time.time()
data = pd.read_csv("C:/Users/Sean/Desktop/esproc_vs_python/EMPLOYEE.txt",sep="t")
data = data.drop(1)
print(data)
e=time.time()
print(e-s)
利用df.drop()函数删除某条记录
结果:
esproc
3.修改记录:第 5 条记录的 NAME 改为 aaa,SALARY 改为 1000
esproc
A4:修改第5条记录中的NAME字段的值为“aaa”,修改SALARY字段的值为1000
python:
import time
import pandas as pd
import datetime
import numpy as np
import random
s=time.time()
data = pd.read_csv("C:/Users/Sean/Desktop/esproc_vs_python/EMPLOYEE.txt",sep="t")
data.loc[4,['NAME','SALARY']]=['aaa',1000]
print(data)
e=time.time()
print(e-s)
利用df.loc[]切片取出第5条记录的NAME,SALARY字段并赋值为‘aaa’和1000
结果:
esproc
4.查询行:查询第 2~10 条记录
esproc
A4:to(m,n):产生m~n的序列,我们用T表示序表,A表示序列。T(A)表示取出序列中包含值的记录,这里表示取出第2~10条记录
python:
import time
import pandas as pd
import datetime
import numpy as np
import random
s=time.time()
data = pd.read_csv("C:/Users/Sean/Desktop/esproc_vs_python/EMPLOYEE.txt",sep="t")
data = data.loc[1:9]
print(data)
e=time.time()
print(e-s)
利用df.loc[]切片取出第2~10条记录
结果:
esproc
5.增加列:增加一个字段 Fullname
esproc
A4:derive()增加字段,这里表示用原来的NAME和SURNAME连接生成Fullname字段。
python:
import time
import pandas as pd
import datetime
import numpy as np
import random
s=time.time()
data = pd.read_csv("C:/Users/Sean/Desktop/esproc_vs_python/EMPLOYEE.txt",sep="t")
data['Fullname'] = data['NAME']+data['SURNAME']
print(data)
e=time.time()
print(e-s)
取出NAME和SURNAME合并成Fullname
结果:
esproc
6.筛选字段:筛选出字段 NAME,SURNAME,STATE,GENDER
esproc
A4:T.new()生成新的序表。这里表示生成包含A3序表中NAME,SURNAME,STATE,GENDER这几个字段的新序表。
python:
import time
import pandas as pd
import datetime
import numpy as np
import random
s=time.time()
data = pd.read_csv("C:/Users/Sean/Desktop/esproc_vs_python/EMPLOYEE.txt",sep="t")
data = data[['NAME','SURNAME','STATE','GENDER']]
print(data)
e=time.time()
print(e-s)
取出NAME,SURNAME,STATE,GENDER这几个字段复制给新的dataframe。
结果:
esproc
7.修改字段名:修改 EID 为 ID
esproc
A4:rename()修改字段名。这里表示将EID修改为ID
python:
import time
import pandas as pd
import datetime
import numpy as np
import random
s=time.time()
data = pd.read_csv("C:/Users/Sean/Desktop/esproc_vs_python/EMPLOYEE.txt",sep="t")
data.rename(columns={'EID':'ID'},inplace=True)
print(data)
e=time.time()
print(e-s)
利用df.rename()函数修改字段名,将EID修改为ID。参数inplace控制是否修改原来的dataframe结构。
结果:
esproc
小结:我们通过对记录和字段的增、删、改、查这些基本的运算,用esproc和python按照相同的思路,对相同的数据进行同样的处理,在描述效率方面,两者相差并不大,都很方便而且容易上手。