PYTHON代码:根据FileRecord和MAP的关系,拼接IBM V7000 精简卷碎片

简介:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
'''
术语规范:
简述:BS指256M,bs指256K
 
BS:指大小,256M
bs:指大小,256K
SecsPerBS:每BS扇区数
SecsPerbs:每bs扇区数
 
FRid:文件记录号
FRDs:文件记录在整个LUN上应该的物理扇区号
FRDBS:文件记录在整个LUN上应该的BS号
FRDbs:文件记录在整个LUN上应该的bs号
FRDbsiBS:文件记录所在的bs,在所在BS中的序号
FRDSibs:文件记录所在的扇区,在所在的bs中的序号
 
SMDid:位图所在的磁盘号
SMBS:位图所在的磁盘的BS号
SMbs:位图所在的磁盘的bs号
SMDs:位图的起始扇区号
 
SDid:源数据所在的磁盘号
SDBS:源数据所在的BS号
SDbs:源数据所在的bs号
SDs:源数据所在的扇区号
SDSibs:源数据所在的扇区,在所在的bs中的序号
SDbsiBS:源数据所在的bs,在所在的BS中的序号
 
Mbsi8GM:数据所在bs条目,在8G位图中的序号
MbsiBS:数据所在的bs条目,在当前BS位图中的序号
MBSi8GM:数据所在的BS条目,在8G位图中的序号
'''
import  sys
import  os
import  struct
import  sqlite3
import  time
 
BS  =  256  *  1024  *  1024
bs  =  256  *  1024
SecsPerBS  =  BS  / /  512
SecsPerbs  =  bs  / /  512
bs_tnum  =  128  *  1024  *  1024
 
 
def  trans(FRid, MFT_Slice_List):
     mft_no_clus  =  FRid  / /  8
     mft_no_sec  =  (FRid  %  8 *  2
 
     for  in  MFT_Slice_List:
         if  i[ 0 +  i[ 2 ] > mft_no_clus:
             if  i[ 0 ] > mft_no_clus:
                 continue
 
             FRDs  =  (mft_no_clus  -  i[ 0 +  i[ 1 ])  *  16  +  mft_no_sec
             break
 
     FRDs  + =  262208   # DBR pos
     return  FRDs
 
 
def  find_FRid_SDbs(FRid):
     mftlist  =  []
     FRDS  =  trans(FRid, MFT_Slice_List)
 
     # cu_mft 是 allv2.db 的cursor
 
     cu_mft.execute(r "select * from mft_info  WHERE FRID = %d"  %  FRid)
     rows  =  cu_mft.fetchall()
     # SDid, SDS, FRid 是 row[0], row[1], row[2]
     new  =  0
     for  row  in  rows:
         if  row[ 1 %  512  = =  FRDS  %  512 :       # 扇区号一致
             new  + =  1
             SDid  =  row[ 0 ]
             SDS  =  row[ 1 ]
             mftlist.append([FRid, FRDS, SDid, SDS])
 
     if  new ! =  1 :     # 所选记录不唯一, 返回空的 mftlist
         print ( "FR(%d), result not found or not only, new = %d, FRDS = %d"  %  (FRid, new, FRDS))
         # os.system("pause")
         # pass
         return
 
     return  mftlist
 
 
def  find_bs_SMBS(FRDs, SDid, SDs):
 
     SMDBS_list  =  []      # 位图列表
     FRbs  =  (FRDs  / /  512 )
 
     SDBS  =  SDs  / /  SecsPerBS
     SDbsiBS  =  (SDs  %  SecsPerBS)  / /  SecsPerbs
     print ( "FRDs,SDid,SDs is:" ,FRDs,SDid,SDs)
     print ( "SDbsiBS is %d" % SDbsiBS)
     # cu_m 是 map_v2.db 的 cursor
     cu_m.execute(r "select * from map_info where v_num =  %d"  %  (FRbs  *  512  +  1 ))   # +1: 是因为v7000 MAP最低位为1,可能表示类型
     rows  =  cu_m.fetchall()
     print ( "rows: " , rows)
     os.system( "pause" )
 
     =  0
     # EM_SMDid, EM_SMBS, EM_Mbsi8GM, EM_FRDS_add_1 = range(4)
     for  row  in  rows:
 
         Mbsi8GM  =  row[ 2 ]      # 数据所在bs条目,在8G位图中的序号
         FRDbsiBS  =  (FRDs  %  SecsPerBS)  / /  SecsPerbs
         MbsiBS  =  (Mbsi8GM  +  2 %  1024    # 数据所在的bs条目,在当前BS位图中的序号
         MBSi8GM  =  (Mbsi8GM  +  2 / /  1024   # 数据所在的BS条目,在8G位图中的序号
         print ( "MBSi8GM,SDbsiBS,MbsiBS is" , MBSi8GM, SDbsiBS, MbsiBS)
         os.system( "pause" )
         if  MBSi8GM  = =  0 :
             if  SDbsiBS  = =  MbsiBS:
                 + =  1
                 SMDid  =  row[ 0 ]   # 位图所在的磁盘号
                 SMBS  =  row[ 1 ]   # 位图所在的磁盘的BS号
                 SMDBS_list.append([SMDid, SMBS,  0 , SMDid, SMBS])
         else :
             if  SDbsiBS  = =  MbsiBS:
                 + =  1
                 SMDid  =  row[ 0 ]   # 位图所在的磁盘号
                 SMBS  =  row[ 1 ]   # 位图所在的磁盘的BS号
                 SMDBS_list.append([SMDid, SMBS, MBSi8GM, SDid, SDBS])
                 SMDBS_list.append([SMDid, SMBS,  0 , SMDid, SMBS])
 
     if  = =  0 :
         print ( "FRDs:%d result not found!"  %  FRDs)
         # os.system("pause")
         # pass
         print ( "line 131 ,x == 0" )
         return
     os.system( "pause" )
     print (SMDBS_list)
     return  SMDBS_list
 
#tmp1 writefile to disk
writedisk  =  False
if  writedisk:
     fd  =  open ( "\\\\.\\physicaldrive3" , 'rb+' )
def  update_1Gmap(bsMapList, map1g_list):
 
     SMDid, SMBS, MBSi8GM, SDid, SDBS  =  bsMapList
     SMDs  =  SMBS  *  SecsPerBS  +  1024
     SDbs  =  SDBS  *  1024
 
     smFile  =  sDisk[SMDid][ 1 ]   # 位图所在磁盘
     sdFile  =  sDisk[SDid][ 1 ]   # 数据所在磁盘
 
     # 到指定位图位置,读取 bs = 256K 字节
     smFile.seek(SMDs  *  512 )
     mData  =  smFile.read(bs)
 
     if  MBSi8GM  = =  0 :   # 8GB 的第一个256K
         mapitem  =  struct.unpack_from( "1022Q" , mData,  0 )
         start_sec  =  1024
     elif  MBSi8GM <  32 :
         # print("MBSi8gm IS",MBSi8GM)
         mapitem  =  struct.unpack_from( "1024Q" , mData, MBSi8GM  *  8192  -  16 )   # 1024 * 8 代表一个256M
         start_sec  =  0
     else :
         return
     =  0
     keyMap  =  SMDid  *  1000000  +  SMBS  *  100  +  MBSi8GM
     cu.execute(r "INSERT or ignore into MAP values(%d, %d, %d, %d, %d, %d)"  %  (keyMap, SMDid, SMBS, MBSi8GM, SDid, SDBS))
     cx.commit()
     # print(keyMap, SMDid, SMBS, MBSi8GM, SDid, SDBS)
     # os.system("pause")
 
     for  ii  in  mapitem:
         if  ii  = =  3 :   # 跳过位图为3的
             + =  1
             continue
 
         FRDbs  =  (ii  -  1 / /  512
 
         if  FRDbs > bs_tnum:
             + =  1
             print ( "FRDBS is too large, FRDbs: %d"  %  FRDbs)
 
         else :
             value1  =  (SDbs  +  t)  *  SecsPerbs   +  start_sec  # value指应该的bs的扇区位置
             value  =  value1  +  (SDid <<  48 )
 
             # valueT = 0
 
             if  map1g_list[FRDbs] ! =  0  and  map1g_list[FRDbs] ! =  value:
                 print ( "FRDBS is error, FRDbs: %d,\tmap1g_list[FRDbs]:%08X\tvalue:%08X"  %  (FRDbs, map1g_list[FRDbs], value))
                 os.system( "pause" )
                 # pass
             else :
                 map1g_list[FRDbs]  =  value
                 #tmp1 write file
                 if  writedisk:
                     fd.seek(FRDbs  *  512 )
                     sDisk[SDid][ 1 ].seek(value  *  512 )
                     tmpdata  =  sDisk[SDid][ 1 ].read(bs)
                     fd.write()
                 #tmp write file end
                 # SMDid, SMBS, MBSi8GM, SDid, SDBS
             + =  1
 
sDisk  =  []
sDisk.append("")
sDisk.append("")
sDisk.append("")
sDisk.append("")
sDisk.append([ "h:\mdisk4.img" 0 ])
sDisk.append([ "g:\mdisk5.img" 0 ])
sDisk.append([ "i:\mdisk6.img" 0 ])
sDisk.append([ "d:\mdisk7.img" 0 ])
sDisk.append([ "e:\mdisk8.img" 0 ])
sDisk.append([ "f:\mdisk9.img" 0 ])
 
for  disk  in  sDisk[ 4 : 10 ]:
     disk[ 1 =  open (disk[ 0 ],  'rb' )
 
cx_mft  =  sqlite3.connect( "f:\zy\\new_mft\\allv2.db" )
cu_mft  =  cx_mft.cursor()
cx_m  =  sqlite3.connect( "F:\\zy\\map\\map_v2.db" )
cu_m  =  cx_m.cursor()
cx  =  sqlite3.connect( "f:\\zy\\map\\256M_to_disk_map.db" )
cu  =  cx.cursor()
 
cu.execute( """create table if not exists MAP(
         mapKey INT PRIMARY KEY NOT NULL,
         SMDid int,
         SMDBS int,
         Mbsi8GM int,
         SDid int,
         SDDBS int
         );
""" )
# 打开1GMAP文件,读入LIST
MAP_file  =  "F:\\zy\\map\\1gmap_1.img"
f_map1g  =  open (MAP_file,  'rb+' )
dmap  =  f_map1g.read()
map1g_list  =  list (struct.unpack( '%dQ'  %  bs_tnum, dmap))
 
# 前两个256M块
# cu.execute(r"INSERT or ignore into MAP values(%d, %d, %d, %d, %d, %d)" % (40080010, 4, 800, 10, 6, 814))
# cu.execute(r"INSERT or ignore into MAP values(%d, %d, %d, %d, %d, %d)" % (40080000, 4, 800, 0, 4, 800))
tlst  =  [[ 4 800 10 6 814 ], [ 4 800 0 4 800 ]]
update_1Gmap(tlst[ 0 ], map1g_list)
update_1Gmap(tlst[ 1 ], map1g_list)
 
# 解析mft_list 文件
=  open ( "mft_list.txt" 'r' )      # 位置在哪??
=  f.readlines()
MFT_Slice_List  =  []
for  in  d:
     =  i.split()
     # t[0] 是 VCN 号, t[1] 是 LCN 号, t[2] 是 连续簇数
     MFT_Slice_List.append([ int (t[ 0 ]),  int (t[ 1 ]),  int (t[ 2 ])])
 
 
# MFT的编号;在LUN中应该的扇区位置;现在所在的磁盘号;现在所在磁盘的扇区位置
# EL_FRid, EL_FRDS, EL_SDid, EL_SDS = range(4)
 
for  in  MFT_Slice_List[ 2 :]:
     print ( "start: " , i)
     tt  =  0       # 用于累计KB数, 1 KB是一个FR
     curFRID  =  i[ 0 *  8
     curFRID  =  1988304  # test1
     slice0p  =  trans(curFRID, MFT_Slice_List)   # 要处理的第一个bs片断的起始扇区号
 
     slice0s  =  512  -  slice0p  %  512   # 第一个片断的扇区数
     slice0FRnum  =  slice0s  / /  2
     sliceEnd_s  =  (i[ 2 *  16  +  slice0p)  %  512    # 最后一个片断的扇区数
     middle_bs  =  (i[ 2 *  16  -  slice0s  -  sliceEnd_s)  / /  512   # 中间有多少个bs片断
 
     for  ii  in  range (middle_bs  +  2 ):
         if  ii  = =  0 :   # 第一个片断
             =  slice0p
             start_fr  =  curFRID
             fr_num  =  slice0FRnum
         elif  ii  = =  middle_bs  +  1 :   # 最后一个片断
             =  ii  *  512  -  512  +  (slice0p  +  slice0s)
             start_fr  =  curFRID  +  slice0FRnum  +  ii  *  256
             fr_num  =  sliceEnd_s  / /  2
         else :
             =  ii  *  512  -  512  +  (slice0p  +  slice0s)
             start_fr  =  curFRID  +  slice0FRnum  +  ii  *  256
             fr_num  =  256
 
         FRDbs  =  / /  512
         if  map1g_list[FRDbs] ! =  0 :
             continue
 
         isfoundmap  =  False
         for  FRid1  in  range (start_fr, start_fr  +  fr_num  +  1 ):
             mftlist  =  find_FRid_SDbs(FRid1)   # 在这个函数中,又求了一次 FRDS, ??
             if  mftlist  is  None :
                 continue
             else :
                 SMDBS_list  =  find_bs_SMBS(mftlist[ 0 ][ 1 ], mftlist[ 0 ][ 2 ], mftlist[ 0 ][ 3 ])
                 # print("SMDBS_list: ", SMDBS_list)
                 # SMDBS_list 可能完成多个匹配
                 if  SMDBS_list  is  None :
                     break
                 else :
                     isfoundmap  =  True
                 for  lst  in  SMDBS_list:
                     # print("********************")
                     #SMDBS_list = find_bs_SMBS(lst[1], lst[2], lst[3])  # SMDBS_list 可能完成多个匹配
                     print ( "lins 293 " ,lst)
                     update_1Gmap(lst, map1g_list)
             if  isfoundmap:
                 break ;
             print ( "line296" )
             os.system( "pause" )
         print ( "line 298" )
         os.system( "pause" )
 
 
print ( "end:" , time.strftime( '%Y-%m-%d %H:%M:%S' , time.localtime(time.time())))
 
dmap  =  struct.pack( "%dQ"  %  bs_tnum,  * map1g_list)
 
# 更新map文件
f_map1g.seek( 0 )
f_map1g.write(dmap)
f_map1g.close()
 
# cu.execute(r"INSERT or ignore into MAP values(%d, %d, %d, %d, %d, %d)" % (40080010, 4, 800, 10, 6, 814))
 
# 第一个256M块
# cu.execute(r"INSERT or ignore into MAP values(%d, %d, %d, %d, %d, %d)" % (40080000, 4, 800, 0, 4, 800))
# cx.commit()
 
# BS_ID含义如下:ABBBBBCC,A表示磁盘ID,BBBBB表示本片断位图在磁盘位置(256M块编号),CC表示本次处理的256M块的编号(0-31)
# MAP_POS表示:256M的位置,一般位图仍要向后偏移1024个扇区
# BS_ID_indisk表示8G内的256M序号
# SOURCE_POS表示源磁盘的256M的位置




本文转自 张宇 51CTO博客,原文链接:http://blog.51cto.com/zhangyu/1955849,如需转载请自行联系原作者
目录
相关文章
|
1天前
|
设计模式 缓存 监控
Python中的装饰器:代码的魔法增强剂
在Python编程中,装饰器是一种强大而灵活的工具,它允许程序员在不修改函数或方法源代码的情况下增加额外的功能。本文将探讨装饰器的定义、工作原理以及如何通过自定义和标准库中的装饰器来优化代码结构和提高开发效率。通过实例演示,我们将深入了解装饰器的应用,包括日志记录、性能测量、事务处理等常见场景。此外,我们还将讨论装饰器的高级用法,如带参数的装饰器和类装饰器,为读者提供全面的装饰器使用指南。
|
1天前
|
存储 算法 搜索推荐
Python高手必备!揭秘图(Graph)的N种风骚表示法,让你的代码瞬间高大上
在Python中,图作为重要的数据结构,广泛应用于社交网络分析、路径查找等领域。本文介绍四种图的表示方法:邻接矩阵、邻接表、边列表和邻接集。每种方法都有其特点和适用场景,掌握它们能提升代码效率和可读性,让你在项目中脱颖而出。
13 5
|
1天前
|
数据库 Python
异步编程不再难!Python asyncio库实战,让你的代码流畅如丝!
在编程中,随着应用复杂度的提升,对并发和异步处理的需求日益增长。Python的asyncio库通过async和await关键字,简化了异步编程,使其变得流畅高效。本文将通过实战示例,介绍异步编程的基本概念、如何使用asyncio编写异步代码以及处理多个异步任务的方法,帮助你掌握异步编程技巧,提高代码性能。
11 4
|
3天前
|
缓存 开发者 Python
探索Python中的装饰器:简化和增强你的代码
【10月更文挑战第32天】 在编程的世界中,简洁和效率是永恒的追求。Python提供了一种强大工具——装饰器,它允许我们以声明式的方式修改函数的行为。本文将深入探讨装饰器的概念、用法及其在实际应用中的优势。通过实际代码示例,我们不仅理解装饰器的工作方式,还能学会如何自定义装饰器来满足特定需求。无论你是初学者还是有经验的开发者,这篇文章都将为你揭示装饰器的神秘面纱,并展示如何利用它们简化和增强你的代码库。
|
1天前
|
API 数据处理 Python
探秘Python并发新世界:asyncio库,让你的代码并发更优雅!
在Python编程中,随着网络应用和数据处理需求的增长,并发编程变得愈发重要。asyncio库作为Python 3.4及以上版本的标准库,以其简洁的API和强大的异步编程能力,成为提升性能和优化资源利用的关键工具。本文介绍了asyncio的基本概念、异步函数的定义与使用、并发控制和资源管理等核心功能,通过具体示例展示了如何高效地编写并发代码。
10 2
|
3天前
|
机器学习/深度学习 自然语言处理 API
如何使用阿里云的语音合成服务(TTS)将文本转换为语音?本文详细介绍了从注册账号、获取密钥到编写Python代码调用TTS服务的全过程
如何使用阿里云的语音合成服务(TTS)将文本转换为语音?本文详细介绍了从注册账号、获取密钥到编写Python代码调用TTS服务的全过程。通过简单的代码示例,展示如何将文本转换为自然流畅的语音,适用于有声阅读、智能客服等场景。
20 3
|
5天前
|
设计模式 缓存 测试技术
Python中的装饰器:功能增强与代码复用的艺术####
本文将深入探讨Python中装饰器的概念、用途及实现方式,通过实例演示其如何为函数或方法添加新功能而不影响原有代码结构,从而提升代码的可读性和可维护性。我们将从基础定义出发,逐步深入到高级应用,揭示装饰器在提高代码复用性方面的强大能力。 ####
|
3天前
|
算法 IDE API
Python编码规范与代码可读性提升策略####
本文探讨了Python编码规范的重要性,并深入分析了如何通过遵循PEP 8等标准来提高代码的可读性和可维护性。文章首先概述了Python编码规范的基本要求,包括命名约定、缩进风格、注释使用等,接着详细阐述了这些规范如何影响代码的理解和维护。此外,文章还提供了一些实用的技巧和建议,帮助开发者在日常开发中更好地应用这些规范,从而编写出更加清晰、简洁且易于理解的Python代码。 ####
|
6天前
|
缓存 测试技术 数据安全/隐私保护
探索Python中的装饰器:简化代码,增强功能
【10月更文挑战第29天】本文通过深入浅出的方式,探讨了Python装饰器的概念、使用场景和实现方法。文章不仅介绍了装饰器的基本知识,还通过实例展示了如何利用装饰器优化代码结构,提高代码的可读性和重用性。适合初学者和有一定经验的开发者阅读,旨在帮助读者更好地理解和应用装饰器,提升编程效率。
|
10天前
|
算法 测试技术 开发者
在Python开发中,性能优化和代码审查至关重要。性能优化通过改进代码结构和算法提高程序运行速度,减少资源消耗
在Python开发中,性能优化和代码审查至关重要。性能优化通过改进代码结构和算法提高程序运行速度,减少资源消耗;代码审查通过检查源代码发现潜在问题,提高代码质量和团队协作效率。本文介绍了一些实用的技巧和工具,帮助开发者提升开发效率。
14 3