PYTHON代码:根据FileRecord和MAP的关系,拼接IBM V7000 精简卷碎片

简介:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
'''
术语规范:
简述:BS指256M,bs指256K
 
BS:指大小,256M
bs:指大小,256K
SecsPerBS:每BS扇区数
SecsPerbs:每bs扇区数
 
FRid:文件记录号
FRDs:文件记录在整个LUN上应该的物理扇区号
FRDBS:文件记录在整个LUN上应该的BS号
FRDbs:文件记录在整个LUN上应该的bs号
FRDbsiBS:文件记录所在的bs,在所在BS中的序号
FRDSibs:文件记录所在的扇区,在所在的bs中的序号
 
SMDid:位图所在的磁盘号
SMBS:位图所在的磁盘的BS号
SMbs:位图所在的磁盘的bs号
SMDs:位图的起始扇区号
 
SDid:源数据所在的磁盘号
SDBS:源数据所在的BS号
SDbs:源数据所在的bs号
SDs:源数据所在的扇区号
SDSibs:源数据所在的扇区,在所在的bs中的序号
SDbsiBS:源数据所在的bs,在所在的BS中的序号
 
Mbsi8GM:数据所在bs条目,在8G位图中的序号
MbsiBS:数据所在的bs条目,在当前BS位图中的序号
MBSi8GM:数据所在的BS条目,在8G位图中的序号
'''
import  sys
import  os
import  struct
import  sqlite3
import  time
 
BS  =  256  *  1024  *  1024
bs  =  256  *  1024
SecsPerBS  =  BS  / /  512
SecsPerbs  =  bs  / /  512
bs_tnum  =  128  *  1024  *  1024
 
 
def  trans(FRid, MFT_Slice_List):
     mft_no_clus  =  FRid  / /  8
     mft_no_sec  =  (FRid  %  8 *  2
 
     for  in  MFT_Slice_List:
         if  i[ 0 +  i[ 2 ] > mft_no_clus:
             if  i[ 0 ] > mft_no_clus:
                 continue
 
             FRDs  =  (mft_no_clus  -  i[ 0 +  i[ 1 ])  *  16  +  mft_no_sec
             break
 
     FRDs  + =  262208   # DBR pos
     return  FRDs
 
 
def  find_FRid_SDbs(FRid):
     mftlist  =  []
     FRDS  =  trans(FRid, MFT_Slice_List)
 
     # cu_mft 是 allv2.db 的cursor
 
     cu_mft.execute(r "select * from mft_info  WHERE FRID = %d"  %  FRid)
     rows  =  cu_mft.fetchall()
     # SDid, SDS, FRid 是 row[0], row[1], row[2]
     new  =  0
     for  row  in  rows:
         if  row[ 1 %  512  = =  FRDS  %  512 :       # 扇区号一致
             new  + =  1
             SDid  =  row[ 0 ]
             SDS  =  row[ 1 ]
             mftlist.append([FRid, FRDS, SDid, SDS])
 
     if  new ! =  1 :     # 所选记录不唯一, 返回空的 mftlist
         print ( "FR(%d), result not found or not only, new = %d, FRDS = %d"  %  (FRid, new, FRDS))
         # os.system("pause")
         # pass
         return
 
     return  mftlist
 
 
def  find_bs_SMBS(FRDs, SDid, SDs):
 
     SMDBS_list  =  []      # 位图列表
     FRbs  =  (FRDs  / /  512 )
 
     SDBS  =  SDs  / /  SecsPerBS
     SDbsiBS  =  (SDs  %  SecsPerBS)  / /  SecsPerbs
     print ( "FRDs,SDid,SDs is:" ,FRDs,SDid,SDs)
     print ( "SDbsiBS is %d" % SDbsiBS)
     # cu_m 是 map_v2.db 的 cursor
     cu_m.execute(r "select * from map_info where v_num =  %d"  %  (FRbs  *  512  +  1 ))   # +1: 是因为v7000 MAP最低位为1,可能表示类型
     rows  =  cu_m.fetchall()
     print ( "rows: " , rows)
     os.system( "pause" )
 
     =  0
     # EM_SMDid, EM_SMBS, EM_Mbsi8GM, EM_FRDS_add_1 = range(4)
     for  row  in  rows:
 
         Mbsi8GM  =  row[ 2 ]      # 数据所在bs条目,在8G位图中的序号
         FRDbsiBS  =  (FRDs  %  SecsPerBS)  / /  SecsPerbs
         MbsiBS  =  (Mbsi8GM  +  2 %  1024    # 数据所在的bs条目,在当前BS位图中的序号
         MBSi8GM  =  (Mbsi8GM  +  2 / /  1024   # 数据所在的BS条目,在8G位图中的序号
         print ( "MBSi8GM,SDbsiBS,MbsiBS is" , MBSi8GM, SDbsiBS, MbsiBS)
         os.system( "pause" )
         if  MBSi8GM  = =  0 :
             if  SDbsiBS  = =  MbsiBS:
                 + =  1
                 SMDid  =  row[ 0 ]   # 位图所在的磁盘号
                 SMBS  =  row[ 1 ]   # 位图所在的磁盘的BS号
                 SMDBS_list.append([SMDid, SMBS,  0 , SMDid, SMBS])
         else :
             if  SDbsiBS  = =  MbsiBS:
                 + =  1
                 SMDid  =  row[ 0 ]   # 位图所在的磁盘号
                 SMBS  =  row[ 1 ]   # 位图所在的磁盘的BS号
                 SMDBS_list.append([SMDid, SMBS, MBSi8GM, SDid, SDBS])
                 SMDBS_list.append([SMDid, SMBS,  0 , SMDid, SMBS])
 
     if  = =  0 :
         print ( "FRDs:%d result not found!"  %  FRDs)
         # os.system("pause")
         # pass
         print ( "line 131 ,x == 0" )
         return
     os.system( "pause" )
     print (SMDBS_list)
     return  SMDBS_list
 
#tmp1 writefile to disk
writedisk  =  False
if  writedisk:
     fd  =  open ( "\\\\.\\physicaldrive3" , 'rb+' )
def  update_1Gmap(bsMapList, map1g_list):
 
     SMDid, SMBS, MBSi8GM, SDid, SDBS  =  bsMapList
     SMDs  =  SMBS  *  SecsPerBS  +  1024
     SDbs  =  SDBS  *  1024
 
     smFile  =  sDisk[SMDid][ 1 ]   # 位图所在磁盘
     sdFile  =  sDisk[SDid][ 1 ]   # 数据所在磁盘
 
     # 到指定位图位置,读取 bs = 256K 字节
     smFile.seek(SMDs  *  512 )
     mData  =  smFile.read(bs)
 
     if  MBSi8GM  = =  0 :   # 8GB 的第一个256K
         mapitem  =  struct.unpack_from( "1022Q" , mData,  0 )
         start_sec  =  1024
     elif  MBSi8GM <  32 :
         # print("MBSi8gm IS",MBSi8GM)
         mapitem  =  struct.unpack_from( "1024Q" , mData, MBSi8GM  *  8192  -  16 )   # 1024 * 8 代表一个256M
         start_sec  =  0
     else :
         return
     =  0
     keyMap  =  SMDid  *  1000000  +  SMBS  *  100  +  MBSi8GM
     cu.execute(r "INSERT or ignore into MAP values(%d, %d, %d, %d, %d, %d)"  %  (keyMap, SMDid, SMBS, MBSi8GM, SDid, SDBS))
     cx.commit()
     # print(keyMap, SMDid, SMBS, MBSi8GM, SDid, SDBS)
     # os.system("pause")
 
     for  ii  in  mapitem:
         if  ii  = =  3 :   # 跳过位图为3的
             + =  1
             continue
 
         FRDbs  =  (ii  -  1 / /  512
 
         if  FRDbs > bs_tnum:
             + =  1
             print ( "FRDBS is too large, FRDbs: %d"  %  FRDbs)
 
         else :
             value1  =  (SDbs  +  t)  *  SecsPerbs   +  start_sec  # value指应该的bs的扇区位置
             value  =  value1  +  (SDid <<  48 )
 
             # valueT = 0
 
             if  map1g_list[FRDbs] ! =  0  and  map1g_list[FRDbs] ! =  value:
                 print ( "FRDBS is error, FRDbs: %d,\tmap1g_list[FRDbs]:%08X\tvalue:%08X"  %  (FRDbs, map1g_list[FRDbs], value))
                 os.system( "pause" )
                 # pass
             else :
                 map1g_list[FRDbs]  =  value
                 #tmp1 write file
                 if  writedisk:
                     fd.seek(FRDbs  *  512 )
                     sDisk[SDid][ 1 ].seek(value  *  512 )
                     tmpdata  =  sDisk[SDid][ 1 ].read(bs)
                     fd.write()
                 #tmp write file end
                 # SMDid, SMBS, MBSi8GM, SDid, SDBS
             + =  1
 
sDisk  =  []
sDisk.append("")
sDisk.append("")
sDisk.append("")
sDisk.append("")
sDisk.append([ "h:\mdisk4.img" 0 ])
sDisk.append([ "g:\mdisk5.img" 0 ])
sDisk.append([ "i:\mdisk6.img" 0 ])
sDisk.append([ "d:\mdisk7.img" 0 ])
sDisk.append([ "e:\mdisk8.img" 0 ])
sDisk.append([ "f:\mdisk9.img" 0 ])
 
for  disk  in  sDisk[ 4 : 10 ]:
     disk[ 1 =  open (disk[ 0 ],  'rb' )
 
cx_mft  =  sqlite3.connect( "f:\zy\\new_mft\\allv2.db" )
cu_mft  =  cx_mft.cursor()
cx_m  =  sqlite3.connect( "F:\\zy\\map\\map_v2.db" )
cu_m  =  cx_m.cursor()
cx  =  sqlite3.connect( "f:\\zy\\map\\256M_to_disk_map.db" )
cu  =  cx.cursor()
 
cu.execute( """create table if not exists MAP(
         mapKey INT PRIMARY KEY NOT NULL,
         SMDid int,
         SMDBS int,
         Mbsi8GM int,
         SDid int,
         SDDBS int
         );
""" )
# 打开1GMAP文件,读入LIST
MAP_file  =  "F:\\zy\\map\\1gmap_1.img"
f_map1g  =  open (MAP_file,  'rb+' )
dmap  =  f_map1g.read()
map1g_list  =  list (struct.unpack( '%dQ'  %  bs_tnum, dmap))
 
# 前两个256M块
# cu.execute(r"INSERT or ignore into MAP values(%d, %d, %d, %d, %d, %d)" % (40080010, 4, 800, 10, 6, 814))
# cu.execute(r"INSERT or ignore into MAP values(%d, %d, %d, %d, %d, %d)" % (40080000, 4, 800, 0, 4, 800))
tlst  =  [[ 4 800 10 6 814 ], [ 4 800 0 4 800 ]]
update_1Gmap(tlst[ 0 ], map1g_list)
update_1Gmap(tlst[ 1 ], map1g_list)
 
# 解析mft_list 文件
=  open ( "mft_list.txt" 'r' )      # 位置在哪??
=  f.readlines()
MFT_Slice_List  =  []
for  in  d:
     =  i.split()
     # t[0] 是 VCN 号, t[1] 是 LCN 号, t[2] 是 连续簇数
     MFT_Slice_List.append([ int (t[ 0 ]),  int (t[ 1 ]),  int (t[ 2 ])])
 
 
# MFT的编号;在LUN中应该的扇区位置;现在所在的磁盘号;现在所在磁盘的扇区位置
# EL_FRid, EL_FRDS, EL_SDid, EL_SDS = range(4)
 
for  in  MFT_Slice_List[ 2 :]:
     print ( "start: " , i)
     tt  =  0       # 用于累计KB数, 1 KB是一个FR
     curFRID  =  i[ 0 *  8
     curFRID  =  1988304  # test1
     slice0p  =  trans(curFRID, MFT_Slice_List)   # 要处理的第一个bs片断的起始扇区号
 
     slice0s  =  512  -  slice0p  %  512   # 第一个片断的扇区数
     slice0FRnum  =  slice0s  / /  2
     sliceEnd_s  =  (i[ 2 *  16  +  slice0p)  %  512    # 最后一个片断的扇区数
     middle_bs  =  (i[ 2 *  16  -  slice0s  -  sliceEnd_s)  / /  512   # 中间有多少个bs片断
 
     for  ii  in  range (middle_bs  +  2 ):
         if  ii  = =  0 :   # 第一个片断
             =  slice0p
             start_fr  =  curFRID
             fr_num  =  slice0FRnum
         elif  ii  = =  middle_bs  +  1 :   # 最后一个片断
             =  ii  *  512  -  512  +  (slice0p  +  slice0s)
             start_fr  =  curFRID  +  slice0FRnum  +  ii  *  256
             fr_num  =  sliceEnd_s  / /  2
         else :
             =  ii  *  512  -  512  +  (slice0p  +  slice0s)
             start_fr  =  curFRID  +  slice0FRnum  +  ii  *  256
             fr_num  =  256
 
         FRDbs  =  / /  512
         if  map1g_list[FRDbs] ! =  0 :
             continue
 
         isfoundmap  =  False
         for  FRid1  in  range (start_fr, start_fr  +  fr_num  +  1 ):
             mftlist  =  find_FRid_SDbs(FRid1)   # 在这个函数中,又求了一次 FRDS, ??
             if  mftlist  is  None :
                 continue
             else :
                 SMDBS_list  =  find_bs_SMBS(mftlist[ 0 ][ 1 ], mftlist[ 0 ][ 2 ], mftlist[ 0 ][ 3 ])
                 # print("SMDBS_list: ", SMDBS_list)
                 # SMDBS_list 可能完成多个匹配
                 if  SMDBS_list  is  None :
                     break
                 else :
                     isfoundmap  =  True
                 for  lst  in  SMDBS_list:
                     # print("********************")
                     #SMDBS_list = find_bs_SMBS(lst[1], lst[2], lst[3])  # SMDBS_list 可能完成多个匹配
                     print ( "lins 293 " ,lst)
                     update_1Gmap(lst, map1g_list)
             if  isfoundmap:
                 break ;
             print ( "line296" )
             os.system( "pause" )
         print ( "line 298" )
         os.system( "pause" )
 
 
print ( "end:" , time.strftime( '%Y-%m-%d %H:%M:%S' , time.localtime(time.time())))
 
dmap  =  struct.pack( "%dQ"  %  bs_tnum,  * map1g_list)
 
# 更新map文件
f_map1g.seek( 0 )
f_map1g.write(dmap)
f_map1g.close()
 
# cu.execute(r"INSERT or ignore into MAP values(%d, %d, %d, %d, %d, %d)" % (40080010, 4, 800, 10, 6, 814))
 
# 第一个256M块
# cu.execute(r"INSERT or ignore into MAP values(%d, %d, %d, %d, %d, %d)" % (40080000, 4, 800, 0, 4, 800))
# cx.commit()
 
# BS_ID含义如下:ABBBBBCC,A表示磁盘ID,BBBBB表示本片断位图在磁盘位置(256M块编号),CC表示本次处理的256M块的编号(0-31)
# MAP_POS表示:256M的位置,一般位图仍要向后偏移1024个扇区
# BS_ID_indisk表示8G内的256M序号
# SOURCE_POS表示源磁盘的256M的位置









本文转自 张宇 51CTO博客,原文链接:http://blog.51cto.com/zhangyu/1955849,如需转载请自行联系原作者
目录
相关文章
|
9月前
|
存储 数据挖掘
服务器数据恢复-IBM Storwize V7000存储数据恢复案例
服务器数据恢复环境: P740+AIX+Sybase+V7000存储,存储阵列柜上共12块SAS机械硬盘(其中一块为热备盘)。 服务器故障: 存储阵列柜中有磁盘出现故障,工作人员发现后更换磁盘,新更换的磁盘数据同步到40%左右时,阵列柜中的另一块磁盘也出现问题,数据同步中断,逻辑盘无法挂接到小型机上,业务中断。存储的管理界面显示2块硬盘故障脱机。 阵列柜中的磁盘共组建了2组Mdisk,加到一个pool中。现在主要数据pool无法加载,有3个通用卷无法挂载。
|
存储 虚拟化 前端开发
|
12天前
|
安全 Python
告别低效编程!Python线程与进程并发技术详解,让你的代码飞起来!
【7月更文挑战第9天】Python并发编程提升效率:**理解并发与并行,线程借助`threading`模块处理IO密集型任务,受限于GIL;进程用`multiprocessing`实现并行,绕过GIL限制。示例展示线程和进程创建及同步。选择合适模型,注意线程安全,利用多核,优化性能,实现高效并发编程。
26 3
|
14天前
|
开发者 Python
Python元类实战:打造你的专属编程魔法,让代码随心所欲变化
【7月更文挑战第7天】Python的元类是编程的变形师,用于创建类的“类”,赋予代码在构建时的变形能力。
34 1
|
12天前
|
数据采集 大数据 数据安全/隐私保护
Python编程:如何有效等待套接字的读取与关闭
Python网络编程中,套接字事件处理至关重要。利用`selectors`模块和代理IP能增强程序的稳定性和可靠性。代码示例展示了如何通过代理连接目标服务器,注册套接字的读写事件并高效处理。在代理IP配置、连接创建、事件循环及回调函数中,实现了数据收发与连接管理,有效应对网络爬虫或聊天应用的需求,同时保护了真实IP。
Python编程:如何有效等待套接字的读取与关闭
|
3天前
|
Python
告别低效!Python并查集:数据结构界的超级英雄,拯救你的编程人生!
【7月更文挑战第18天】并查集,数据结构超级英雄,用于不相交集合的合并与查询。Python实现包括初始化、查找根节点和合并操作。应用广泛,如社交网络分析、图论问题、集合划分等。示例代码展示了解决岛屿数量问题,统计连通的“1”单元格数。掌握并查集,提升编程效率,解决复杂问题。
17 6