使用shell生成状态报表

简介: 在数据迁移的时候,目前启用了10个并行的进程。每个进程负责一部分的数据导入工作。然而在统计数据导入进度的时候,总是感觉抓不到重点,没有一目了然的报告。 在定时做数据状态检查的时候,总是凭着感觉和不停的查看日志来得到最基本的状态。
在数据迁移的时候,目前启用了10个并行的进程。每个进程负责一部分的数据导入工作。然而在统计数据导入进度的时候,总是感觉抓不到重点,没有一目了然的报告。
在定时做数据状态检查的时候,总是凭着感觉和不停的查看日志来得到最基本的状态。
为了从这种体力工作中解放出来,今天写一个状态报表来对数据的导入状态进行清晰的了解。
比如现在有100个表,分为10个并行的进程来导入数据,其中有些表比较大,比如表TEST,我们做了切分,把它切分为100个dump,那么做这个表TEST做数据导入的时候,就需要知道截止目前导入了100个dump里的多少个。比如已经导入了10个,我们就认为目前表TEST导入了10%.还有90个dump需要导入。如果可以的话最好知道是哪个并行进程在做这项数据导入。
如果有的表还没有开始导入,就表明属于等待状态,如果已经导入完成,则表明完成
期望达到的结果类似下面的格式,我们就可以很清楚的看到DRESS_DATA已经完成了数据导入工作,是进程10完成的。
ICAL_FILES还没有开始导入数据,还在等待。

            ICAL_FILES    0 of TOTAL     1 completed, |--pending...   from                              
              AC_SOURCE    0 of TOTAL     1 completed, |--pending...   from                              
             DRESS_DATA    4 of TOTAL     4 completed, |--finished...  from     split_par_10_appendata.log
             A_NAME_LINK   3 of TOTAL     3 completed, |--finished...  from      split_par_9_appendata.log
              AGREEMENT    1 of TOTAL     1 completed, |--finished...  from      split_par_8_appendata.log
            AT_RESOURCE    4 of TOTAL     4 completed, |--finished...  from      split_par_7_appendata.log
             R1_ACCOUNT    2 of TOTAL     2 completed, |--finished...  from      split_par_7_appendata.log
             DRESS_NAME    3 of TOTAL     3 completed, |--finished...  from      split_par_6_appendata.log
            AAL_BALANCE    0 of TOTAL    16 completed, |--pending...   from                              
            IRRANGEMENT    0 of TOTAL     1 completed, |--pending...   from                              
             ARGE_GROUP    0 of TOTAL    11 completed, |--pending...   from                              
             R1_CHARGES   24 of TOTAL    24 completed, |--finished...  from      split_par_6_appendata.log
             R1_CONTROL    1 of TOTAL     1 completed, |--finished...  from      split_par_4_appendata.log
            _DEBIT_LINK    0 of TOTAL     9 completed, |--pending...   from                              
            RMER_CREDIT    0 of TOTAL     1 completed, |--pending...   from                


我们假定生成的日志都是按照split_par*.log的格式。
其中DUMP目录中存放的是抽取得到的外部表dump,比如表TEST切分为100份,就有100个dump文件。我们根据这个信息来统计数据导入的进度。

function check_tab
{
total_cnt=`ls -l ../DUMP/$1_[0-9]*.dmp|wc -l`
fin_cnt=`grep COPY_MIG.$1_EXT_[0-9]* *par*.log|wc -l`
par_from_file=`grep COPY_MIG.$1_EXT_[0-9]* *par*.log|tail -1|awk -F: '{print $1}'`
tmp_status=finished
if [ $fin_cnt -eq $total_cnt ]
then
  tmp_status=finished
elif [ $fin_cnt -eq 0 ]
then
  tmp_status=pending
elif [ $fin_cnt -lt $total_cnt ]
then
  tmp_status=processing
fi
echo $1 $fin_cnt of TOTAL $total_cnt completed, "|--"$tmp_status...   from  $par_from_file >> tmp_check.lst
}

total_tab_cnt=`cat ../parfile/tablst|wc -l`
for i in {1..$total_tab_cnt}
do
tmp_tab_name=`sed -n "${i}p"  ../parfile/tablst`
#echo $tmp_tab_name
check_tab $tmp_tab_name
done

awk '
BEGIN{
print "############################################################"
}
{
printf "%30s %4d %2s %5s %5d %3s %-15s %4s %30s \n", $1,$2,$3,$4,$5,$6,$7,$8,$9
}' tmp_check.lst

rm tmp_check.lst

运行后,结果如下所示,这样表的情况就一目了然了。
             ICAL_FILES    0 of TOTAL     1 completed, |--pending...   from                              
              AC_SOURCE    0 of TOTAL     1 completed, |--pending...   from                              
             DRESS_DATA    4 of TOTAL     4 completed, |--finished...  from     split_par_10_appendata.log
             A_NAME_LINK   3 of TOTAL     3 completed, |--finished...  from      split_par_9_appendata.log
              AGREEMENT    1 of TOTAL     1 completed, |--finished...  from      split_par_8_appendata.log
            AT_RESOURCE    4 of TOTAL     4 completed, |--finished...  from      split_par_7_appendata.log
             R1_ACCOUNT    2 of TOTAL     2 completed, |--finished...  from      split_par_7_appendata.log
             DRESS_NAME    3 of TOTAL     3 completed, |--finished...  from      split_par_6_appendata.log
            AAL_BALANCE    0 of TOTAL    16 completed, |--pending...   from                              
            IRRANGEMENT    0 of TOTAL     1 completed, |--pending...   from                              
             ARGE_GROUP    0 of TOTAL    11 completed, |--pending...   from                              
             R1_CHARGES   24 of TOTAL    24 completed, |--finished...  from      split_par_6_appendata.log
             R1_CONTROL    1 of TOTAL     1 completed, |--finished...  from      split_par_4_appendata.log
            _DEBIT_LINK    0 of TOTAL     9 completed, |--pending...   from                              
            RMER_CREDIT    0 of TOTAL     1 completed, |--pending...   from                              
            RIT_REQUEST    0 of TOTAL     1 completed, |--pending...   from                              
            RIT_REQUEST    0 of TOTAL     1 completed, |--pending...   from                              
             R1_DISPUTE    1 of TOTAL     1 completed, |--finished...  from     split_par_10_appendata.log
            1E_ACTIVITY    1 of TOTAL     1 completed, |--finished...  from      split_par_9_appendata.log
            XREFERENCES    1 of TOTAL     1 completed, |--finished...  from      split_par_8_appendata.log
             ES_CONTROL    1 of TOTAL     1 completed, |--finished...  from      split_par_7_appendata.log
             R1_INVOICE    1 of TOTAL     1 completed, |--finished...  from     split_par_10_appendata.log
               AR1_MEMO    1 of TOTAL     1 completed, |--finished...  from      split_par_6_appendata.log
             AY_CHANNEL    0 of TOTAL     1 completed, |--pending...   from                              
             R1_PAYMENT    1 of TOTAL     1 completed, |--finished...  from      split_par_9_appendata.log
            1T_ACTIVITY    1 of TOTAL     1 completed, |--finished...  from      split_par_4_appendata.log
            RNT_DETAILS    1 of TOTAL     1 completed, |--finished...  from      split_par_8_appendata.log
            _ND_BALANCE    0 of TOTAL     1 completed, |--pending...   from                              
            AND_REQUEST    0 of TOTAL     1 completed, |--pending...   from                              
             1_TAX_ITEM    0 of TOTAL    34 completed, |--pending...   from                              
              CTION_LOG   21 of TOTAL    21 completed, |--finished...  from      split_par_6_appendata.log
              ED_CREDIT    0 of TOTAL     2 completed, |--pending...   from                              
              WRITE_OFF    1 of TOTAL     1 completed, |--finished...  from     split_par_10_appendata.log
              COUNT_EXT    1 of TOTAL     1 completed, |--finished...  from      split_par_9_appendata.log
              T_COUNTER    1 of TOTAL     1 completed, |--finished...  from      split_par_8_appendata.log
              S_CONTROL    1 of TOTAL     1 completed, |--finished...  from      split_par_7_appendata.log
              BILLED_OC    1 of TOTAL     1 completed, |--finished...  from      split_par_6_appendata.log
              Y_HISTORY    0 of TOTAL    32 completed, |--pending...   from                              
              _REQUESTS    1 of TOTAL     1 completed, |--finished...  from      split_par_4_appendata.log
              ADD_COMPS    4 of TOTAL     4 completed, |--finished...  from     split_par_10_appendata.log

              
目录
相关文章
|
BI Shell Perl
通过shell脚本生成数据统计信息的报表
对于统计信息的收集,不同的环境中使用的策略也会有很大的不同,有的按照一定的时间频率来收集,有的比较稳定的系统根据数据的增长频率来收集,用户比较稳定的系统,甚至都不再收集统计信息。
881 0
|
19天前
|
存储 安全 Unix
七、Linux Shell 与脚本基础
别再一遍遍地敲重复的命令了,把它们写进Shell脚本,就能一键搞定。脚本本质上就是个存着一堆命令的文本文件,但要让它“活”起来,有几个关键点:文件开头最好用#!/usr/bin/env bash来指定解释器,并用chmod +x给它执行权限。执行时也有讲究:./script.sh是在一个新“房间”(子Shell)里跑,不影响你;而source script.sh是在当前“房间”里跑,适合用来加载环境变量和配置文件。
254 9
|
19天前
|
存储 Shell Linux
八、Linux Shell 脚本:变量与字符串
Shell脚本里的变量就像一个个贴着标签的“箱子”。装东西(赋值)时,=两边千万不能有空格。用单引号''装进去的东西会原封不动,用双引号""则会让里面的$变量先“变身”再装箱。默认箱子只能在当前“房间”(Shell进程)用,想让隔壁房间(子进程)也能看到,就得给箱子盖个export的“出口”戳。此外,Shell还自带了$?(上条命令的成绩单)和$1(别人递进来的第一个包裹)等许多特殊箱子,非常有用。
103 2
|
4月前
|
Shell
Shell脚本循环控制:shift、continue、break、exit指令
使用这些命令可以让你的Shell脚本像有生命一样动起来。正确使用它们,你的脚本就能像一场精心编排的舞蹈剧目,既有旋律的起伏,也有节奏的跳跃,最终以一场惊艳的表演结束。每一个动作、每一个转折点,都准确、优雅地完成所需要表达的逻辑。如此,你的脚本不只是冰冷的代码,它透过终端的界面,跳着有节奏的舞蹈,走进观众——使用者的心中。
211 60
|
1月前
|
数据采集 监控 Shell
无需Python:Shell脚本如何成为你的自动化爬虫引擎?
Shell脚本利用curl/wget发起请求,结合文本处理工具构建轻量级爬虫,支持并行加速、定时任务、增量抓取及分布式部署。通过随机UA、异常重试等优化提升稳定性,适用于日志监控、价格追踪等场景。相比Python,具备启动快、资源占用低的优势,适合嵌入式或老旧服务器环境,复杂任务可结合Python实现混合编程。
|
7月前
|
关系型数据库 MySQL Shell
MySQL 备份 Shell 脚本:支持远程同步与阿里云 OSS 备份
一款自动化 MySQL 备份 Shell 脚本,支持本地存储、远程服务器同步(SSH+rsync)、阿里云 OSS 备份,并自动清理过期备份。适用于数据库管理员和开发者,帮助确保数据安全。
|
3月前
|
Web App开发 缓存 安全
Linux一键清理系统垃圾:释放30GB空间的Shell脚本实战​
这篇博客介绍了一个实用的Linux系统盘清理脚本,主要功能包括: 安全权限检查和旧内核清理,保留当前使用内核 7天以上日志文件清理和系统日志压缩 浏览器缓存(Chrome/Firefox)、APT缓存、临时文件清理 智能清理Snap旧版本和Docker无用数据 提供磁盘空间使用前后对比和大文件查找功能 脚本采用交互式设计确保安全性,适合定期维护开发环境、服务器和个人电脑。文章详细解析了脚本的关键功能代码,并给出了使用建议。完整脚本已开源,用户可根据需求自定义调整清理策略。
265 1
|
5月前
|
存储 Unix Shell
确定Shell脚本在操作系统中的具体位置方法。
这对于掌握Linux的文件系统组织结构和路径方面的理解很有帮助,是我们日常工作和学习中都可能使用到的知识。以上讲解详细清晰,应用简便,是每一个想要精通操作系统的计算机爱好者必备的实用技能。
123 17
|
5月前
|
Linux Shell
Centos或Linux编写一键式Shell脚本删除用户、组指导手册
Centos或Linux编写一键式Shell脚本删除用户、组指导手册
140 4
|
5月前
|
Linux Shell 数据安全/隐私保护
Centos或Linux编写一键式Shell脚本创建用户、组、目录分配权限指导手册
Centos或Linux编写一键式Shell脚本创建用户、组、目录分配权限指导手册
286 3