《懒人Shell脚本》之三——微博分类信息获取与格式化

简介: 1、需求:获取微博网站ctg1_4188#”>http://d.weibo.com/102803_ctg1_4188-_ctg1_4188# 社会类媒体的名称信息。构造成json格式,用于echart格式化显示。

image.png

2、分析&实现步骤

第一步:截获

地址:

http://d.weibo.com/?topnav=1&mod=logo&wvr=6image.png

获取关键名称及链接(下面5行代码非原创,效率非常高):


var selector='.WB_info';

var a=document.querySelectorAll(selector+' a');

for(var i =0; i < a.length; i++){

console.log(a[i].href+" "+a[i].innerText);

}

1

2

3

4

5

如下:


VM7557:5 http://weibo.com/rmwfjpd?refer_flag=1028035010_ 人民网福建频道

VM7557:5 http://company.verified.weibo.com/verify/orgapply

VM7557:5 http://sports.weibo.com/olympics2016

VM7557:5 http://weibo.com/thepapernewsapp?refer_flag=1028035010_ 澎湃新闻

VM7557:5 http://company.verified.weibo.com/verify/orgapply

VM7557:5 http://vip.weibo.com/personal?from=main

VM7557:5 http://weibo.com/globaltimes?refer_flag=1028035010_ 环球网

1

2

3

4

5

6

7

上述信息存入:shehui.txt中。


第二步:取上述文件第3列值,存入文件shehui.info.

[root@laoyang process]# awk {'print $3'} shehui.txt | sort -n | uniq > shehui.info

1

第三步:逐行读取,构造json文件。

[root@laoyang process]# cat readProc.sh

#!/bin/sh


cat /dev/null > format.json

dos2unix shehui.info      #格式化,去掉每行末尾的windows结束符"^M”


cat ./shehui.info | while read line

do

if [ -z "$line" ]; then

 continue

fi

echo "{" >> format.json

echo "\"name\": \"$line\",">> format.json

echo "\"size\": 1455" >> format.json

echo "}," >> format.json

done

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

第四步:在http://json.cn/ 验证构造的json格式是否正确。

image.png

结语:

能用脚本实现的一定不要手写,不要复制、粘贴。


相关文章
|
1月前
|
Shell
一个用于添加/删除定时任务的shell脚本
一个用于添加/删除定时任务的shell脚本
77 1
|
22天前
|
Shell Linux 测试技术
6种方法打造出色的Shell脚本
6种方法打造出色的Shell脚本
45 2
6种方法打造出色的Shell脚本
|
8天前
|
XML JSON 监控
Shell脚本要点和难点以及具体应用和优缺点介绍
Shell脚本在系统管理和自动化任务中扮演着重要角色。尽管存在调试困难、可读性差等问题,但其简洁高效、易于学习和强大的功能使其在许多场景中不可或缺。通过掌握Shell脚本的基本语法、常用命令和函数,并了解其优缺点,开发者可以编写出高效的脚本来完成各种任务,提高工作效率。希望本文能为您在Shell脚本编写和应用中提供有价值的参考和指导。
29 1
|
13天前
|
Ubuntu Shell 开发工具
ubuntu/debian shell 脚本自动配置 gitea git 仓库
这是一个自动配置 Gitea Git 仓库的 Shell 脚本,支持 Ubuntu 20+ 和 Debian 12+ 系统。脚本会创建必要的目录、下载并安装 Gitea,创建 Gitea 用户和服务,确保 Gitea 在系统启动时自动运行。用户可以选择从官方或小绿叶技术博客下载安装包。
34 2
|
26天前
|
监控 网络协议 Shell
ip和ip网段攻击拦截系统-绿叶结界防火墙系统shell脚本
这是一个名为“小绿叶技术博客扫段攻击拦截系统”的Bash脚本,用于监控和拦截TCP攻击。通过抓取网络数据包监控可疑IP,并利用iptables和firewalld防火墙规则对这些IP进行拦截。同时,该系统能够查询数据库中的白名单,确保合法IP不受影响。此外,它还具备日志记录功能,以便于后续分析和审计。
45 6
|
23天前
|
运维 监控 Shell
深入理解Linux系统下的Shell脚本编程
【10月更文挑战第24天】本文将深入浅出地介绍Linux系统中Shell脚本的基础知识和实用技巧,帮助读者从零开始学习编写Shell脚本。通过本文的学习,你将能够掌握Shell脚本的基本语法、变量使用、流程控制以及函数定义等核心概念,并学会如何将这些知识应用于实际问题解决中。文章还将展示几个实用的Shell脚本例子,以加深对知识点的理解和应用。无论你是运维人员还是软件开发者,这篇文章都将为你提供强大的Linux自动化工具。
|
1月前
|
监控 Unix Shell
shell脚本编程学习
【10月更文挑战第1天】shell脚本编程
67 12
|
1月前
|
存储 运维 监控
自动化运维:使用Shell脚本简化日常任务
【9月更文挑战第35天】在IT运维的日常工作中,重复性的任务往往消耗大量的时间。本文将介绍如何通过编写简单的Shell脚本来自动化这些日常任务,从而提升效率。我们将一起探索Shell脚本的基础语法,并通过实际案例展示如何应用这些知识来创建有用的自动化工具。无论你是新手还是有一定经验的运维人员,这篇文章都会为你提供新的视角和技巧,让你的工作更加轻松。
55 2
|
2月前
|
Shell
shell脚本变量 $name ${name}啥区别
shell脚本变量 $name ${name}啥区别
|
1月前
|
存储 Shell Linux
【Linux】shell基础,shell脚本
Shell脚本是Linux系统管理和自动化任务的重要工具,掌握其基础及进阶用法能显著提升工作效率。从简单的命令序列到复杂的逻辑控制和功能封装,Shell脚本展现了强大的灵活性和实用性。不断实践和探索,将使您更加熟练地运用Shell脚本解决各种实际问题
27 0