自动分析网站链接有效性

简介: 【4月更文挑战第30天】

》》》》》魏红斌带你学shell脚本《《《《《


更多shell脚本学习点击个人主页


作为一个资深程序猿,我将带领您从零开始,一步步踏上运维之旅,无论您是否拥有现成的服务器,都将学会如何轻松购买、部署,并通过编写及应用精心设计的Shell脚本,解决实际工作中遇到的问题。这些脚本不仅源自真实的业务场景,经历了反复实践与严格测试,确保了其简洁高效、易于理解且便于使用。更重要的是,我们将全程免费分享,并深度解析背后原理,助您深入理解并灵活运用,每一款脚本均经过真实业务场景的反复打磨与严格测试,秉持着简洁高效、易于理解和使用的理念设计,无偿提供并且提供相关解析过程,让读者能更深入了解相关内容

无服务器的朋友们

让我们先从选购并部署服务器开始。只需简单三步,即可拥有您的专属云服务器:

  1. 访问ECS官网:点击链接直达阿里云ECS网站:ECS选择网址。这是您获取高质量云服务器的第一站。
  2. 选择并购买:在琳琅满目的服务器配置中,挑选符合您需求的那一款,一键下单,完成支付。整个过程犹如在线购物般便捷。
  3. 进入ECS控制台:支付成功后,您将被引导至ECS管理控制台。在这里,您可以全面掌控您的服务器资源,后续的所有运维操作都将在此展开。

已有服务器的朋友们

如果您已拥有ECS实例,那么请直接登录ECS管理控制台在左侧导航栏中,依次选择“实例与镜像” > “实例”,确保您已定位到目标资源所在的资源组和地域。接下来,在实例列表中找到待连接的实例,点击操作列下的“远程连接”,选择“通过Workbench远程连接”并点击“立即登录”。

登录实例

无论是新购还是已有服务器,接下来都需要进行实例登录。这里支持多种认证方式,以最常见的“密码认证”为例:

  • 输入用户名(通常为rootecs-user)。
  • 接着,输入登录密码。如果您忘记了密码,无需担忧,您可以在ECS实例详情页面查询,或者通过“更改密码”功能进行修改。

编写与运行Shell脚本

成功登录后,您将看到一个熟悉的命令行界面——这就是您的运维主战场。现在,键入vim test.sh,我们便进入了文本编辑模式,准备创建第一个Shell脚本。

按下键盘上的i键,进入插入模式,此刻您可以自由地复制粘贴今天要学习的脚本代码,粘贴后按ecs后,按:wq保存脚本,可以用./ test.sh或者sh test.sh进行脚本执行。

今天我们要学习的脚本是(脚本内容直接复制粘贴即可):

#!/bin/bash
# auto-link-checker.sh
# 使用方法: bash auto-link-checker.sh <url>
# 检查参数
if [ "$#" -ne 1 ]; then
    echo "使用方法: bash auto-link-checker.sh <url>"
    exit 1
fi
URL=$1
OUTPUT_FILE="links_output.txt"
INVALID_LINKS_FILE="invalid_links.txt"
# 获取网站的所有链接
echo "抓取链接..."
wget -qO- "$URL" | grep -o -E 'href="[^"]+"' | sed 's/.*href="\([^"]*\)".*/\1/' > "$OUTPUT_FILE"
# 检查每个链接的有效性
echo "检查链接有效性..."
while IFS= read -r link; do
    # 跳过相对链接
    if [[ "$link" != "#" && ! "$link" =&#126; ^/ ]]; then
        FULL_LINK=$(echo "$URL$link" | sed 's/\/$//')
        # 使用curl检查链接
        RESPONSE=$(curl -s -o /dev/null -w "%{http_code}" "$FULL_LINK")
        
        # 检查HTTP状态码是否为200
        if [ "$RESPONSE" -ne 200 ]; then
            echo "$FULL_LINK - 无效 (HTTP状态码: $RESPONSE)" >> "$INVALID_LINKS_FILE"
        fi
    fi
done < "$OUTPUT_FILE"
# 输出结果
if [ -s "$INVALID_LINKS_FILE" ]; then
    echo "发现无效链接,已保存到 $INVALID_LINKS_FILE"
else
    echo "所有链接均有效"
fi

逐行解析:

  1. #!/bin/bash - 指定脚本使用的Shell解释器。
  2. 注释部分介绍了脚本的名称和使用方法。
  3. 检查是否有一个参数(即要检查的URL)传递给脚本。
  4. 设置URL、输出文件和无效链接文件的变量。
  5. 使用wget命令从给定的URL抓取所有链接,并使用grepsed提取链接地址,保存到输出文件中。
  6. 开始循环读取输出文件中的每个链接。
  7. 跳过相对链接和空链接。
  8. 使用sed将相对链接转换为绝对链接。
  9. 使用curl命令检查链接的有效性,并获取HTTP状态码。
  10. 如果HTTP状态码不是200,则将该链接视为无效,并保存到无效链接文件中。
  11. 循环结束后,检查无效链接文件是否为空,并输出相应的消息。

总结:

这个脚本是一个创新性的链接检查工具,它结合了网页抓取、链接提取、HTTP状态码检查等多个功能。通过自动化这些步骤,它可以帮助用户快速识别出网站中的无效链接,从而进行修复,提高网站的用户体验。此外,该脚本还具有良好的可读性和扩展性,可以通过添加更多功能(如链接分类、定时任务等)来满足不同的工作需求。

如果想上手操作练代码的同学们可以通过阿里云ecs服务器免费试用参与!

入口:新老同学免费试用

相关实践学习
通义万相文本绘图与人像美化
本解决方案展示了如何利用自研的通义万相AIGC技术在Web服务中实现先进的图像生成。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情:&nbsp;https://www.aliyun.com/product/ecs
目录
相关文章
|
SQL 存储 数据挖掘
大模型与数据分析:探索Text-to-SQL(下)
大模型与数据分析:探索Text-to-SQL(下)
1308 4
|
开发工具
【开发工具】解决 Goland 控制台输出错位问题
【开发工具】解决 Goland 控制台输出错位问题
482 0
|
Kubernetes 负载均衡 网络协议
详解 Kubernetes 的稳定性和可用性
大家好,我叫杨朝乐,来自才云科技基础设施部门。今天给大家分享一个平时可能接触得较少的话题:关于 Kubernetes 的稳定性和可用性。 下面是今天分享以下 5 个主题: 认识稳定性 认识异常 Kubernetes 里面的高可用方案 如何处理异常 我的经验分享 认识稳定性 Kubernetes 集群的稳定性和众多因素相关。
3101 1
|
缓存 运维 负载均衡
Nginx专题(2):Nginx的负载均衡策略及其配置
本文介绍了Nginx的负载均衡策略,一致性hash分配原理,及常用的故障节点的摘除与恢复配置。
|
6月前
|
安全 机器人 5G
PTP同步时钟使用注意事项及场景应用
精确时间协议(PTP,IEEE1588标准)是数字化时代分布式系统中实现亚微秒级高精度时钟同步的关键技术,广泛应用于智能电网、5G通信、工业自动化和金融交易等领域。使用PTP同步时钟时需注意网络环境适配(低延迟、支持硬件时间戳)、主从时钟选择与配置(高稳定性主时钟、硬件时间戳引擎)、时间源校准与抖动抑制以及安全冗余设计。典型应用场景包括电力系统的继电保护、5G基站的纳秒级同步、工业自动化的多轴协同运动及金融交易的高频订单撮合。选型时应根据精度需求(硬件或软件PTP)、网络架构复杂性(透明时钟或边界时钟)和可靠性要求(冗余时钟源与路径)合理配置,以提升系统协同性和数据一致性。
|
10月前
|
搜索推荐 前端开发 API
构建智能导购助手:百炼大模型的实践与探索
智能导购助手利用百炼大模型的Multi-Agent架构,实现精准的商品推荐和主动式对话,解决购物时商品选择困难、需求沟通成本高、推荐缺乏个性化等问题。通过详细的部署实践和技术架构解析,本文带你深入了解如何打造一个高效、个性化的智能导购系统,提升购物体验与满意度。
897 6
构建智能导购助手:百炼大模型的实践与探索
|
存储 分布式计算 分布式数据库
【专栏】云计算与分布式系统架构在数字化时代的关键作用。云计算,凭借弹性、可扩展性和高可用性,提供便捷的计算环境
【4月更文挑战第27天】本文探讨了云计算与分布式系统架构在数字化时代的关键作用。云计算,凭借弹性、可扩展性和高可用性,提供便捷的计算环境;分布式系统架构则通过多计算机协同工作,实现任务并行和容错。两者相互依存,共同推动企业数字化转型、科技创新、公共服务升级及数字经济发展。虚拟化、分布式存储和计算、网络技术是其核心技术。未来,深化研究与应用这些技术将促进数字化时代的持续进步。
422 4
|
机器学习/深度学习 人工智能 自然语言处理
LLMs 入门实战系列大全:LLMs应用、领域大模型介绍、大模型常见面经汇总
LLMs 入门实战系列大全:LLMs应用、领域大模型介绍、大模型常见面经汇总
LLMs 入门实战系列大全:LLMs应用、领域大模型介绍、大模型常见面经汇总
|
索引 Python 数据处理
【Python Numpy教程】切片和索引
【Python Numpy教程】切片和索引
475 0
【Python Numpy教程】切片和索引