火语言 RPA:提取网页相对路径 href ,拼接完整 URL的案例

简介: 本案例基于火语言RPA,自动提取政府采购网公告页中的相对路径链接,通过循环替换“./”、拼接根域名,批量生成可直接访问的完整URL,高效支撑详情页访问与数据采集。

一、案例说明

网页抓取过程中,多数网站获取的href地址为不包含域名的相对路径,无法直接访问使用。本案例是基于火语言RPA,自动批量提取页面内所有链接相对地址,通过循环批量补全网站根域名,拼接生成可直接访问的标准完整URL的应用场景,适用于批量访问详情页、数据采集等多种业务场景。
二、案例逻辑

打开浏览器进入目标公告页面(http://www.ccgp.gov.cn/cggg/zygg/ ),批量提取页面链接的href相对路径,通过循环逐条遍历所有相对链接,拼接网站根域名,生成可直接访问的完整URL。
三、操作细则

1、列表打开或新建,新建空列表list1用于存储列表数据
image.png

2、打开浏览器,选择浏览器类型
image.png

3、浏览网页,输入网址URLhttp://www.ccgp.gov.cn/cggg/zygg/
image.png

4、获取多元素信息/属性值,获取href路径,可以看出这里获得的是相对路径,无法直接访问,那么这里就需要补全完整的链接
目标元素://ul[@class="c_list_bid"]/li//a[@target="_blank"]
返回结果:指定属性值
属性名称:href
image.png

5、ForEach循环,逐条处理每一条短链接
image.png

5.1打印日志,打印变量item,查看遍历的内容,
可以看到打印的结果:./fblbgg/202606/t20260605_26696649.htm
完整的URL地址:http://www.ccgp.gov.cn/cggg/zygg/fblbgg/202606/t20260605_26696649.htm
那么把./fblbgg/202606/t20260605_26696649.htm替换成:fblbgg/202606/t20260605_26696649.htm
image.png

5.2字符串替换,对遍历item短链接进行字符串替换"./"替换成"空值"
image.png

5.3打印日志,打印替换后的结果
可以看到这里已经替换成:fblbgg/202606/t20260605_26696649.htm
image.png

5.4字符串连接,补齐域名,相对链接补齐完整可访问的链接,追加http://www.ccgp.gov.cn/cggg/zygg/到头部
image.png

5.5打印日志,打印补齐后的结果
image.png
image.png

5.6列表添加一项,把拼接好的完整链接存入全局列表List1
image.png

6、关闭浏览器,释放浏览器资源
image.png

四、划重点

网页抓取的 href 大多为相对路径,不带域名,直接打开会报错,必须拼接网站根域名;这里我们使用的是字符串连接的组件,当然也可以直接使用网址/图片地址获取组件。

目录
相关文章
|
17天前
|
人工智能 自然语言处理 文字识别
阿里云百炼Qwen3.7-Max简介:能力、优势、支持订阅计划参考
Qwen3.7-Max是阿里云百炼面向智能体时代推出的新一代旗舰模型,对标GPT-5.5、Claude Opus 4.7等闭源旗舰。该模型支持百万级token上下文窗口,具备顶级推理能力、多模态搜索与视觉理解增强、流式输出低延迟响应等核心优势,覆盖编程、办公、长周期自主执行等复杂场景。同时支持OpenAI接口兼容,便于系统快速迁移。用户可通过Token Plan团队或节省计划等订阅方式灵活调用,适合企业级高要求场景使用。
6344 30
阿里云百炼Qwen3.7-Max简介:能力、优势、支持订阅计划参考
|
2天前
|
数据采集 人工智能 前端开发
让 Coding Agent 从黑盒到透明:阿里云 Agent 观测审计数据采集实践
AI Agent 规模化落地带来执行黑盒、行为难追溯、成本难度量三大难题。阿里云基于 OTel 标准,面向 Coding Agent、个人通用助理和框架型 Agent,推出 LoongSuite Pilot、插件及探针等无侵入采集方案,让 Agent 实现可看见、可分析、可审计、可治理。
585 135
|
12天前
|
存储 定位技术 数据库
CodeGraph 如何让 Claude Code减少 7 成工具调用?
CodeGraph 为 Coding Agent 提供本地代码知识图谱,把函数、类、调用链和框架路由提前整理成“项目地图”,减少盲目搜索和文件读取。它不是新 Agent,而是上下文基础设施,让 Agent 更快找到正确代码路径,平均减少 7 成工具调用。
1246 3
|
9天前
|
人工智能 安全 定位技术
CodeGraph深度解析 让Claude Code工具调用直降七成的核心原理与实操教程
如今以Claude Code为代表的AI编程智能体已经成为开发者日常编码、项目重构、漏洞修复的必备工具。但在长期使用过程中,几乎所有开发者都会遇到同一个明显痛点:AI虽然具备强大的代码生成与分析能力,却常常陷入盲目探索的循环中。
1095 1
|
19天前
|
人工智能 自然语言处理 供应链
|
9天前
|
人工智能 弹性计算 安全
阿里云618活动时间、活动入口、优惠活动详细解读
2026年阿里云618创新加速季已全面开启,作为年度力度最大的云产品促销活动,本次大促覆盖轻量应用服务器、ECS云服务器、GPU云服务器、数据库、AI算力、安全服务、CDN等全品类产品,推出5亿元算力补贴、新用户限时秒杀、普惠满减、企业专享、免费试用、云大使返佣等多重福利,个人开发者、中小企业、AI团队均可享受专属低价。本文将系统梳理2026年阿里云618活动的完整时间节点、官方参与入口、各类优惠细则、使用规则、热门产品推荐及实操代码,帮助用户精准参与、高效省钱,以最低成本完成上云部署。
881 5
|
8天前
|
人工智能 自然语言处理 安全
Vibe Coding 实战:别盲目跟风,先分清 vibe coding 适合什么场景
本文系统总结vibe coding实战经验:明确其适用场景(原型、小工具、标准化模块),剖析5步落地流程(场景判定→结构化提示词→目录初始化→分模块生成→自动化校验),指出四大常见误区,并推荐适配工具Trae。强调“场景匹配+规则前置”是提效关键,避免盲目套用。
733 1