【01】仿站技术之python技术,看完学会再也不用去购买收费工具了-用python扒一个app下载落地页-包括安卓android下载(简单)-ios苹果plist下载(稍微麻烦一丢丢)-客户的麻将软件需要下载落地页并且要做搜索引擎推广-本文用python语言快速开发爬取落地页下载-优雅草卓伊凡

简介: 【01】仿站技术之python技术,看完学会再也不用去购买收费工具了-用python扒一个app下载落地页-包括安卓android下载(简单)-ios苹果plist下载(稍微麻烦一丢丢)-客户的麻将软件需要下载落地页并且要做搜索引擎推广-本文用python语言快速开发爬取落地页下载-优雅草卓伊凡

【01】仿站技术之python技术,看完学会再也不用去购买收费工具了-用python扒一个app下载落地页-包括安卓android下载(简单)-ios苹果plist下载(稍微麻烦一丢丢)-客户的麻将软件需要下载落地页并且要做搜索引擎推广-本文用python语言快速开发爬取落地页下载-优雅草卓伊凡

开发背景

由于客户另外一些小需求转了500元,因此我赠送一个落地页,要求不是很高,可能后面还会转账一些来解决安卓苹果下载的问题,既然客户没有对界面特殊要求我就自由发挥了,先说好客户产品是五证齐全的正规麻将娱乐产品,不要想歪了,公安备案都是委托卓伊凡去帮忙提交的资料,你们也可以下载试玩,但是我根本看不懂,卓伊凡虽然是四川人但是根本不会打麻将,从小爹妈不让学,对了,本文是python爬虫有关,请合理合法使用,注意法律问题。

实战开发

找个目标站

先问豆包要了一下最近比较火的落地页,

找我豆包的智能体,软件源码大全(卓伊凡)要网址,这一下给我来一堆太大的。

这回不错

时光序挺好看的,不过再看几个,

再次让给到发现这个酷我的下载页面很不错,稍微改一下是可用的

接下来正式开始,

用python爬取一下前端页面

思路如下

详细说明:

  1. 安装库: 使用 pip 安装 requests BeautifulSoup 库。
  2. 发送请求:
  • 设置请求头以模拟浏览器请求。
  • 使用 requests.get 发送 GET 请求并检查响应状态码。
  1. 保存 HTML 文件:
  • 创建保存目录 kuwo_down
  • 将 HTML 内容保存到 index.html 文件中。
  1. 解析网页内容:
  • 使用 BeautifulSoup 解析 HTML 内容。
  1. 下载并保存 CSS 文件:
  • 查找所有 CSS 文件链接,使用 urljoin 构建完整的 URL。
  • 发送请求并保存 CSS 文件到指定目录。
  1. 下载并保存 JS 文件:
  • 查找所有 JS 文件链接,使用 urljoin 构建完整的 URL。
  • 发送请求并保存 JS 文件到指定目录。

新建download.py文件

安装依赖库

pip install requests beautifulsoup4

卓伊凡发现自己已经安装,只是提示升级

import os
import requests
from bs4 import BeautifulSoup
from urllib.parse import urljoin, urlparse
\# 目标URL
url \= 'https://www.kuwo.cn/down'
\# 设置请求头,模拟浏览器请求
headers \= {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.96 Safari/537.36'
}
\# 发送GET请求
response \= requests.get(url, headers\=headers)
response.raise\_for\_status()  \# 检查请求是否成功
\# 创建保存目录
os.makedirs('kuwo\_down/css', exist\_ok\=True)
os.makedirs('kuwo\_down/js', exist\_ok\=True)
os.makedirs('kuwo\_down/assets', exist\_ok\=True)
\# 保存HTML文件
html\_file\_path \= os.path.join('kuwo\_down', 'index.html')
with open(html\_file\_path, 'w', encoding\='utf-8') as file:
    file.write(response.text)
\# 解析网页内容
soup \= BeautifulSoup(response.content, 'html.parser')
\# 下载并保存CSS文件
css\_links \= soup.find\_all('link', rel\='stylesheet')
for link in css\_links:
    css\_url \= urljoin(url, link\['href'\])
    css\_response \= requests.get(css\_url)
    css\_response.raise\_for\_status()
    css\_file\_name \= os.path.basename(urlparse(css\_url).path)
    css\_file\_path \= os.path.join('kuwo\_down/css', css\_file\_name)
    with open(css\_file\_path, 'w', encoding\='utf-8') as file:
        file.write(css\_response.text)
\# 下载并保存JS文件
js\_links \= soup.find\_all('script', src\=True)
for script in js\_links:
    js\_url \= urljoin(url, script\['src'\])
    js\_response \= requests.get(js\_url)
    js\_response.raise\_for\_status()
    js\_file\_name \= os.path.basename(urlparse(js\_url).path)
    js\_file\_path \= os.path.join('kuwo\_down/js', js\_file\_name)
    with open(js\_file\_path, 'w', encoding\='utf-8') as file:
        file.write(js\_response.text)
\# 下载并保存图片等静态文件
static\_links \= soup.find\_all(\['img', 'link', 'script'\], src\=True)
for static in static\_links:
    static\_url \= urljoin(url, static\['src'\])
    static\_response \= requests.get(static\_url)
    static\_response.raise\_for\_status()
    static\_file\_name \= os.path.basename(urlparse(static\_url).path)
    static\_file\_extension \= os.path.splitext(static\_file\_name)\[1\].lower()
    if static\_file\_extension in \['.png', '.jpg', '.jpeg', '.gif', '.svg'\]:
        static\_file\_path \= os.path.join('kuwo\_down/assets', static\_file\_name)
    else:
        continue  \# 跳过非静态资源文件
    with open(static\_file\_path, 'wb') as file:
        file.write(static\_response.content)
print("网页内容下载完成!")

对应编写的python爬取代码,

执行后成功下载网页,但是我们发现有问题

资源方面都是成功下载了,包括css 和js,以及静态图片,但是首页代码奇乱,我怀疑这页面是vue写的,本地运行后显示也不对

赶紧查看下,果然是vue写的,所以vue是有好处的,编译后的文件让别人要仿你是很难的,我们需要换个目标站,这次卓伊凡会先检查下是否是vue。

目录
相关文章
|
2月前
|
JSON 监控 BI
拼多多批量下单工具,拼多多买家批量下单软件,低价下单python框架分享
使用Selenium实现自动化操作流程多线程订单处理提升效率
|
2月前
|
机器人 数据安全/隐私保护 Python
企业微信自动回复软件,企业微信自动回复机器人,python框架分享
企业微信机器人包含完整的消息处理流程,支持文本消息自动回复、事件处理、消息加密解密等功能
|
2月前
|
数据安全/隐私保护 Python
微信群成员导出工具, 微信群成员导出软件, 微信群管理工具软件【python】
这个工具提供了完整的微信群成员导出功能,包括登录微信、获取群列表、导出成员信息到Excel等功能
|
2月前
|
数据安全/隐私保护 计算机视觉 iOS开发
拼多多订单截图生成器,拼多多订单p图软件,python版本
这段代码实现了一个完整的拼多多订单截图生成器,包含了订单数据生成、图像处理和二维码生成等功能
|
2月前
|
人工智能 数据安全/隐私保护 Python
小红书图文生成器,小红书AI图文生成工具,python版本软件
Pillow库自动生成符合平台尺寸要求的配图7;3)利用Playwright实现自动化发布流程6。
|
2月前
|
JSON 数据安全/隐私保护 数据格式
拼多多批量下单软件,拼多多无限账号下单软件,python框架仅供学习参考
完整的拼多多自动化下单框架,包含登录、搜索商品、获取商品列表、下单等功能。
|
2月前
|
API 数据安全/隐私保护 开发者
企业微信自动加好友软件,导入手机号批量添加微信好友,python版本源码分享
代码展示了企业微信官方API的合规使用方式,包括获取access_token、查询部门列表和创建用户等功能
|
2月前
|
存储 API 数据库
自动发短信的软件,批量自动群发短信,手机号电话号生成器【python框架】
这个短信群发系统包含以下核心功能: 随机手机号生成器(支持中国号码) 批量短信发送功能(使用Twilio API)
|
2月前
|
API 数据安全/隐私保护 Python
批量发短信的软件,自动群发短信批量工具,手机号电话生成脚本插件【python】
该工具包含三个核心模块:短信发送核心功能、配置管理系统和命令行界面。使用时需先配置API密钥和短信模板
|
1月前
|
API 数据安全/隐私保护 Python
拼多多批量上架软件, 电商一键上货发布工具,python电商框架分享
多线程批量上传架构,支持并发处理商品数据 完整的拼多多API签名和token管理机制

热门文章

最新文章

推荐镜像

更多