分享113个HTML公司企业模板,总有一款适合您
113个HTML公司企业模板下载链接:https://pan.baidu.com/s/1mtN0FPh7V3nbLSPgBL2vlQ?pwd=e77e
提取码:e77e
Python采集代码下载链接:采集代码.zip - 蓝奏云
NTF公司项目网站HTML5模板
NTF公司项目网站HTML5模板是一款适合公司企业官网网站模板下载。提示:本模板调用到谷歌字体库,可能会出现页面打开比较缓慢。
建筑施工装修公司网站模板
建筑施工装修公司网站模板是一款基于Bootstrap5实现的建筑装修公司网站模板下载。提示:本模板调用到谷歌字体库,可能会出现页面打开比较缓慢。
App应用程序着陆页HTML模板
App应用程序着陆页HTML模板是一款适合应用程序开发公司网站模板下载。提示:本模板调用到谷歌字体库,可能会出现页面打开比较缓慢。
公司代理机构创意网站模板
公司代理机构创意网站模板是一款适合初创公司公司网站模板下载。提示:本模板调用到谷歌字体库,可能会出现页面打开比较缓慢。
import os import shutil import time from time import sleep from docx import Document from docx.shared import Inches from framework.base.BaseFrame import BaseFrame from sprider.business.DownLoad import DownLoad from sprider.business.SeleniumTools import SeleniumTools from sprider.business.SpriderTools import SpriderTools from selenium import webdriver from selenium.webdriver.common.by import By from sprider.model.SpriderEntity import SpriderEntity from sprider.access.SpriderAccess import SpriderAccess title_name = "公司企业" class ChinaZJsSelenium: base_url = "https://sc.chinaz.com/" # 采集的网址 save_path = "D:\\Freedom\\Sprider\\ChinaZ\\" sprider_count = 113 # 116+66+20 sprider_start_count = 223 word_content_list = [] folder_name = "" page_end_number = 0 max_pager = 24 # 每页的数量 haved_sprider_count = 0 # 已经采集的数量 page_count = 1 # 每个栏目开始业务content="text/html; charset=gb2312" filter_down_file = [] word_image_count = 5 # word插入图片数量 同时也是明细采集图片和描述的数量 sprider_detail_index = 0 # 明细方法采集的数量 累加 sprider_top_level = "HTML"
管道维修水电施工HTML5模板
电子竞技游戏锦标赛网站模板
环境生态保护响应式模板
家政保洁服务公司网站模板
创意响应式企业网站HTML5模板
建筑设计工程师网站HTML5模板
仓储货运快递企业网站模板
正规租车公司官方网站模板
宠物狗交易平台网站模板
新鲜水果超市官网网站模板
Saas软件设计项目启动网站模板
泳池维修清洁服务网站模板
软件商店App开发网站模板
本地商家目录Bootstrap5模板
电影视频制作网站HTML5模板
现代信息技术初创公司HTML5模板
商业金融保险机构网站模板
游泳潜水培训公司HTML5模板
汽车保养维护企业Bootstrap5模板
求职招聘工作发布网站模板
NFT数字作品交易市场网站模板
技术IT解决方案HTML5模板
数字收藏品市场区块链网站模板
建筑艺术工厂安装企业网站模板
附近商家列表目录网站模板
商业咨询企业网站建设HTML5模板
企业顾问财务保险业务HTML5模板
企业集团公司商业网站模板
企业项目启动着陆页网站模板
应用程序软件着陆页HTML5模板
def sprider(self, title_name): """ 采集 医疗保健 https://sc.chinaz.com/moban/YiLiaoBaoJian.html 电子产品 https://sc.chinaz.com/moban/DianZiChanPin.html 电子商务 https://sc.chinaz.com/moban/DianZiShangWu.html 婚纱模板 https://sc.chinaz.com/moban/HunShaMoBan.html 电脑主机 https://sc.chinaz.com/moban/DianNaoZhuJi.html 旅游交通 https://sc.chinaz.com/moban/LvYouJiaoTong.html 体育竞技 https://sc.chinaz.com/moban/TiYuJingJi.html 娱乐休闲 https://sc.chinaz.com/moban/YuLeXiuXian.html 艺术时尚 https://sc.chinaz.com/moban/YiShuShiShang.html 建筑风光 https://sc.chinaz.com/moban/JianZhuFengGuang.html 动植食物 https://sc.chinaz.com/moban/DongZhiShiWu.html 人物家庭 https://sc.chinaz.com/moban/RenWuJiaTing.html 社会教育 https://sc.chinaz.com/moban/SheHuiJiaoYu.html 公司企业 https://sc.chinaz.com/moban/GongSiQiYe.html :return: """ if title_name == "医疗保健": self.first_column_name = "moban" self.folder_name = "HTML医疗保健模板" self.second_column_name = "YiLiaoBaoJian" elif title_name == "公司企业": self.first_column_name = "moban" self.folder_name = "HTML公司企业模板" self.second_column_name = "GongSiQiYe" elif title_name == "社会教育": self.first_column_name = "moban" self.folder_name = "HTML社会教育模板" self.second_column_name = "SheHuiJiaoYu" elif title_name == "动植食物": self.first_column_name = "moban" self.folder_name = "HTML动植食物模板" self.second_column_name = "DongZhiShiWu" elif title_name == "人物家庭": self.first_column_name = "moban" self.folder_name = "HTML人物家庭模板" self.second_column_name = "RenWuJiaTing" elif title_name == "建筑风光": self.first_column_name = "moban" self.folder_name = "HTML建筑风光模板" self.second_column_name = "JianZhuFengGuang" elif title_name == "艺术时尚": self.first_column_name = "moban" self.folder_name = "HTML艺术时尚模板" self.second_column_name = "YiShuShiShang" elif title_name == "娱乐休闲": self.first_column_name = "moban" self.folder_name = "HTML娱乐休闲模板" self.second_column_name = "YuLeXiuXian" elif title_name == "体育竞技": self.first_column_name = "moban" self.folder_name = "HTML体育竞技模板" self.second_column_name = "TiYuJingJi" elif title_name == "旅游交通": self.first_column_name = "moban" self.folder_name = "HTML旅游交通模板" self.second_column_name = "LvYouJiaoTong" elif title_name == "电脑主机": self.first_column_name = "moban" self.folder_name = "HTML电脑主机模板" self.second_column_name = "DianNaoZhuJi" elif title_name == "电子产品": self.first_column_name = "moban" self.folder_name = "HTML电子产品模板" self.second_column_name = "DianZiChanPin" elif title_name == "电子商务": self.first_column_name = "moban" self.folder_name = "HTML电子商务模板" self.second_column_name = "DianZiShangWu" BaseFrame().right("本次采集参数:日志路径:" + str(BaseFrame().LOG_PATH) + "") BaseFrame().right("本次采集参数:sprider_count=" + str(self.sprider_count) + "") BaseFrame().right("本次采集参数:title_name=" + title_name + "") BaseFrame().right("本次采集参数:second_column_name=" + self.second_column_name + "") # self.folder_name = "JS表单验证" self.sprider_category = title_name # 一级目录self.folder_name second_folder_name = str(self.sprider_count) + "个" + self.folder_name # 二级目录 self.sprider_type = second_folder_name self.merchant = int(self.sprider_start_count) // int(self.max_pager) + 1 # 起始页码用于效率采集 # 原始路径+一级目录+二级目录 self.file_path = self.save_path + os.sep + self.sprider_top_level + os.sep + self.folder_name + os.sep + second_folder_name self.save_path = self.save_path + os.sep + self.sprider_top_level + os.sep + self.folder_name + os.sep + second_folder_name + os.sep + self.folder_name BaseFrame().debug("开始采集ChinaZJL" + self.folder_name + "...") sprider_url = (self.base_url + "/{1}/{0}.html".format(self.second_column_name, self.first_column_name)) down_path = "D:\\Freedom\\Sprider\\ChinaZ\\" + self.sprider_top_level + "\\" + self.folder_name + "\\" + second_folder_name + "\\Temp\\" if os.path.exists(down_path) is True: shutil.rmtree(down_path) if os.path.exists(down_path) is False: os.makedirs(down_path) if os.path.exists(self.save_path) is True: shutil.rmtree(self.save_path) if os.path.exists(self.save_path) is False: os.makedirs(self.save_path) chrome_options = webdriver.ChromeOptions() diy_prefs = {'profile.default_content_settings.popups': 0, 'download.default_directory': '{0}'.format(down_path)} # 添加路径到selenium配置中 chrome_options.add_experimental_option('prefs', diy_prefs) chrome_options.add_argument('--headless') # 隐藏浏览器 # 实例化chrome浏览器时,关联忽略证书错误 driver = webdriver.Chrome(options=chrome_options) driver.set_window_size(1280, 800) # 分辨率 1280*800 # BaseFrame().debug("开始采集" + sprider_url) driver.get(sprider_url) # content = driver.page_source element_list = driver.find_elements(By.CLASS_NAME, "masonry-brick") # 列表页面 核心内容 box col3 ws_block masonry-brick # element_list = div_elem.find_elements(By.CLASS_NAME, 'item') # print(element_list.get_attribute('innerHTML')) laster_pager_div = driver.find_element(By.CLASS_NAME, "fenye") laster_pager_a = laster_pager_div.find_elements(By.TAG_NAME, 'a') laster_pager_url = laster_pager_a[len(laster_pager_a) - 2] page_end_number = int(laster_pager_url.text) self.page_count = self.merchant while self.page_count <= int(page_end_number): # 翻完停止 try: if self.page_count == 1: self.sprider_detail(driver, element_list, self.page_count, page_end_number, down_path) pass else: if self.haved_sprider_count == self.sprider_count: BaseFrame().debug("采集到达数量采集停止...") BaseFrame().debug("开始写文章...") self.builder_word(self.folder_name, self.word_content_list) BaseFrame().debug("文件编写完毕,请到对应的磁盘查看word文件和下载文件!") break # (self.base_url + "/sort/{0}/{1}/".format(url_index, self.page_count)) # http://soft.onlinedown.net/sort/177/2/ # https://sc.chinaz.com//jianli/xiaochengchu_2.html next_url = self.base_url + "/{2}/{0}_{1}.html".format(self.second_column_name, self.page_count, self.first_column_name) driver.get(next_url) element_list = driver.find_elements(By.CLASS_NAME, "masonry-brick") # 列表页面 核心内容 self.sprider_detail(driver, element_list, self.page_count, page_end_number, down_path) pass # print(self.page_count) self.page_count = self.page_count + 1 # 页码增加1 except Exception as e: print("sprider()执行过程出现错误:" + str(e)) sleep(1)
物流快递货运企业网站HTML模板
创意机构作品展示企业网站模板
建筑工程公司网站HTML5模板
建筑设备租赁公司网站模板
建筑施工单位网站HTML5模板
企业官网着陆页HTML5模板
商业营销多用途HTML着陆页模板
浅蓝色客户服务网站HTML模板
金融资产管理公司HTML5模板
度假村酒店预订平台网站模板
户外广告设计公司网站模板
企业网盘售卖页面HTML模板
应用程序开发设计公司网页模板
加密货币交易行业网站模板
蓝色宽屏公司服务器网站模板
精美搜索引擎优化公司网站模板
智慧洗衣服务公司网站模板
滑板生产厂家网站HTML5模板
房屋建筑设计公司HTML5模板
汽车维修服务网页HTML5模板
在线预订房间酒店网站模板
蓝色大气施工构建网站模板
钢铁制造业中小企业网站模板
创业合作融资公司网站模板
汽车出租公司HTML5网站模板
大型货运物流公司网站模板
橙色翻译服务公司网站模板
野外旅行骑行俱乐部网站模板
创意公司企业单页网站模板
通用广告设计公司网站模板
运输物流公司响应式网站模板
稳重大气的法律咨询网站模板
扁平大气酒店预定网站模板
蓝绿色响应式招聘求职网站模板
主机托管云服务网站模板
紫色域名托管服务网站模板
网站托管虚拟主机HTML5模板
响应式物流货运公司网站模板
简约干净的家居商城网站模板
紫色互联网软件公司网站模板
黄色电子设备维修官网网站模板
红色风格房地产中介网站模板
时尚首饰奢侈品公司网站模板
货运物流公司企业网站模板
法律咨询律师事务所网站模板
酷黑色模特经纪公司网站模板
响应式室内装修设计网站模板
简洁的网络科技公司网站模板
跨境电商企业网站HTML5模板
网络杂志新闻网站HTML5模板
年度最佳游戏奖官网展示模板
PUBG绝地求生游戏宣传网站模板
清新简约室内设计HTML模板
紫色出众的网络服务网站模板
金融服务公司响应式网站模板
绿色虚拟主机运营商网页模板
律师事务所网站设计响应式模板
矿业工业重工网站HTML5模板
大气制造业工业企业网站模板
蓝色游艇租赁网站HTML5模板
创意建筑设计室内装修网站模板
移动支付金融手机网站模板
import os import shutil def void_folder(path): # 访问path路径下的文件或文件夹 lst = os.listdir(path) # 打印每一层的文件或文件夹 for name in lst: # 拼接名称,得到绝对路径,判断该文件是否符合是文件夹 real_path = os.path.join(path, name) # 如果是文件夹,则打空格表示,并且递归访问下一层 if os.path.isdir(real_path): # print(name) files = os.listdir(real_path) if len(files) == 0: print("void_folder():"+name) shutil.rmtree(real_path) endindex = len(real_path) - len(name) real_path = real_path[0:endindex] void_folder(real_path) else: void_folder(real_path) # 如果不是文件夹,直接打印,不再递归访问下一层 else: #print(name) pass def void_file(dirPath): dirs = os.listdir(dirPath) # 查找该层文件夹下所有的文件及文件夹,返回列表 for file in dirs: file_full_name = dirPath + '/' + file file_ext = os.path.splitext(file_full_name)[-1] if file_ext is None or file_ext=="": continue if "rar" == str(file_ext.split(".")[1]): os.remove(file_full_name) if "zip" == str(file_ext.split(".")[1]): os.remove(file_full_name) if "gz" == str(file_ext.split(".")[1]): os.remove(file_full_name) if "tgz" == str(file_ext.split(".")[1]): os.remove(file_full_name) # 查找指定文件夹下所有相同名称的文件 def search_file(dirPath, fileName): dirs = os.listdir(dirPath) # 查找该层文件夹下所有的文件及文件夹,返回列表 for currentFile in dirs: # 遍历列表 absPath = dirPath + '/' + currentFile if os.path.isdir(absPath): # 如果是目录则递归,继续查找该目录下的文件 search_file(absPath, fileName) elif currentFile == fileName: #print(absPath) # 文件存在,则打印该文件的绝对路径 os.remove(absPath)
时尚美容美发沙龙网站模板
主机域名运营商网站HTML5模板
企业个人求职招聘网站模板
沉稳大气商务网站HTML5模板
清爽室内装修设计网站模板
蓝色网站托管虚拟主机CSS模板
电子书出售着陆页网站模板
音乐软件开发者网站模板
农场有机食品网站HTML5模板
新闻门户网站Bootstrap模板
灰色极简风设计公司网站模板
汽车零部件网站HTML5模板
物流手持终端企业网站模板
扁平云办公服务网站HTML5模板
宽屏大气房产中介网站模板
机械设备租赁企业网站模板
在线汽车租赁公司网站HTML模板
最后送大家一首诗:
山高路远坑深,
大军纵横驰奔,
谁敢横刀立马?
惟有点赞加关注大军。