分享120个HTML公司企业模板,总有一款适合您
120个HTML公司企业模板下载链接:https://pan.baidu.com/s/1tnjnNX_YXdJqenCUIdipIA?pwd=evlp
提取码:evlp
Python采集代码下载链接:采集代码.zip - 蓝奏云
艺术建筑设计公司HTML5模板
艺术建筑设计公司HTML5模板是一款适合创意艺术建筑设计公司网站模板下载。提示:本模板调用到谷歌字体库,可能会出现页面打开比较缓慢。
紫色活动演出专题网页模板
紫色活动演出专题网页模板是一款适合演唱会演出机构网站模板下载。提示:本模板调用到谷歌字体库,可能会出现页面打开比较缓慢。
海外资金管理平台网站模板
海外资金管理平台网站模板是一款适合企业公司类网站模板下载。提示:本模板调用到谷歌字体库,可能会出现页面打开比较缓慢。
卡通可爱冰淇淋网站模板
卡通可爱冰淇淋网站模板是一款适合冰淇淋蛋糕制作网站模板下载。提示:本模板调用到谷歌字体库,可能会出现页面打开比较缓慢。
import os import shutil import time from time import sleep from docx import Document from docx.shared import Inches from framework.base.BaseFrame import BaseFrame from sprider.business.DownLoad import DownLoad from sprider.business.SeleniumTools import SeleniumTools from sprider.business.SpriderTools import SpriderTools from selenium import webdriver from selenium.webdriver.common.by import By from sprider.model.SpriderEntity import SpriderEntity from sprider.access.SpriderAccess import SpriderAccess title_name = "社会教育" class ChinaZJsSelenium: base_url = "https://sc.chinaz.com/" # 采集的网址 save_path = "D:\\Freedom\\Sprider\\ChinaZ\\" sprider_count = 88 # 116+66+20 sprider_start_count = 0 word_content_list = [] folder_name = "" page_end_number = 0 max_pager = 24 # 每页的数量 haved_sprider_count = 0 # 已经采集的数量 page_count = 1 # 每个栏目开始业务content="text/html; charset=gb2312" filter_down_file = [] word_image_count = 5 # word插入图片数量 同时也是明细采集图片和描述的数量 sprider_detail_index = 0 # 明细方法采集的数量 累加 sprider_top_level = "HTML"
Smart智能手表互联网网站模板
海景房度假酒店网站模板
集团企业官网html5整站模板
蓝色电工维修企业网站模板
蓝色应用程序展示网页面模板
出租车服务公司网站模板
网站服务器托管商单页模板
移动应用APP宣传网页模板
宽屏大气发型设计网站模板
精品互联网公司响应式模板
人才招聘猎头公司网站模板
胭脂口红化妆品公司网站模板
商务投资公司HTML5模板
创意房屋设计公司网站模板
投资管理公司官网网站模板
世界巡回演唱会票务专题模板
酒店式公寓出售网站模板
女生美容护肤品网站模板
紫色家居装饰公司网站模板
动画幻灯Awe7商业网站模板
安卓手机应用APP网站模板
网站运营数据指标网站模板
国际时政要闻门户网站模板
互联网云平台公司网站模板
大图旅行企业框架网站模板
MOBILE手机响应式网站模板
绿色环保外贸服务公司模板
蓝色大图办公行政企业模板
健身房加盟企业网站模板
高端专业单反相机企业模板
黑色大气设计企业CSS3模板
投资管理公司网站模板
金银首饰企业官网网站模板
游戏制作公司官网网站模板
def sprider(self, title_name): """ 采集 医疗保健 https://sc.chinaz.com/moban/YiLiaoBaoJian.html 电子产品 https://sc.chinaz.com/moban/DianZiChanPin.html 电子商务 https://sc.chinaz.com/moban/DianZiShangWu.html 婚纱模板 https://sc.chinaz.com/moban/HunShaMoBan.html 电脑主机 https://sc.chinaz.com/moban/DianNaoZhuJi.html 旅游交通 https://sc.chinaz.com/moban/LvYouJiaoTong.html 体育竞技 https://sc.chinaz.com/moban/TiYuJingJi.html 娱乐休闲 https://sc.chinaz.com/moban/YuLeXiuXian.html 艺术时尚 https://sc.chinaz.com/moban/YiShuShiShang.html 建筑风光 https://sc.chinaz.com/moban/JianZhuFengGuang.html 动植食物 https://sc.chinaz.com/moban/DongZhiShiWu.html 人物家庭 https://sc.chinaz.com/moban/RenWuJiaTing.html 社会教育 https://sc.chinaz.com/moban/SheHuiJiaoYu.html :return: """ if title_name == "医疗保健": self.first_column_name = "moban" self.folder_name = "HTML医疗保健模板" self.second_column_name = "YiLiaoBaoJian" elif title_name == "社会教育": self.first_column_name = "moban" self.folder_name = "HTML社会教育模板" self.second_column_name = "SheHuiJiaoYu" elif title_name == "动植食物": self.first_column_name = "moban" self.folder_name = "HTML动植食物模板" self.second_column_name = "DongZhiShiWu" elif title_name == "人物家庭": self.first_column_name = "moban" self.folder_name = "HTML人物家庭模板" self.second_column_name = "RenWuJiaTing" elif title_name == "建筑风光": self.first_column_name = "moban" self.folder_name = "HTML建筑风光模板" self.second_column_name = "JianZhuFengGuang" elif title_name == "艺术时尚": self.first_column_name = "moban" self.folder_name = "HTML艺术时尚模板" self.second_column_name = "YiShuShiShang" elif title_name == "娱乐休闲": self.first_column_name = "moban" self.folder_name = "HTML娱乐休闲模板" self.second_column_name = "YuLeXiuXian" elif title_name == "体育竞技": self.first_column_name = "moban" self.folder_name = "HTML体育竞技模板" self.second_column_name = "TiYuJingJi" elif title_name == "旅游交通": self.first_column_name = "moban" self.folder_name = "HTML旅游交通模板" self.second_column_name = "LvYouJiaoTong" elif title_name == "电脑主机": self.first_column_name = "moban" self.folder_name = "HTML电脑主机模板" self.second_column_name = "DianNaoZhuJi" elif title_name == "电子产品": self.first_column_name = "moban" self.folder_name = "HTML电子产品模板" self.second_column_name = "DianZiChanPin" elif title_name == "电子商务": self.first_column_name = "moban" self.folder_name = "HTML电子商务模板" self.second_column_name = "DianZiShangWu" BaseFrame().right("本次采集参数:日志路径:" + str(BaseFrame().LOG_PATH) + "") BaseFrame().right("本次采集参数:sprider_count=" + str(self.sprider_count) + "") BaseFrame().right("本次采集参数:title_name=" + title_name + "") BaseFrame().right("本次采集参数:second_column_name=" + self.second_column_name + "") # self.folder_name = "JS表单验证" self.sprider_category = title_name # 一级目录self.folder_name second_folder_name = str(self.sprider_count) + "个" + self.folder_name # 二级目录 self.sprider_type = second_folder_name self.merchant = int(self.sprider_start_count) // int(self.max_pager) + 1 # 起始页码用于效率采集 # 原始路径+一级目录+二级目录 self.file_path = self.save_path + os.sep + self.sprider_top_level + os.sep + self.folder_name + os.sep + second_folder_name self.save_path = self.save_path + os.sep + self.sprider_top_level + os.sep + self.folder_name + os.sep + second_folder_name + os.sep + self.folder_name BaseFrame().debug("开始采集ChinaZJL" + self.folder_name + "...") sprider_url = (self.base_url + "/{1}/{0}.html".format(self.second_column_name, self.first_column_name)) down_path = "D:\\Freedom\\Sprider\\ChinaZ\\" + self.sprider_top_level + "\\" + self.folder_name + "\\" + second_folder_name + "\\Temp\\" if os.path.exists(down_path) is True: shutil.rmtree(down_path) if os.path.exists(down_path) is False: os.makedirs(down_path) if os.path.exists(self.save_path) is True: shutil.rmtree(self.save_path) if os.path.exists(self.save_path) is False: os.makedirs(self.save_path) chrome_options = webdriver.ChromeOptions() diy_prefs = {'profile.default_content_settings.popups': 0, 'download.default_directory': '{0}'.format(down_path)} # 添加路径到selenium配置中 chrome_options.add_experimental_option('prefs', diy_prefs) chrome_options.add_argument('--headless') # 隐藏浏览器 # 实例化chrome浏览器时,关联忽略证书错误 driver = webdriver.Chrome(options=chrome_options) driver.set_window_size(1280, 800) # 分辨率 1280*800 # BaseFrame().debug("开始采集" + sprider_url) driver.get(sprider_url) # content = driver.page_source element_list = driver.find_elements(By.CLASS_NAME, "masonry-brick") # 列表页面 核心内容 box col3 ws_block masonry-brick # element_list = div_elem.find_elements(By.CLASS_NAME, 'item') # print(element_list.get_attribute('innerHTML')) laster_pager_div = driver.find_element(By.CLASS_NAME, "fenye") laster_pager_a = laster_pager_div.find_elements(By.TAG_NAME, 'a') laster_pager_url = laster_pager_a[len(laster_pager_a) - 2] page_end_number = int(laster_pager_url.text) self.page_count = self.merchant while self.page_count <= int(page_end_number): # 翻完停止 try: if self.page_count == 1: self.sprider_detail(driver, element_list, self.page_count, page_end_number, down_path) pass else: if self.haved_sprider_count == self.sprider_count: BaseFrame().debug("采集到达数量采集停止...") BaseFrame().debug("开始写文章...") self.builder_word(self.folder_name, self.word_content_list) BaseFrame().debug("文件编写完毕,请到对应的磁盘查看word文件和下载文件!") break # (self.base_url + "/sort/{0}/{1}/".format(url_index, self.page_count)) # http://soft.onlinedown.net/sort/177/2/ # https://sc.chinaz.com//jianli/xiaochengchu_2.html next_url = self.base_url + "/{2}/{0}_{1}.html".format(self.second_column_name, self.page_count, self.first_column_name) driver.get(next_url) element_list = driver.find_elements(By.CLASS_NAME, "masonry-brick") # 列表页面 核心内容 self.sprider_detail(driver, element_list, self.page_count, page_end_number, down_path) pass # print(self.page_count) self.page_count = self.page_count + 1 # 页码增加1 except Exception as e: print("sprider()执行过程出现错误:" + str(e)) sleep(1)
手机app单页HTML5模板
钢铁制造业企业网站模板
蓝色比特货币贷款网站模板
大件物流运输公司网站模板
动态视频背景旅游公司模板
互联网设计工作室官网模板
斜纹线条设计企业网站模板
影视动画后期制作企业模板
摩登大厦科技公司网站模板
天然游泳池景区网站模板
夕阳红大气公司网站模板
手机app应用开发公司网站模板
渐变绿色APP设计公司模板
Metro响应式框架HTML5模板下载
摄影器械公司网站模板
灰白色创意设计公司网站模板
橙色玻璃公司网站模板
城市规划设计公司网站模板
浅蓝色拍卖公司网站模板
紫色葡萄种植网站模板
医疗管理公司网站模板
暗色风格企业官网网站模板
土建施工设计公司网站模板
骑马爱好者CSS3网站模板
可切换背景主题企业网站模板
宽屏创业公司网站模板
宽屏商业合作公司网站模板
房产中介官网Bootstrap模板
保洁家政服务公司网站模板
宽屏互联网设计公司网站模板
免费网站自助建站系统模板
宽屏大气公司团队官网模板
简洁白色VPS销售网站模板
排版印刷行业公司网站模板
宽屏商务谈判企业网站模板
国际金融理财网站模板
创意室内设计Bootstrap模板
企业创意联系方式网页模板
别墅游泳池设计公司网站模板
商业咨询公司HTML模板
室内装修设计网站静态模板
洗发水公司HTML5网站模板
橘红色企业公司网站模板
橙色手机应用设计网站模板
浅蓝色企业CSS3网站模板
别墅物业管理公司网站模板
soho写字楼租赁企业模板
Bootstrap4互联网公司网站模板
软件开发项目企业官网模板
创意边框线条企业网站模板
手机UI设计行业网站模板
家居装饰公司网站模板
教育科技类创业公司网站模板
商业办公楼租赁网站模板
企业产品介绍窄屏网站模板
企业协作软件开发网站模板
水管维修上门服务网站模板
互联网科技媒体网站模板
绿色主题公司网站模板
国际货运公司网站模板
地质勘察公司网站模板
智能摄像头公司网站模板
大气简洁家居用品网站模板
人群定位研究公司网站模板
咖啡色西装商务网站模板
国外宽屏装修公司网站模板
商业代理公司单页网站模板
import os import shutil def void_folder(path): # 访问path路径下的文件或文件夹 lst = os.listdir(path) # 打印每一层的文件或文件夹 for name in lst: # 拼接名称,得到绝对路径,判断该文件是否符合是文件夹 real_path = os.path.join(path, name) # 如果是文件夹,则打空格表示,并且递归访问下一层 if os.path.isdir(real_path): # print(name) files = os.listdir(real_path) if len(files) == 0: print("void_folder():"+name) shutil.rmtree(real_path) endindex = len(real_path) - len(name) real_path = real_path[0:endindex] void_folder(real_path) else: void_folder(real_path) # 如果不是文件夹,直接打印,不再递归访问下一层 else: #print(name) pass def void_file(dirPath): dirs = os.listdir(dirPath) # 查找该层文件夹下所有的文件及文件夹,返回列表 for file in dirs: file_full_name = dirPath + '/' + file file_ext = os.path.splitext(file_full_name)[-1] if file_ext is None or file_ext=="": continue if "rar" == str(file_ext.split(".")[1]): os.remove(file_full_name) if "zip" == str(file_ext.split(".")[1]): os.remove(file_full_name) if "gz" == str(file_ext.split(".")[1]): os.remove(file_full_name) if "tgz" == str(file_ext.split(".")[1]): os.remove(file_full_name) # 查找指定文件夹下所有相同名称的文件 def search_file(dirPath, fileName): dirs = os.listdir(dirPath) # 查找该层文件夹下所有的文件及文件夹,返回列表 for currentFile in dirs: # 遍历列表 absPath = dirPath + '/' + currentFile if os.path.isdir(absPath): # 如果是目录则递归,继续查找该目录下的文件 search_file(absPath, fileName) elif currentFile == fileName: #print(absPath) # 文件存在,则打印该文件的绝对路径 os.remove(absPath)
焊接专业生产厂家网站模板
柠檬美容产品企业网站模板
财务代理公司网站模板
海口海运公司网站模板
宽屏创意设计企业网站模板
马尔代夫旅游公司网站模板
木材建筑公司网站模板
简白创意家居网站模板
微信运营数据分析网站模板
创意网站设计HTML5模板
宽屏房地产企业网站模板
美容美颜化妆品公司网站模板
企业大客户网站模板下载
灰黑色多区块企业网站模板
网络营销公司HTML5模板
最后送大家一首诗:
山高路远坑深,
大军纵横驰奔,
谁敢横刀立马?
惟有点赞加关注大军。