分享119个HTML公司企业模板,总有一款适合您
119个HTML公司企业模板下载链接:https://pan.baidu.com/s/1rjdpR4XACgnnRRPActnviA?pwd=pye8
提取码:pye8
Python采集代码下载链接:采集代码.zip - 蓝奏云
企业代理记账网站模板
企业代理记账网站模板是一款大气整洁的记账公司网站模板下载。提示:本模板调用到谷歌字体库,可能会出现页面打开比较缓慢。
蓝色手机应用设计网站模板
蓝色手机应用设计网站模板是一款适合设计公司网站模板下载。提示:本模板调用到谷歌字体库,可能会出现页面打开比较缓慢。
户外房屋建造网站模板
户外房屋建造网站模板是一款适合房地产公司网站模板下载。提示:本模板调用到谷歌字体库,可能会出现页面打开比较缓慢。
大气图书印刷企业网站模板
大气图书印刷企业网站模板是一款适合书本杂志印刷公司网站模板下载。提示:本模板调用到谷歌字体库,可能会出现页面打开比较缓慢。
import os import shutil import time from time import sleep from docx import Document from docx.shared import Inches from framework.base.BaseFrame import BaseFrame from sprider.business.DownLoad import DownLoad from sprider.business.SeleniumTools import SeleniumTools from sprider.business.SpriderTools import SpriderTools from selenium import webdriver from selenium.webdriver.common.by import By from sprider.model.SpriderEntity import SpriderEntity from sprider.access.SpriderAccess import SpriderAccess title_name = "社会教育" class ChinaZJsSelenium: base_url = "https://sc.chinaz.com/" # 采集的网址 save_path = "D:\\Freedom\\Sprider\\ChinaZ\\" sprider_count = 88 # 116+66+20 sprider_start_count = 0 word_content_list = [] folder_name = "" page_end_number = 0 max_pager = 24 # 每页的数量 haved_sprider_count = 0 # 已经采集的数量 page_count = 1 # 每个栏目开始业务content="text/html; charset=gb2312" filter_down_file = [] word_image_count = 5 # word插入图片数量 同时也是明细采集图片和描述的数量 sprider_detail_index = 0 # 明细方法采集的数量 累加 sprider_top_level = "HTML"
蓝色全球网络安全网站模板
前端框架skin网站模板
GAME游戏门户新闻网站模板
在线教育课堂精品网站模板
绿色盆栽园艺工作室网站模板
动画设计公司网站模板
白色简洁企业HTML5网站模板
淘宝海外集运公司网站模板
简洁广告公司HTML5模板
开锁公司网站模板
美元外汇金融网站模板
艺术创作公司网站模板
ins网红沙发茶几网站模板
黄色线条简洁网站模板
洗车汽车美容网站模板
房屋贷款公司官网网站模板
商业咨询公司网站模板
生活清洁器械网站模板
4款大气扁平企业网站模板
夜场酒吧设计网站模板
MOBLIE APP官网网站模板
蓝色汽车修理公司网站模板
Creativo商务企业网站模板
def sprider(self, title_name): """ 采集 医疗保健 https://sc.chinaz.com/moban/YiLiaoBaoJian.html 电子产品 https://sc.chinaz.com/moban/DianZiChanPin.html 电子商务 https://sc.chinaz.com/moban/DianZiShangWu.html 婚纱模板 https://sc.chinaz.com/moban/HunShaMoBan.html 电脑主机 https://sc.chinaz.com/moban/DianNaoZhuJi.html 旅游交通 https://sc.chinaz.com/moban/LvYouJiaoTong.html 体育竞技 https://sc.chinaz.com/moban/TiYuJingJi.html 娱乐休闲 https://sc.chinaz.com/moban/YuLeXiuXian.html 艺术时尚 https://sc.chinaz.com/moban/YiShuShiShang.html 建筑风光 https://sc.chinaz.com/moban/JianZhuFengGuang.html 动植食物 https://sc.chinaz.com/moban/DongZhiShiWu.html 人物家庭 https://sc.chinaz.com/moban/RenWuJiaTing.html 社会教育 https://sc.chinaz.com/moban/SheHuiJiaoYu.html :return: """ if title_name == "医疗保健": self.first_column_name = "moban" self.folder_name = "HTML医疗保健模板" self.second_column_name = "YiLiaoBaoJian" elif title_name == "社会教育": self.first_column_name = "moban" self.folder_name = "HTML社会教育模板" self.second_column_name = "SheHuiJiaoYu" elif title_name == "动植食物": self.first_column_name = "moban" self.folder_name = "HTML动植食物模板" self.second_column_name = "DongZhiShiWu" elif title_name == "人物家庭": self.first_column_name = "moban" self.folder_name = "HTML人物家庭模板" self.second_column_name = "RenWuJiaTing" elif title_name == "建筑风光": self.first_column_name = "moban" self.folder_name = "HTML建筑风光模板" self.second_column_name = "JianZhuFengGuang" elif title_name == "艺术时尚": self.first_column_name = "moban" self.folder_name = "HTML艺术时尚模板" self.second_column_name = "YiShuShiShang" elif title_name == "娱乐休闲": self.first_column_name = "moban" self.folder_name = "HTML娱乐休闲模板" self.second_column_name = "YuLeXiuXian" elif title_name == "体育竞技": self.first_column_name = "moban" self.folder_name = "HTML体育竞技模板" self.second_column_name = "TiYuJingJi" elif title_name == "旅游交通": self.first_column_name = "moban" self.folder_name = "HTML旅游交通模板" self.second_column_name = "LvYouJiaoTong" elif title_name == "电脑主机": self.first_column_name = "moban" self.folder_name = "HTML电脑主机模板" self.second_column_name = "DianNaoZhuJi" elif title_name == "电子产品": self.first_column_name = "moban" self.folder_name = "HTML电子产品模板" self.second_column_name = "DianZiChanPin" elif title_name == "电子商务": self.first_column_name = "moban" self.folder_name = "HTML电子商务模板" self.second_column_name = "DianZiShangWu" BaseFrame().right("本次采集参数:日志路径:" + str(BaseFrame().LOG_PATH) + "") BaseFrame().right("本次采集参数:sprider_count=" + str(self.sprider_count) + "") BaseFrame().right("本次采集参数:title_name=" + title_name + "") BaseFrame().right("本次采集参数:second_column_name=" + self.second_column_name + "") # self.folder_name = "JS表单验证" self.sprider_category = title_name # 一级目录self.folder_name second_folder_name = str(self.sprider_count) + "个" + self.folder_name # 二级目录 self.sprider_type = second_folder_name self.merchant = int(self.sprider_start_count) // int(self.max_pager) + 1 # 起始页码用于效率采集 # 原始路径+一级目录+二级目录 self.file_path = self.save_path + os.sep + self.sprider_top_level + os.sep + self.folder_name + os.sep + second_folder_name self.save_path = self.save_path + os.sep + self.sprider_top_level + os.sep + self.folder_name + os.sep + second_folder_name + os.sep + self.folder_name BaseFrame().debug("开始采集ChinaZJL" + self.folder_name + "...") sprider_url = (self.base_url + "/{1}/{0}.html".format(self.second_column_name, self.first_column_name)) down_path = "D:\\Freedom\\Sprider\\ChinaZ\\" + self.sprider_top_level + "\\" + self.folder_name + "\\" + second_folder_name + "\\Temp\\" if os.path.exists(down_path) is True: shutil.rmtree(down_path) if os.path.exists(down_path) is False: os.makedirs(down_path) if os.path.exists(self.save_path) is True: shutil.rmtree(self.save_path) if os.path.exists(self.save_path) is False: os.makedirs(self.save_path) chrome_options = webdriver.ChromeOptions() diy_prefs = {'profile.default_content_settings.popups': 0, 'download.default_directory': '{0}'.format(down_path)} # 添加路径到selenium配置中 chrome_options.add_experimental_option('prefs', diy_prefs) chrome_options.add_argument('--headless') # 隐藏浏览器 # 实例化chrome浏览器时,关联忽略证书错误 driver = webdriver.Chrome(options=chrome_options) driver.set_window_size(1280, 800) # 分辨率 1280*800 # BaseFrame().debug("开始采集" + sprider_url) driver.get(sprider_url) # content = driver.page_source element_list = driver.find_elements(By.CLASS_NAME, "masonry-brick") # 列表页面 核心内容 box col3 ws_block masonry-brick # element_list = div_elem.find_elements(By.CLASS_NAME, 'item') # print(element_list.get_attribute('innerHTML')) laster_pager_div = driver.find_element(By.CLASS_NAME, "fenye") laster_pager_a = laster_pager_div.find_elements(By.TAG_NAME, 'a') laster_pager_url = laster_pager_a[len(laster_pager_a) - 2] page_end_number = int(laster_pager_url.text) self.page_count = self.merchant while self.page_count <= int(page_end_number): # 翻完停止 try: if self.page_count == 1: self.sprider_detail(driver, element_list, self.page_count, page_end_number, down_path) pass else: if self.haved_sprider_count == self.sprider_count: BaseFrame().debug("采集到达数量采集停止...") BaseFrame().debug("开始写文章...") self.builder_word(self.folder_name, self.word_content_list) BaseFrame().debug("文件编写完毕,请到对应的磁盘查看word文件和下载文件!") break # (self.base_url + "/sort/{0}/{1}/".format(url_index, self.page_count)) # http://soft.onlinedown.net/sort/177/2/ # https://sc.chinaz.com//jianli/xiaochengchu_2.html next_url = self.base_url + "/{2}/{0}_{1}.html".format(self.second_column_name, self.page_count, self.first_column_name) driver.get(next_url) element_list = driver.find_elements(By.CLASS_NAME, "masonry-brick") # 列表页面 核心内容 self.sprider_detail(driver, element_list, self.page_count, page_end_number, down_path) pass # print(self.page_count) self.page_count = self.page_count + 1 # 页码增加1 except Exception as e: print("sprider()执行过程出现错误:" + str(e)) sleep(1)
蓝色大气机构官网网站模板
简洁园林设计师网站模板
设计印刷公司网站模板
移动出行打车公司网站模板
企业招聘找工作网站模板
灰色风格包装公司网站模板
相册摄影师作品集网站模板
北欧实木家具公司网站模板
营销代理公司网站模板
紫色4A设计公司网站模板
天蓝色CRM管理系统网站模板
汽车零件生产商网站模板
家电器械维修企业网站模板
CSS3动画商务展会企业模板
基于Bootstrap4企业网站模板
主机服务器托管网站模板
SEO排名优化公司网站模板
专业摄影公司网站模板
工业设计公司网站模板
简洁设计企业HTML5模板
跑步运动手表企业网站模板
简洁扁平化设计网站模板
紫色教育培训企业网站模板
蓝色网页设计师主页模板
世界级房产设计公司网站模板
蓝色房地产销售网站模板
创意房屋租赁业务网站模板
整洁企业官网网站模板
创意手机维修企业网站模板
仿WIN8风格摄影网站模板
网页设计工作室网站模板
咖啡馆装修公司网站模板
简洁饮料制作网站模板
铁艺家居生活网站模板
农产品销售企业网站模板
蓝色的商业咨询企业站模板
在线支付接口开发网站模板
空调电器维修企业网站模板
大气web开发公司网站模板
紫色商业管理分析网站模板
粉色婚礼策划企业官网模板
人才招聘查询网站模板
房源交易服务平台网站模板
Bootstrap金融咨询网站模板
图片广告设计公司网站模板
Airbnb民俗预定网站模板
房地产经纪公司网站模板
手机自助建站公司网站模板
家庭保险公司HTML5模板
黑色酷炫金融公司网站模板
商业计划在线HTML5网站模板
保洁钟点工服务公司网站模板
大气宽屏整洁单页网站模板
iPhoneXS手机软件官网网站模板
艺术写真摄影公司网站模板
商务外贸服务公司响应式模板
国际商务谈判公司网站模板
花园绿化养护公司网站模板
大型机械设备公司网站模板
短租民宿预订平台网站模板
通讯软件开发公司网页模板
import os import shutil def void_folder(path): # 访问path路径下的文件或文件夹 lst = os.listdir(path) # 打印每一层的文件或文件夹 for name in lst: # 拼接名称,得到绝对路径,判断该文件是否符合是文件夹 real_path = os.path.join(path, name) # 如果是文件夹,则打空格表示,并且递归访问下一层 if os.path.isdir(real_path): # print(name) files = os.listdir(real_path) if len(files) == 0: print("void_folder():"+name) shutil.rmtree(real_path) endindex = len(real_path) - len(name) real_path = real_path[0:endindex] void_folder(real_path) else: void_folder(real_path) # 如果不是文件夹,直接打印,不再递归访问下一层 else: #print(name) pass def void_file(dirPath): dirs = os.listdir(dirPath) # 查找该层文件夹下所有的文件及文件夹,返回列表 for file in dirs: file_full_name = dirPath + '/' + file file_ext = os.path.splitext(file_full_name)[-1] if file_ext is None or file_ext=="": continue if "rar" == str(file_ext.split(".")[1]): os.remove(file_full_name) if "zip" == str(file_ext.split(".")[1]): os.remove(file_full_name) if "gz" == str(file_ext.split(".")[1]): os.remove(file_full_name) if "tgz" == str(file_ext.split(".")[1]): os.remove(file_full_name) # 查找指定文件夹下所有相同名称的文件 def search_file(dirPath, fileName): dirs = os.listdir(dirPath) # 查找该层文件夹下所有的文件及文件夹,返回列表 for currentFile in dirs: # 遍历列表 absPath = dirPath + '/' + currentFile if os.path.isdir(absPath): # 如果是目录则递归,继续查找该目录下的文件 search_file(absPath, fileName) elif currentFile == fileName: #print(absPath) # 文件存在,则打印该文件的绝对路径 os.remove(absPath)
大气简洁室内设计网页模板
城市夜景工程企业网站模板
在线少儿英语外教网站模板
国外别墅销售网站模板
证券咨询服务机构网站模板
背景视差装修案例展示模板
美容彩妆培训学校网站模板
紫色欧美旅游公司网站模板
手机游戏开发公司网站模板
宽屏扁平化音乐公司网站模板
宽屏大气艺术设计公司模板
商务建筑设计公司网站模板
外贸软件开发响应式模板
蓝色IT互联网企业官网模板
外贸产品营销型网页模板
宽屏扁平化企业HTML模板
天使投资公司网站模板
商务软件开发公司网站模板
大型网络游戏公司网站模板
长租公寓企业网站模板
商务咨询业务公司网站模板
建筑工程房地产公司网站模板
滴滴出租车公司网站模板
假日旅行套餐网站模板
黄色宽屏包装设计公司网站模板
白色大气单页公司网站模板
绿色宽屏网站建设公司模板
紫色精美响应式HTML5模板
大屏幻灯培训学校网站模板
法式高端餐饮企业网站模板
游戏娱乐公司单页网站模板
最后送大家一首诗:
山高路远坑深,
大军纵横驰奔,
谁敢横刀立马?
惟有点赞加关注大军。