分享90个ASP整站程序源码,总有一款适合您
90个ASP整站程序源码下载链接:https://pan.baidu.com/s/1ayYZsbS69IPkIqoslQtSew?pwd=renc
提取码:renc
Python采集代码下载链接:采集代码.zip - 蓝奏云
import os import shutil import requests from bs4 import BeautifulSoup from framework.base.BaseFrame import BaseFrame from sprider.access.SpriderAccess import SpriderAccess from sprider.plugin.SpriderTools import SpriderTools from sprider.plugin.UserAgent import UserAgent class CNSourceCoder: base_url = "http://www.downcode.com" max_pager = 10 # 每页的数量 影响再次采集的起始位置. word_image_count = 5 # word插入图片数量 同时也是明细采集图片和描述的数量 page_end_number = 0 word_content_list = [] haved_sprider_count = 0 # 已经采集的数量 sprider_detail_index = 0 # 明细方法采集的数量 累加
翱翔设计企业管理程序V3.0商业版(无功能限制)
DCMS小游戏整站程序V1.0(7781.Com)
互连在线企业全站管理系统DIY200702
虺客鲁虺网 V1.0 Beta
好而由信息港整站程序
我型我秀MYSHOW虚拟换装程序
180IT信息网 V1.1 修正版
中国安全防线全站
快乐游戏之点卡零售平台
花香盈路(E人驿站)完整美化版
一品家园 V1.0
梦可轩整站程序 V4.5
E创政府网站管理系统V3.0(税务版)
梦幻平台视频播客网
天天听吧(Asp+Sql+Access+Html)DJ站
HFWORK V2.0 中英文产品管理平台
飞扬网络整站程序1216更新版
新狐网互动城市频道(分类信息)
智能建站系统(自助建站439套模板)
QQ免费资源网简约版
WEBGM2.0游戏币交易系统SP1
运城生活网商业联盟版
互连在线韩式双语版企业网站200701
新蔡房产信息超市网 V1.1
梦塔网络全站程序 V3.0
青春魔方 Beta2
中央数据个人网站系统(中英文)
恋之永恒整站程序美化版
常蝉学校网站程序集成版
S○γγy丫中国旅游全站程序
国外风格公司企业全站-迪彩数码快印
维创互联虚拟主机系统美工强版
QZONE仿个性QQ空间
壹贰娱乐网完整版 12yule.Com
新云网站管理系统华西网域美化版(黑客风格)Version 2.1 (ACCESS 版)
香柏树网络 整站程序
多元设计政府网站管理系统精简版
广西站长站
无忧传奇官方站点程序(赤色奇迹版)
花香盈路(Hxcms) V7.6 Build 1104
短信盒子联盟程序 V2.0
恒浪HoWaveV4.05+动易2006sp4+交友MsLove3.0+嘉缘人才3.0+风华同学录2.0
恒浪网站管理系统CDO V4.05 Build 1101
FLASH动画整站程序带29659FLASH数据,完全无错版GV3.1
英达免费资源个人求职网站
绵阳家园个人主页管理系统
中国IT总舵CMS爱情版
威客程序-中国威客网 V2.0
行业贸易交易系统(B2B)
中国威客网(积分式悬赏版)
长春搜活在线--生活分类信息
幼教中心(升级版)
无忧传奇官方站点程序(紫色旋风)
JaZone(自由空间)Rc V1.0 无组件开源版
英达免费资源个人网站程序
新酷传媒3.1版本
涛霞个人主页
中华骇客联盟V2.0管理程序
梦幻平台企业网站V2.0版(介面精美)
绵阳家园企业网站管理系统V2.0
闪游吧源码
大鹏书店系统V8版
公司绩效测评系统
SupCMS V1.0 Build 20061023
老宫在线整站修复版
派乐网站管理系统Aspai V1.01 Build 1012 SQL版
完美政府网站管理系统[宽屏新城版]
久久时空门户网 V.80
QQ空间人气提升程序
农业信息网站管理系统
快乐中国数码科技有限公司
51wanche 我要玩车网整站源程序
然然主页 V3.0(找不回的感觉)
网愿科技-个人主页系统 V2.0
雨缘互动CMS2006 Build 1018 修正版
OC个人网站模板V1.0
搜狗网址导航1.0
[动易模板]啸秋中学PE2006SP3_Build20061020
UoNoo游龙传奇网站管理系统2.6[龙纹版]
世纪热线网络学院
QQ免费资源网V1.1
711商城网站程序V1.5
无忧传奇官方站点程序(魔困地下)
真爱空间网店(网上购物商城)整站程序(专业完善版)
企业网站智能管理系统美化版
亿百网络
万域网双线主机管理系统(V2版本)
IT信息网站程序
无忧传奇站点程序(绿色天堂版)
安琪儿技术中心系统
def sprider(self,sprider_name,sprider_count,start_number, pager_number,sprider_type,is_show_browse,root_path, first_column_name,second_column_name,is_record_db): """ http://www.downcode.com/sort/j_1_2_1.shtml :param sprider_name: :return: """ self.first_folder_name=sprider_type.upper() self.base_path=root_path self.first_column_name = first_column_name self.second_column_name = second_column_name self.sprider_start_count=start_number self.is_record_db=is_record_db BaseFrame().debug("开始采集[源码下载站]" + self.first_folder_name + "源码...") BaseFrame().right("本次采集参数:sprider_count(采集数量):" + str(sprider_count) + "") BaseFrame().right("本次采集参数:sprider_name(采集名称):" + sprider_name + "") sprider_url = self.base_url + "/{0}/{1}_1.shtml".format(self.first_column_name, self.second_column_name)# 根据栏目构建URL BaseFrame().debug("本次采集参数:sprider_url:" + sprider_url) self.second_folder_name = str(sprider_count) + "个" + sprider_name # 二级目录也是wordTitle self.merchant = int(self.sprider_start_count) // int(self.max_pager) + 1 # 起始页码用于效率采集 self.file_path = self.base_path + os.sep + self.first_folder_name + os.sep + self.second_folder_name BaseFrame().right("本次采集参数:file_path=" + self.file_path + "") # 浏览器的下载路径 self.down_path = self.base_path + os.sep + self.first_folder_name+ os.sep + self.second_folder_name+ "\\Temp\\" BaseFrame().right("本次采集参数:down_path=" + self.down_path + "") # First/PPT/88个动态PPT模板/动态PPT模板 self.save_path = self.base_path + os.sep + self.first_folder_name + os.sep + self.second_folder_name + os.sep + sprider_name BaseFrame().right("本次采集参数:save_path=" + self.save_path + "") if os.path.exists(self.down_path) is True: shutil.rmtree(self.down_path) if os.path.exists(self.down_path) is False: os.makedirs(self.down_path) if os.path.exists(self.save_path) is True: shutil.rmtree(self.save_path) if os.path.exists(self.save_path) is False: os.makedirs(self.save_path) response = requests.get(sprider_url, timeout=10, headers=UserAgent().get_random_header(self.base_url)) response.encoding = 'gb2312' soup = BeautifulSoup(response.text, "html5lib") #print(soup) element_list = soup.find_all('div', attrs={"class": 'j_text_sort_a'}) page_end_number = 1 page_end_url = "" page_end_title = soup.find("a", attrs={"title": '最后页'}) page_end_url = page_end_title.get("href") if page_end_url is None or page_end_url == "": page_end_number = 1 else: page_end_number = (page_end_url.split(".shtml")[0].split("_")[3]) self.page_count = self.merchant while self.page_count <= int(page_end_number): # 翻完停止 try: if self.page_count == 1: self.sprider_detail(element_list, page_end_number,sprider_count) pass else: if int(self.haved_sprider_count) == int(sprider_count): BaseFrame().debug("sprider采集到达数量采集停止...") BaseFrame().debug("开始写文章...") SpriderTools.builder_word(self.second_folder_name, self.word_content_list, self.file_path, self.word_image_count, self.first_folder_name) SpriderTools.copy_file(self.word_content_list, self.save_path, self.second_folder_name, self.file_path) SpriderTools.gen_passandtxt(self.second_folder_name, self.word_content_list, self.file_path) BaseFrame().debug("文件编写完毕,请到对应的磁盘查看word文件和下载文件!") break next_url = self.base_url + "/{0}/{1}_{2}.shtml".format(self.first_column_name, self.second_column_name, self.page_count) response = requests.get(next_url, timeout=10, headers=UserAgent().get_random_header(self.base_url)) response.encoding = 'gb2312' soup = BeautifulSoup(response.text, "html5lib") element_list = soup.find_all('div', attrs={"class": 'j_text_sort_a'}) self.sprider_detail(element_list, page_end_number,sprider_count) pass self.page_count = self.page_count + 1 # 页码增加1 except Exception as e: BaseFrame().error("sprider()执行过程出现错误:" + str(e))
最后送大家一首诗:
山高路远坑深,
大军纵横驰奔,
谁敢横刀立马?
惟有点赞加关注大军。