DEDE采集功能的使用 DEDE采集规则的导入与导出的方法

简介: 我们都知道,DEDECMS开发的默认系统后台自带有采集功能,本篇教程演示教你如何使用DEDE采集功能. 采集的定义: 程序按照指定的规则定向获取其他网站数据的一种方式。

我们都知道,DEDECMS开发的默认系统后台自带有采集功能,本篇教程演示教你如何使用DEDE采集功能.

采集的定义:

程序按照指定的规则定向获取其他网站数据的一种方式。
网络采集是用来批量采集网页,论坛等的内容,直接保存到数据库或发布到网站的一种工具,是一个从目标网页中摘取某些数据形成统一的本地数据库的一个过程。   这些数据本来只是在可见的网页中以文本形式存在。这个过程所需要的不仅仅是网页爬行器与网页包装器。一个复杂的数据抽取过程需要应付种种障碍,例如会话识别,HTML表单,客户端Java脚本,以及数据整合问题例如与数据集与单词集不一致的情况,以及缺失和冲突的数据。可以根据用户设定的规则自动采集原网页,获取格式网页中需要的内容。

详细内容请查阅百度百科采集定义: http://baike.baidu.com/view/267501.htm

回到重点:DEDE采集规则的导入方法  Dede教程-598080707.NET

1.登录DEDE后台,打开采集栏,点击导入采集规则,如图:

DEDE采集规则的使用与导入,导出的方法
 

2.找到已有的DEDE采集规则粘贴到上图方框里,(注意请复制完整的规则进行粘贴,不要漏掉一个字符),粘贴到了之后点确定.下面我就拿这条规则为例:http://598080707.net/4/179.html ,如下图:

(如果你不会写采集规则请直接在本站找到你想要的采集内容的采集规则进行粘贴)

DEDE采集规则:http://598080707.net/tags.php?/dede%B2%C9%BC%AF%B9%E6%D4%F2/

DEDE采集功能的使用 DEDE采集规则的导入与导出的方法
 
以上就是采集规则的导入方法了.很简单的两步,中途最容易出错的就是遗漏了规则的字母,导致采集规则不完整所以出错.
 
3.导入采集规则了之后我们再进行采集操纵了,点击采集节点管理,点击采集进行自动化采集模式.如图:
DEDE采集功能的使用 DEDE采集规则的导入与导出的方法

4.正在采集中的演示图:(注意这里采集的速度快慢都取决于你采集规则的采集内容多少来决定,请中途不要关闭浏览器,让其自动采集完成)
 
DEDE采集功能的使用 DEDE采集规则的导入与导出的方法
 

5.你采集完成之后注意右上角有个导出数据,我们点击导出数据,然后进行将采集好的内容数据导出并且自动生成页面,如图:(注:这一步是采集完了之后数据的导出与文档生成)

DEDE采集功能的使用 DEDE采集规则的导入与导出的方法

6.点击确定之后就自动开始导出采集好的数据了,这一步完成之后网站栏目就出现了你刚才采集的内容了.

DEDE采集功能的使用 DEDE采集规则的导入与导出的方法
 

到这里采集内容的教程基本就全部完成了.如果你想把采集规则分享给你的朋友的话接着请看下面的操纵:DEDE采集规则的导出方法

点击采集节点管理,点击导出配置,如图:  dede博客-598080707.NET

DEDE采集功能的使用 DEDE采集规则的导入与导出的方法
 

点击了导出配置了就如下图了:

DEDE采集功能的使用 DEDE采集规则的导入与导出的方法
 
再将以上串码原封不动的复制给你的好友即可.


帖子信息:DEDE技术吧 | 分类:Dede教程 | 本文地址:http://598080707.net/1/180.html

目录
相关文章
|
8月前
|
存储
phpcms自带采集功能 需注意
phpcms自带采集功能 需注意
35 0
|
监控 BI API
利用ZABBIX进行服务器自动巡检并导出报表
利用ZABBIX进行服务器自动巡检并导出报表
利用ZABBIX进行服务器自动巡检并导出报表
|
8月前
|
JavaScript 前端开发 网络安全
【网络安全 | 信息收集】JS文件信息收集工具LinkFinder安装使用教程
【网络安全 | 信息收集】JS文件信息收集工具LinkFinder安装使用教程
408 4
|
7月前
|
存储 安全 PHP
安全开发-PHP应用&文件管理模块&显示上传&黑白名单类型过滤&访问控制&文件管理模块&包含&上传&遍历&写入&删除&下载&安全
安全开发-PHP应用&文件管理模块&显示上传&黑白名单类型过滤&访问控制&文件管理模块&包含&上传&遍历&写入&删除&下载&安全
|
7月前
|
SQL 前端开发 PHP
php不使用Office包实现上万条数据导出表格
经过上传客户要求主副表迁出,又提出可以将某张表的数据导出excel,听着很简单,实际看数据表发现上万条数据,并且需要关联表查询相关字段,导出的表格才可以被客户看明白。 要是使用office包目前后台内存耗尽,被迫停止运行,所以想要突破百万条数据导出需要另辟它路。所以就是使用了导出CSV并非excel文件。 1、设置程序需要一直运行并设置运行内存(php提示过128M)
|
8月前
WP-AutoPostPro WordPress自动采集发布插件
WP-AutoPostPro 是目前最好用的WordPress自动采集发布插件,最大的特点是可以采集来自于任何网站的内容并自动发布到你的WordPress站点。真正做到可以采集任何网站的内容并自动发布,采集过程完全自动进行无需人工干预,并提供内容过滤、HTML标签过滤、关键词替换、自动链接、自动标签、自动下载远程图片到本地服务器、自动添加文章前缀后缀、并且可以使用微软翻译引擎将采集的文章自动翻译为各种语言进行发布。
212 0
|
前端开发 JavaScript 数据可视化
数据可视化大屏人员停留系统的开发实录(默认加载条件筛选、单击加载、自动刷新加载、异步加载数据)
数据可视化大屏人员停留系统的开发实录(默认加载条件筛选、单击加载、自动刷新加载、异步加载数据)
145 0
|
数据可视化 前端开发 API
漏刻有时数据可视化大屏常见问题(11):调整api地址解除根目录安装权限适应子目录安装
漏刻有时数据可视化大屏常见问题(11):调整api地址解除根目录安装权限适应子目录安装
101 0
|
消息中间件 监控 NoSQL
crowd-admin2.2.0版本发布啦,支持演示模式,接入cdn提升响应速度,新增echart图表展示
crowd-admin2.2.0版本发布啦,支持演示模式,接入cdn提升响应速度,新增echart图表展示
90 0

热门文章

最新文章