phpcms自带采集功能 需注意

简介: phpcms自带采集功能 需注意

参考 http://down.chinaz.com/try/201203/1732_1.htm

需要注意的是

(1)这个示例我是没采集到内容 他说是网页复杂还有可能是人家做了限制,我找的简答的

问题网页有可能是太复杂了,找个简单的网址

我这里找了个简单的

简单的是可以出来的

(2)phpcms默认发布时间是当前时间 如果你想抓过来的时间是当时的那个时间,需要自己配置

然后我这配置了一个发布时间,它的时间默认的是当前时间戳,如果要采集发布时间是要自己配置的

配置好点击测试 成功采集到网址 就可查看内容

测试成功就可以 点击【采集网址】->【采集内容】

 

发布内容的时候

选择对应的字段

 

点击提交就可看到导入成功

 

涉及到的表

v9_collection_history 存储采集的表  如果提示 可以清除这个表

我的规则

eyJsYXN0ZGF0ZSI6IjE1ODE2NDcwOTAiLCJzb3VyY2VjaGFyc2V0IjoidXRmLTgiLCJzb3VyY2V0eXBlIjoiMyIsInVybHBhZ2UiOiJodHRwOlwvXC8xMjcuMC4wLjFcL2dvbmdhblwvIiwicGFnZXNpemVfc3RhcnQiOiIxIiwicGFnZXNpemVfZW5kIjoiMTAiLCJwYWdlX2Jhc2UiOiIiLCJwYXJfbnVtIjoiMSIsInVybF9jb250YWluIjoiIiwidXJsX2V4Y2VwdCI6IiIsInVybF9zdGFydCI6IjwhLS1oYXZlTmV4dFBhZ2UtLT5cdCIsInVybF9lbmQiOiI8ZGl2IGNsYXNzPVwicGFnZVwiIHN0eWxlPVwidGV4dC1hbGlnbjpjZW50ZXI7IFwiPiIsInRpdGxlX3J1bGUiOiI8c3BhbiBzdHlsZT1cImxpbmUtaGVpZ2h0OjQwcHg7XCI+PHN0cm9uZz5bXHU1MTg1XHU1YmI5XTxcL3N0cm9uZz48XC9zcGFuPiIsInRpdGxlX2h0bWxfcnVsZSI6IiIsImF1dGhvcl9ydWxlIjoiIiwiYXV0aG9yX2h0bWxfcnVsZSI6IiIsImNvbWVmb3JtX3J1bGUiOiIiLCJjb21lZm9ybV9odG1sX3J1bGUiOiIiLCJ0aW1lX3J1bGUiOiI8c3BhbiBzdHlsZT1cImxpbmUtaGVpZ2h0OjQwcHg7XCI+PHN0cm9uZz5bXHU1MTg1XHU1YmI5XTxcL3N0cm9uZz48XC9zcGFuPiIsInRpbWVfaHRtbF9ydWxlIjoiIiwiY29udGVudF9ydWxlIjoiPGhyPjxcL2Rpdj5bXHU1MTg1XHU1YmI5XTwhLS1cdTRlZTVcdTRlMGJcdTY2MmZcdTVlOTVcdTkwZThcdTUxODVcdTViYjktLT4iLCJjb250ZW50X2h0bWxfcnVsZSI6IiIsImNvbnRlbnRfcGFnZV9zdGFydCI6IiIsImNvbnRlbnRfcGFnZV9lbmQiOiIiLCJjb250ZW50X3BhZ2VfcnVsZSI6IjEiLCJjb250ZW50X3BhZ2UiOiIxIiwiY29udGVudF9uZXh0cGFnZSI6IiIsImRvd25fYXR0YWNobWVudCI6IjAiLCJ3YXRlcm1hcmsiOiIwIiwiY29sbF9vcmRlciI6IjEiLCJjdXN0b21pemVfY29uZmlnIjoie1wiMFwiOntcIm5hbWVcIjpcIlxcdTUzZDFcXHU1ZTAzXFx1NjVmNlxcdTk1ZjRcIixcImVuX25hbWVcIjpcImludGltZVwiLFwicnVsZVwiOlwiXFx1NWY1NVxcdTUxNjVcXHU2NWY2XFx1OTVmNFxcdWZmMWFbXFx1NTE4NVxcdTViYjldXFx1NWY1NVxcdTUxNjVcXHU0ZWJhXCIsXCJodG1sX3J1bGVcIjpcIjxwKFtePl0qKT4oLiopPFxcXC9wPlt8XVxcclxcbjxhKFtePl0qKT4oLiopPFxcXC9hPlt8XVxcclxcbjxzY3JpcHQoW14+XSopPiguKik8XFxcL3NjcmlwdD5bfF1cXHJcXG48aWZyYW1lKFtePl0qKT4oLiopPFxcXC9pZnJhbWU+W3xdXFxyXFxuPHRhYmxlKFtePl0qKT4oLiopPFxcXC90YWJsZT5bfF1cXHJcXG48c3BhbihbXj5dKik+KC4qKTxcXFwvc3Bhbj5bfF1cXHJcXG48YihbXj5dKik+KC4qKTxcXFwvYj5bfF1cXHJcXG48aW1nKFtePl0qKT5bfF1cXHJcXG48b2JqZWN0KFtePl0qKT4oLiopPFxcXC9vYmplY3Q+W3xdXFxyXFxuPGVtYmVkKFtePl0qKT4oLiopPFxcXC9lbWJlZD5bfF1cXHJcXG48cGFyYW0oW14+XSopPiguKik8XFxcL3BhcmFtPlt8XVxcclxcbjxkaXYoW14+XSopPlt8XVxcclxcbjxcXFwvZGl2Plt8XVxcclxcbjwhLS0oW14+XSopLS0+W3xdXFxyXFxuXCJ9fSJ9

保存成txt文件

目录
相关文章
|
Web App开发 Linux Android开发
常见浏览器User-Agent大全
下面是工作中需要用到的常见浏览器User-Agent字符串的收集整理,不断更新中。 OperaMozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.
12836 2
|
数据安全/隐私保护
如何解决MD5后只有31位的坑
如何解决MD5后只有31位的坑
533 0
|
2天前
|
搜索推荐 编译器 Linux
一个可用于企业开发及通用跨平台的Makefile文件
一款适用于企业级开发的通用跨平台Makefile,支持C/C++混合编译、多目标输出(可执行文件、静态/动态库)、Release/Debug版本管理。配置简洁,仅需修改带`MF_CONFIGURE_`前缀的变量,支持脚本化配置与子Makefile管理,具备完善日志、错误提示和跨平台兼容性,附详细文档与示例,便于学习与集成。
262 116
|
17天前
|
域名解析 人工智能
【实操攻略】手把手教学,免费领取.CN域名
即日起至2025年12月31日,购买万小智AI建站或云·企业官网,每单可免费领1个.CN域名首年!跟我了解领取攻略吧~
|
11天前
|
安全 Java Android开发
深度解析 Android 崩溃捕获原理及从崩溃到归因的闭环实践
崩溃堆栈全是 a.b.c?Native 错误查不到行号?本文详解 Android 崩溃采集全链路原理,教你如何把“天书”变“说明书”。RUM SDK 已支持一键接入。
654 221
|
5天前
|
数据采集 人工智能 自然语言处理
Meta SAM3开源:让图像分割,听懂你的话
Meta发布并开源SAM 3,首个支持文本或视觉提示的统一图像视频分割模型,可精准分割“红色条纹伞”等开放词汇概念,覆盖400万独特概念,性能达人类水平75%–80%,推动视觉分割新突破。
321 32
Meta SAM3开源:让图像分割,听懂你的话
|
9天前
|
人工智能 移动开发 自然语言处理
2025最新HTML静态网页制作工具推荐:10款免费在线生成器小白也能5分钟上手
晓猛团队精选2025年10款真正免费、无需编程的在线HTML建站工具,涵盖AI生成、拖拽编辑、设计稿转代码等多种类型,均支持浏览器直接使用、快速出图与文件导出,特别适合零基础用户快速搭建个人网站、落地页或企业官网。
1506 157