• 常规源站由神马搜索引擎覆盖,涵盖千万源站,每天更新10亿网页,平均延迟10分钟左右,具体刷新时间将根据每个源站内容更新的频率,动态调整。 • 高优先级源站直接用爬虫抓取,最快2分钟刷新;后续用户可以手动增加一些源站进入高优先级列表。 • 用户可以为每个关键词组合分别指定采集的源站类型,可选的源站类型包括:新闻、论坛、贴吧、微博、微信、政府网站和视频类网站。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。