一款分布式爬虫管理平台,支持多种语言和框架

简介: 项目介绍Crawlab —— 一个基于 Golang 的分布式爬虫管理平台,支持Python、NodeJS、Go、Java、PHP 等多种编程语言以及多种爬虫框架。主要功能:

项目介绍

Crawlab —— 一个基于 Golang 的分布式爬虫管理平台,支持PythonNodeJSGoJavaPHP 等多种编程语言以及多种爬虫框架。

主要功能:

1719476020579.jpg

项目截图

登录页

1719476062236.jpg

主页

1719476087904.jpg

节点

1719476100792.jpg

项目

1719476134951.jpg

1719476151435.jpg

爬虫

1719476186010.jpg

1719476201328.jpg

1719476217142.jpg

1719476242122.jpg

1719476279762.jpg

任务

1719476288546.jpg

1719476309377.jpg

1719476318870.jpg

1719476328974.jpg

插件

1719476340136.jpg

快速上手

最快安装 Crawlab 的方式是 Docker.推荐使用 Docker Compose.

1、创建配置文件并命名为 docker-compose.yml

version: '3.3'
services:
  master:
    image: crawlabteam/crawlab
    container_name: crawlab_master
    environment:
      CRAWLAB_NODE_MASTER: "Y"
      CRAWLAB_MONGO_HOST: "mongo"
    ports:
      - "8080:8080"
    depends_on:
      - mongo
  mongo:
    image: mongo:4.2

2、一键启动 Crawlab

docker-compose up -d

3、浏览器访问

http://IP:8080

这是最小化配置的 Crawlab,支持体验大多数功能,但是不建议在生产环境中配置,生产环境部署 Crawlab 可参考官方文档。


Crawlab 适用于网路爬虫工程师、运维工程师、数据分析师等,是一款功能强大的爬虫平台!更多的使用功能,可自行部署体验~

项目地址:https://github.com/crawlab-team/crawlab
在线体验:https://demo.crawlab.cn/#/home
在线文档:https://docs.crawlab.cn/zh/guide/
相关文章
|
26天前
|
数据采集 中间件 开发者
Scrapy爬虫框架-自定义中间件
Scrapy爬虫框架-自定义中间件
45 1
|
26天前
|
数据采集 中间件 Python
Scrapy爬虫框架-通过Cookies模拟自动登录
Scrapy爬虫框架-通过Cookies模拟自动登录
47 0
|
1天前
|
机器学习/深度学习 并行计算 Java
谈谈分布式训练框架DeepSpeed与Megatron
【11月更文挑战第3天】随着深度学习技术的不断发展,大规模模型的训练需求日益增长。为了应对这种需求,分布式训练框架应运而生,其中DeepSpeed和Megatron是两个备受瞩目的框架。本文将深入探讨这两个框架的背景、业务场景、优缺点、主要功能及底层实现逻辑,并提供一个基于Java语言的简单demo例子,帮助读者更好地理解这些技术。
10 2
|
22天前
|
存储 开发框架 .NET
C#语言如何搭建分布式文件存储系统
C#语言如何搭建分布式文件存储系统
57 2
|
22天前
|
分布式计算 Hadoop
Hadoop-27 ZooKeeper集群 集群配置启动 3台云服务器 myid集群 zoo.cfg多节点配置 分布式协调框架 Leader Follower Observer
Hadoop-27 ZooKeeper集群 集群配置启动 3台云服务器 myid集群 zoo.cfg多节点配置 分布式协调框架 Leader Follower Observer
34 1
|
2月前
|
数据采集 分布式计算 MaxCompute
MaxCompute 分布式计算框架 MaxFrame 服务正式商业化公告
MaxCompute 分布式计算框架 MaxFrame 服务于北京时间2024年09月27日正式商业化!
64 3
|
2月前
|
负载均衡 监控 Dubbo
分布式框架-dubbo
分布式框架-dubbo
|
22天前
|
存储 SQL 消息中间件
Hadoop-26 ZooKeeper集群 3台云服务器 基础概念简介与环境的配置使用 架构组成 分布式协调框架 Leader Follower Observer
Hadoop-26 ZooKeeper集群 3台云服务器 基础概念简介与环境的配置使用 架构组成 分布式协调框架 Leader Follower Observer
37 0
|
26天前
|
数据采集 中间件 数据挖掘
Scrapy 爬虫框架(一)
Scrapy 爬虫框架(一)
39 0
|
26天前
|
数据采集 XML 前端开发
Scrapy 爬虫框架(二)
Scrapy 爬虫框架(二)
38 0

热门文章

最新文章