自建使用隧道代理全教程,太难?阿布云快代理小象代理的隧道代理用谁的?

本文涉及的产品
Redis 开源版,标准版 2GB
推荐场景:
搭建游戏排行榜
云数据库 Tair(兼容Redis),内存型 2GB
简介: 在信息技术飞速发展的今天,通过部署隧道代理可增强网络通讯的安全性,并简化数据采集过程中的代理IP使用。本文将介绍如何部署隧道代理,包括选择付费代理IP、安装必要的库(如 requests)、搭建隧道并使用 Redis 管理代理IP,以及使用 OpenResty 实现代理IP的自动转发。此外,还推荐了青果网络提供的隧道代理服务及其优势。

在信息技术飞速发展的今天,通过部署隧道代理,可以实现对数据流的加密隧道化,从而增强网络通讯的整体安全性,也可以0代码接入大量使用隧道代理IP,极大简化数据采集过程中的使用代理IP的过程。

不过隧道代理技术相对而言还是会更难一些,成本也更高,所以目前市面上的代理IP服务提供商有这项服务的不多,所以今天,我们就来讨论一下,要如何部署隧道代理,以便我们日常使用。

前期准备

准备一波可以用的代理IP,免费的不建议啦,2024了,不会还有人去用免费的吧。

随便挑一家量大实惠的代理IP服务提供商都行啊:

随便挑,OK?你自己看上的就行。

老规矩了,安装requests库:

pip install requests

接着就进入我们的重点:搭建隧道

如前面,我用的是青果网络的代理IP,具体你们可以替换成你们自己买的API地址。

import requests
import time
proxy_api_url = 'https://api.qg.net.com/getip?appid=YOUR_ID&appkey=YOUR_KEY&num=1&proxy_type=http'
proxy_server = 'PROXY_IP'
proxy_port = PROXY_PORT
target_url = '目标网站'
def get_and_use_proxy():
    while True:
        try:
            response = requests.get(proxy_api_url)
            proxy_json = response.json()
            proxy = proxy_json[0]['proxy']
            response = requests.get(target_url, proxies={'http': f'http://{proxy_server}:{proxy_port}'})
    
            if response.status_code == 200:
                print(response.text)
            else:
                print(f'Request failed with status code: {response.status_code}')
        except Exception as e:
            print(f'Error: {str(e)}')
        time.sleep(10)
proxy_thread = threading.Thread(target=get_and_use_proxy)
proxy_thread.start()

同时,记得用 Redis 的 Hash 这个数据结构周期性访问url,拉取当前最新可用的HTTP代理。

部分代码如下:

import yaml
import time
import json
import redis
import datetime
import requests
 
 
class ProxyManager:
    def __init__(self):
        self.config = self.read_config()
        self.redis_config = self.config['redis']
        self.client = redis.Redis(host=self.redis_config['host'],
                                  password=self.redis_config['password'],
                                  port=self.redis_config['port'])
        self.instance_dict = {}
 
    def run(self):
        while True:
            live_ips = self.read_ip()
            pool_ips = [x.decode() for x in self.client.hgetall(self.redis_config['key'])]
            self.delete_ip(live_ips, pool_ips)
            self.add_new_ips(live_ips, pool_ips)
            time.sleep(40)
 
 
if __name__ == '__main__':
    manager = ProxyManager()
    manager.run()

我们最好确保这波从url拉下来的代理IP是有效的,可以自己设置程序检查筛出,不具体说了,过。

接下来就是设置代理IP自动转发这一过程,我们可以使用 OpenResty 帮我们实现。

部分代码展示:

worker_processes  16; 
error_log /usr/local/openresty/nginx/logs/error.log;  
events {
    worker_connections 1024;
}
 
 
stream {
    log_format tcp_proxy '$remote_addr [$time_local] '
                         '$protocol $status $bytes_sent $bytes_received '
                         '$session_time "$upstream_addr" '
                         '"$upstream_bytes_sent" "$upstream_bytes_received" "$upstream_connect_time"';
    access_log /usr/local/openresty/nginx/logs/access.log tcp_proxy;
    open_log_file_cache off;
 
    upstream backend{
        server 127.0.0.2:1101;
        balancer_by_lua_block {
            local balancer = require "ngx.balancer"
            local host = ""
            local port = 0
            host = ngx.ctx.proxy_host
            port = ngx.ctx.proxy_port
            local ok, err = balancer.set_current_peer(host, port)
            if not ok then
                ngx.log(ngx.ERR, "failed to set the peer: ", err)
            end
        }
    }
 
 
    server {
        preread_by_lua_block{
 
            local redis = require("resty.redis")
            local redis_instance = redis:new()
            redis_instance:set_timeout(3000)
            local rhost = "123.45.67.89"
            local rport = 6739
            local rpass = "abcdefg"
            local rkey = "proxy:pool"
            local ok, err = redis_instance:connect(rhost, rport)
            ngx.log(ngx.ERR, "1111111 ", ok, " ", err)
 
            
        }
       listen 0.0.0.0:9976; 
       proxy_connect_timeout 3s;
       proxy_timeout 10s;
       proxy_pass backend; 
    }
}

接着我们用Docker 来启动它,再执行命令和运行就完事了。

隧道代理总体搭建过程就是如此了。当然实际应用中,我们大部分还是会更倾向于购买代理IP服务提供商的隧道代理。限于大规模隧道代理技术问题,目前市面上有这项服务的提供商还不多。我现在使用的是青果网络家的隧道代理,使用下来总体而言还是可以的:

还会提供数据看板:

看了很多家隧道代理的价格以后,不得不说,不是阿布云快代理这种隧道代理IP服务提供商买不起,而是青果网络这种更具有性价比。

说一嘴,他们家还有一个隧道代理的隐藏入口,就这么水灵灵的放在了短效代理这边:

13.png

看着还挺实在的,有需要的朋友们可以自己去了解去测试啦。

相关文章
|
XML 数据采集 数据挖掘
python教程|如何批量从大量异构网站网页中获取其主要文本?
今天我们就一起来看看,如何利用Python从大量异构网站中批量获取其主要文本的方法。
有HTTP代理池子,要怎么快速搭建隧道代理?| 纯技术分享
实际工作中我们基本都是直接用有隧道代理服务提供商的产品的。
|
数据采集 数据安全/隐私保护 UED
芝麻代理快代理神龙代理天启代理阿布云极光代理?…选代理IP避开这几点
随着代理IP在互联网中的作用愈发重要,其不仅提升了用户体验和隐私保护,还在数据安全、网络爬虫效率、市场研究及内容分发等方面产生了深远影响。然而,如何选择合适的代理IP仍困扰许多人。本文将探讨选择代理IP时应注意的关键点:IP数量并非越多越好,关键在于纯净度与可用率;需关注带宽与速度;不能仅看价格,还需综合考量实际使用效果。通过实际测试,才能找到最适合的服务商。
|
数据采集
芝麻代理、快代理、神龙代理、小象代理…如何挑选适合的代理IP?
本文介绍了如何选择适合项目需求的代理IP服务。首先,需明确具体应用场景和需求,不同场景对代理IP的要求各异。其次,选择合适的代理类型,如HTTP、HTTPS或SOCKS5。稳定性和速度是核心要素,需关注代理IP的稳定性指标和网络延迟。成本方面,应综合考量性价比,并进行实际测试。最后,选择提供优质服务支持的供应商,以确保问题能够及时解决。通过这些步骤,可以找到最适合项目的代理IP服务。
|
11月前
|
数据采集
急急急急,代理IP行业头部芝麻代理释放重大讯号!
芝麻代理IP近期退出市场,这对代理IP行业产生了巨大影响。面对这一变化,各公司需重新寻找替代方案。在挑选新的代理IP服务商时,可从响应速度、可用率、稳定性及带宽等方面进行测试。通过编写相关代码并记录测试结果,最终选择符合自身需求的服务商。以下是部分测试代码示例,帮助大家更好地进行评估与选择。
|
数据采集 中间件 定位技术
新手爬虫er必刷!如何使用代理IP全攻略!
在爬虫开发中,代理IP是规避IP封锁和请求频率限制的重要工具,通过分散请求压力并模拟不同地理位置,提高数据抓取稳定性和成功率。本文详细介绍了代理IP的基本概念、选择服务的关键因素、获取及使用方法,包括Python中的Requests库和Scrapy框架的具体应用,以及IP管理与轮换策略,帮助新手掌握代理IP的使用技巧。
|
9月前
|
数据采集 存储 XML
python实战——使用代理IP批量获取手机类电商数据
本文介绍了如何使用代理IP批量获取华为荣耀Magic7 Pro手机在电商网站的商品数据,包括名称、价格、销量和用户评价等。通过Python实现自动化采集,并存储到本地文件中。使用青果网络的代理IP服务,可以提高数据采集的安全性和效率,确保数据的多样性和准确性。文中详细描述了准备工作、API鉴权、代理授权及获取接口的过程,并提供了代码示例,帮助读者快速上手。手机数据来源为京东(item.jd.com),代理IP资源来自青果网络(qg.net)。
|
11月前
|
人工智能
芝麻系(芝麻/品易/太阳/极光代理)退出市场,用户何去何从?
在信息爆炸时代,代理IP服务变得不可或缺。然而,近期芝麻代理等大型服务商的退出,引发了市场动荡。本文探讨了如何在众多代理IP服务中挑选合适的服务商,包括比较价格与技术、试用代理IP、调研厂商实力、关注服务质量和客户支持,以及检查是否支持隧道代理技术等方面。这些方法有助于找到稳定可靠的代理IP服务提供商。
|
数据采集 人工智能 监控
动态代理IP有哪些应用场景?要怎么挑选适合自己的?
本文介绍了动态代理IP在人工智能、舆情洞察、市场研究及数据采集等业务场景中的应用,并详细探讨了挑选优质动态代理IP的关键因素,包括稳定性、速度、安全性、价格及客户服务。通过综合考量这些因素,希望能帮助读者更好地理解和运用动态代理IP,推动业务发展。