秒级行情推送系统实战:从触发、采集到入库的端到端架构

本文涉及的产品
实时计算 Flink 版,1000CU*H 3个月
实时数仓Hologres,5000CU*H 100GB 3个月
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
简介: 本文设计了一套秒级实时行情推送系统,涵盖触发、采集、缓冲、入库与推送五层架构,结合动态代理IP、Kafka/Redis缓冲及WebSocket推送,实现金融数据低延迟、高并发处理,适用于股票、数字货币等实时行情场景。

在金融业务中,实时行情推送 是关键能力:用户希望在 秒级 内看到股票、数字货币或大宗商品的价格变化。传统的批量爬取往往延迟较高,无法满足交易和风控的需要。本文将结合 行情业务场景,搭建一个 秒级数据更新与推送系统,并演示端到端架构。


一、系统架构图

         ┌────────────────┐
         │   触发层 (Trigger)│ ← 定时调度/交易所推送事件
         └──────┬─────────┘
                │
         ┌──────▼─────────┐
         │   采集层 (Crawler)│ ← 请求交易所行情API / 爬虫采集
         │ (代理IP + UA    )│
         └──────┬─────────┘
                │
         ┌──────▼─────────┐
         │ 缓冲层 (Buffer)  │ ← Kafka / Redis Stream
         └──────┬─────────┘
                │
         ┌──────▼─────────┐
         │ 入库层 (DB)      │ ← MySQL / Redis 缓存
         └──────┬─────────┘
                │
         ┌──────▼─────────┐
         │ 推送层 (Push)   │ ← WebSocket / 消息队列 → 用户终端
         └────────────────┘

与通用爬虫不同,行情业务的关键在于 低延迟 + 高并发,所以在采集后,数据会先进入缓冲层,再统一推送。

二、模块功能介绍

1. 触发层(Trigger)

  • 来源:定时任务(如每秒触发一次)、交易所 API WebSocket 事件。
  • 功能:保证行情数据在 秒级 被拉取。

2. 采集层(Crawler)

  • 获取 股票/币价 最新行情。
  • 使用 代理IP(爬虫代理) 防止 API 请求被限流或封禁。

3. 缓冲层(Buffer)

  • 使用 Kafka/Redis Stream 暂存行情,防止入库时拥塞。
  • 支持多消费者:一个消费者负责入库,另一个负责推送用户。

4. 入库层(DB)

  • 写入 MySQL(历史行情存储)、Redis(实时缓存)。
  • 支持前端秒级查询和分析。

5. 推送层(Push)

  • 将最新行情 秒级推送 给用户。
  • 技术手段:WebSocket / 消息队列(RabbitMQ)。

三、关键代码详解(行情采集与推送)

下面以 Python + requests + MySQL 为例,采集实时行情(模拟从交易所接口获取 BTC/USDT 最新价格),并写入数据库。

import requests
import pymysql
import time

# ====== 代理配置(亿牛云爬虫代理示例) ======
proxy_host = "proxy.16yun.cn"      # 代理域名
proxy_port = "3100"                # 代理端口
proxy_user = "16YUN"               # 用户名
proxy_pass = "16IP"                # 密码

proxies = {
   
    "http": f"http://{proxy_user}:{proxy_pass}@{proxy_host}:{proxy_port}",
    "https": f"http://{proxy_user}:{proxy_pass}@{proxy_host}:{proxy_port}"
}

# ====== 数据库配置 ======
db = pymysql.connect(
    host="localhost",
    user="root",
    password="123456",
    database="market_db",
    charset="utf8mb4"
)
cursor = db.cursor()

# ====== 采集函数(模拟获取行情API) ======
def fetch_price(symbol="BTCUSDT"):
    url = f"https://api.binance.com/api/v3/ticker/price?symbol={symbol}"
    try:
        resp = requests.get(url, proxies=proxies, timeout=5)
        data = resp.json()
        price = float(data["price"])
        return price
    except Exception as e:
        print("行情获取失败:", e)
    return None

# ====== 数据入库函数 ======
def save_to_db(symbol, price):
    sql = "INSERT INTO market_price (symbol, price, create_time) VALUES (%s, %s, NOW())"
    try:
        cursor.execute(sql, (symbol, price))
        db.commit()
        print(f"[入库成功] {symbol} 最新价格: {price}")
    except Exception as e:
        print("写库失败:", e)
        db.rollback()

# ====== 推送层(模拟,实际可用 WebSocket) ======
def push_to_client(symbol, price):
    print(f"[推送到客户端] {symbol} 最新价格 {price}")

# ====== 秒级调度(触发层) ======
symbols = ["BTCUSDT", "ETHUSDT"]

while True:
    for sym in symbols:
        price = fetch_price(sym)
        if price:
            save_to_db(sym, price)
            push_to_client(sym, price)
    time.sleep(1)  # 每秒执行一次

代码要点:

  1. 采集层 使用 交易所 API 获取实时价格。
  2. 代理IP(爬虫代理) 确保高频访问不限制。
  3. 入库层 存储行情,用于历史分析。
  4. 推送层 模拟实时推送,实际可用 WebSocket 广播

四、总结

在行情业务中,秒级更新系统 的核心目标是:

  • 触发层:秒级驱动行情采集。
  • 采集层:API + 代理IP 防止封禁。
  • 缓冲层:保障高并发稳定。
  • 入库层:保存历史+缓存实时数据。
  • 推送层:保证用户端 秒级可见行情

这种端到端架构,既能满足 高并发,又能做到 低延迟,是 行情推送、金融交易风控、实时监控 等场景的理想方案。

相关文章
|
10天前
|
弹性计算 关系型数据库 微服务
基于 Docker 与 Kubernetes(K3s)的微服务:阿里云生产环境扩容实践
在微服务架构中,如何实现“稳定扩容”与“成本可控”是企业面临的核心挑战。本文结合 Python FastAPI 微服务实战,详解如何基于阿里云基础设施,利用 Docker 封装服务、K3s 实现容器编排,构建生产级微服务架构。内容涵盖容器构建、集群部署、自动扩缩容、可观测性等关键环节,适配阿里云资源特性与服务生态,助力企业打造低成本、高可靠、易扩展的微服务解决方案。
1223 5
|
9天前
|
机器学习/深度学习 人工智能 前端开发
通义DeepResearch全面开源!同步分享可落地的高阶Agent构建方法论
通义研究团队开源发布通义 DeepResearch —— 首个在性能上可与 OpenAI DeepResearch 相媲美、并在多项权威基准测试中取得领先表现的全开源 Web Agent。
1199 87
|
10天前
|
云栖大会
阿里云云栖大会2025年9月24日开启,免费申请大会门票,速度领取~
2025云栖大会将于9月24-26日举行,官网免费预约畅享票,审核后短信通知,持证件入场
1786 13
|
19天前
|
人工智能 运维 安全
|
3天前
|
资源调度
除了nrm-pm,还有哪些工具可以管理多个包管理器的源?
除了nrm-pm,还有哪些工具可以管理多个包管理器的源?
233 127
|
3天前
|
前端开发
Promise的then方法返回的新Promise对象有什么特点?
Promise的then方法返回的新Promise对象有什么特点?
174 2