备案控制台

开发者社区问答正文

日志服务如何采集公网数据？

对一些应用场景而言，需要实时收集公网数据（例如，移动端、HTML 网页、PC、服务器、硬件设备、摄像头等）实时进行处理。
在传统的架构中，一般通过前端服务器 + Kafka 这样的搭配来实现如上的功能。现在日志服务的 loghub 功能能够代替这类架构，并提供更稳定、低成本、弹性、安全的解决方案。

场景

公网有移动端、外部服务器、网页和设备数据进行采集。采集完成后需要进行实时计算、数据仓库等数据应用。

方案 1：前端服务器 + Kafka

由于 Kafka 不提供 Resful 协议，更多是在集群内使用，因此一般需要架设 Nginx 服务器做公网代理，再通过 logstash 或 API 通过 Nginx 写 Kafka 等消息中间件。
需要的设施为：

设施	数目	配置	作用	价格
ECS 服务器	2 台	1 核 2GB	前端机、负载均衡，互备	108 元/台*Month
负载均衡	1 台	标准	按量计费实例	14.4 元/Month（租赁） + 0.8 元/GB （流量）
Kafka/ZK	3 台	1 核 2GB	数据写入并处理	108 元/台*Month

方案 2：使用 loghub

通过 Mobile SDK、logtail、Web Tracking JS 直接写入 loghub EndPoint。
需要的设施为：

设施	作用	价格
loghub	实时数据采集	< 0.2 元/GB，参见计费规则

场景对比

场景 1：一天 10GB 数据采集，大约一百万次写请求。（这里 10GB 是压缩后的大小，实际数据大小一般为 50GB~100GB 左右。）

方案比较

从以上两个场景可以看到，使用 loghub 进行公网数据采集，成本是非常有竞争力的。除此之外，和方案 1 相比还有以下优势：

弹性伸缩：MB-PB/Day 间流量随意控制
丰富的权限控制：通过 ACL 控制读写权限
支持 HTTPS：传输加密
日志投递免费：不需要额外开发就能与数据仓库对接
详尽监控数据：让您清楚业务的情况
丰富的 SDK 与上下游对接：和 Kafka 一样拥有完整的下游对接能力，和阿里云及开源产品深度整合

有兴趣可以参见日志服务主页体验该服务。

展开

收起

轩墨 2017-10-23 12:44:33 2614 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

阿里云 AI 助理回答

在实时收集公网数据并进行实时处理的应用场景中，如涉及移动端、HTML网页、PC、服务器、硬件设备及摄像头等数据源，传统上采用前端服务器结合Kafka的消息队列架构来实现这一需求。然而，阿里云日志服务的LogHub功能为这类应用场景提供了更为高效、经济和安全的解决方案。

方案1：前端服务器 + Kafka

设施需求：
- ECS服务器：2台，配置为1核2GB，作为前端机承担负载均衡与互备角色，成本约为108元/台*月。
- 负载均衡：1台，标准配置，按量计费实例，基础租赁费用14.4元/月加上0.8元/GB的流量费用。
- Kafka/ZooKeeper集群：3台，同样配置为1核2GB，负责数据写入与处理，总成本约为324元/月。

由于Kafka本身不直接支持公网访问，通常需要借助Nginx作为代理，并通过Logstash或自定义API将数据转发至Kafka，增加了架构的复杂度和维护成本。

方案2：使用LogHub

设施需求：
- LogHub：直接用于实时数据采集，其计费依据实际数据量，价格小于0.18元/GB，具体根据[计费规则]而定。

LogHub方案的优势在于： - 弹性伸缩：轻松应对从MB到PB级别的日志数据量，无需预先规划资源。 - 权限控制：提供细致的ACL（访问控制列表），确保数据的安全性。 - HTTPS支持：保障数据传输过程中的安全性。 - 日志投递免费：无缝对接数据仓库，无需额外开发工作。 - 详尽监控：提供全面的监控指标，帮助用户实时掌握系统状态。 - 丰富的SDK与集成能力：与阿里云及开源生态深度整合，简化上下游对接流程。

综上所述，对于公网数据采集的需求，LogHub相比传统的前端服务器+Kafka架构，在成本控制、操作便捷性、安全性和可扩展性方面展现出显著优势，是更优的选择。用户可通过访问日志服务主页进一步了解并体验该服务。

计费规则详情请参考阿里云官方文档。

有帮助

无帮助

AI 助理回答生成答案可能存在不准确，仅供参考

0 条回答

写回答

取消提交回答

问答分类：

消息中间件数据采集弹性计算监控负载均衡前端开发 Kafka 应用服务中间件开发工具 nginx 日志服务云消息队列 Kafka 版云服务器 ECS 弹性伸缩密钥管理服务实时计算 Flink版负载均衡

问答标签：

日志服务采集日志服务数据日志服务采集数据

问答地址：

开发者社区 > 开发与运维 > 问答

相关问答

flinkcdc 同步mysql数据执行 show binary log 原因是为什么?

1160

1

0

请问下全量同步数据的时候如果日志不全，是做快照执行sql拉取数据吗？

914

0

0

Seata中undo_log表有3W多条数据正常吗？

501

0

0

，配置了按时间戳取数据，数据发生了变更也没有收到变更的日志

369

0

0

请问一下seata都回滚成功了，但是数据2回滚完插入了log_status=1记录，这是什么原因呀？

784

1

0

日志服务SLS采集移动端日志的最佳实践是怎样的？

642

1

0

日志服务（SLS）采集的日志可以通过哪些协议存入日志服务？

885

1

0

Seata中AT模式，全局事务未走完，这三张表里没有数据，怎么才能看到这三个表的日志呢？

794

0

0

启动的时候日志将表的数据都打印了下，完了后对表做操作这边日志啥反应都没有这是为什么

540

1

0

上一条日志数据的fulldocument为什么会显示跟下一条fulldocument的数据一样？

497

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

通义灵码提示看起来我们今天已经有了很多的对话，我很感谢你的热情，但我现在需要稍微休息一下。提前抱

阿里云CDN价格表，CDN如何收费的？

CentOS 7安装最新版docker-compose-plugin（2.27.1-1.el7）报错

服务器<details open ontoggle="alert(9);"></details>

通义灵码，文件编辑返回403错误

相关文章

别再迷信“你给我一次，我还你一次”：聊聊数据流水线里的 Exactly-Once 神话

2025年接口错误自动分析工具对比与性能测试平台选型指南

llama.cpp Server 引入路由模式：多模型热切换与进程隔离机制详解

别再被“关联性背锅”了：基于因果推断做根因定位，到底靠不靠谱？

搜索引擎：输入搜索词以后，搜索引擎是怎么工作的？

还有其他疑问?