终端出厂后自动化运维方案

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: 终端出厂后自动化运维方案

以往,设备不够智能,联网能力弱,所以卖出去的终端,很难运维,都是靠人力去维护。


现在乃至未来,设备越来越智能,联网能力也强,网络设施完善,流量也越来越便宜。那么本着能让数据跑路不让人跑路的宗旨,未来的设备出厂应具备一种自动化的运维手段和配套的云服务能力。像智能手机一样,没有听说卖出去的手机也需要厂家的运维人员维护吧,出厂自带一套系统服务,可以远程升级固件,自带应用商店,远程维护设备的基础服务,甚至可以选择性的收集应用日志,或者选配提供配套的云服务能力,如海康的安防类产品,除了产品本身外,就具备云服务能力。


数据也是个重要资产。有数据可以让调度更智能,合理调配资源。有数据可以让经营更高效,营收运维数据可视化。


比如车载终端数量众多,运维一直是个痛点,以往都没有引起重视。以往机器网络2G太慢且单片机性能有限,流量也贵,脱机业务多,不能把运维做到极致。现在乃至以后,机器性能也好,网络也快,流量也便宜,联机业务也多。要是能有个终端运维监控云平台服务,独立于现有业务多好。让以后出厂的终端全都接入,且能区分各个地方的终端设备,数量能支持上万台以上,独立的一套云服务,完全不影响现有业务。所有的设备出厂内置运维监控系统服务。前端可视化,监控每个地方的在运行终端数量,停运的终端数量,基本的数据可视化分析,终端的状态监控(交易统计,未传记录数目)。可基于此拓展日志自主采集,报警主动推送运维公众号,独立于平台可远程升级应用。


愿景是打造一款云运维体系,类似于手机一样出厂内置系统服务。让运营可视化,对卖出去的终端心中有数,只要机器网络是正常的,让运维彻底解放。甚至可以实现主动运维,机器有问题了主动上报,提前捕获异常信息,早于客户发现问题之前,提前把问题解决了提升用户的使用体验。或者向用户开放一些运维监控服务,数据统计分析服务,让数据变资产。通过后台的服务可远程升级,维护,数据统计分析,日志采集。即便机器不联网,通过后台监控数据分析也能发现问题。后续根据监控大数据,也可统计分析终端网络和健康情况,反馈给硬件部门优化。



大致需要实现的功能模块有:



各个模块功能介绍:


c语言日志模块:负责记录应用的日志,并写入到日志文件中。支持日志文件的切割,限制日志文件大小,每天产生一个文件,自动清理超7天的日志文件。


终端状态更新模块:记录一些必要的状态信息如终端号,未传记录数,终端当班汇总,信号状态,报警码,经纬度信息等,定时没5分钟或十分钟更新到status.json文件中。


监控服务模块:常驻设备中,负责定时间隔10分钟与后台云服务交互,读取终端记录的状态信息文件status.json文件内容,上送至后台,同时接收后台指令。


FTP文件传输模块:负责把终端产生的日志文件压缩打包,并且当收到后台响应控制命令时触发此模块上送终端的日志文件。


Golang服务模块:实现终端的状态监控,指令下发等接口服务。


公众号推送模块:当收到终端上报的有报警码时,主动推送报警信息。后台监控服务监控到设备异常时也推送报警信息。


前端UI:可展示当前运营的设备总数,在线的设备数,设备的当班情况,未传记录情况,报警记录等。





这不仅是个想法,除了前端UI部分功能待完善,其他的模块我都已经实现了。


目前仅是个人作品,利用两周左右下班后的加班时间,每晚回到家都十一二点,多亏有了点儿兴趣爱好才能坚持下来。这疫情期间周末待在家里也不停歇,除了吃饭就是在电脑旁一坐一整天,晚上要么睡不着,要么做梦都是代码,要么半夜想到问题就爬起来,翻几页书查查资料。一个人从终端干到后台,再从后台干到前端造出来了一个雏形,验证下想法。


为什么要做这件事?本来仅是个想法,能否做成也未知。同事的一句话提醒了我,做自己喜欢的事或认为有意义的事,不管结果如何,不也是一种乐趣吗?权当系统的学习锻炼了。万事开头难,难在迈出第一步,有了想法,就去干吧。没准哪天若真能够帮助现场同事减轻些运维的压力也有点儿小小的成就感。学习也可以是一种兴趣爱好。兴趣是最好的老师,最好的坚持。生活应当给自己树立一个个小目标,翻越一座座山峰,迎接一个个挑战。生活的乐趣就是有事做,做自己喜欢做的事。且个人还觉得这件事是有价值的。相信以后的终端肯定有人会效仿接入监控运维。这么干仿佛是个趋势,毕竟流量越来越便宜,设备越来越智能了嘛。有个词叫做"趋势",趋势来了即便你不行动,也会有人去做。


比如最近新出的鸿蒙系统OpenHarmony 2.0,HarmonyOS是一款“面向未来”、面向全场景的分布式操作系统,需提前为之储备些东西。要选择面向未来,不能只看到眼前的生态不健全或者弱小,或者文档资料少而选择停止不前或保持观望。也不能选择等待,等别人趟好路多分享点经验再去用。那样只会丧失先机,等真正火起来的时候再去追已经失去了机会。要努力做一个发明者,创造者而非消费者,消费者永远不可能走在前面。


要尝试着去看懂趋势。就目前来说,由于国际大环境对咱的封锁,国人唯有自强不息,重视基础科学研究,发展和打造国内生态和产业链,才不至于到处被卡脖子。好消息是无论是操作系统,半导体芯片还是光刻机,cpu架构和指令集,国产化都在进行中并且好消息不断,未来这方面的国产化会是个趋势。


以上仅是个人的一点儿思考和想法。想法可以是无边界的。毕竟未来是什么样,谁能够看得准。人的认知都是有限的,谁说的就一定对呢?往往对的是少数人。面对一个新事物,只有敢于面对挑战和困难,走在前面趟路的人才可能最终赢得胜利。这样的人往往比较固执,有所坚持,让坚信的努力变成让别人看得见。也只有这样敢于探索和创新,才能走在别人前面。最终经过实践检验和时间沉淀下来的,才是真知灼见,让我们拭目以待吧。


相关文章
|
10天前
|
运维 自然语言处理 安全
自动化运维的利器:Ansible入门与实践
【8月更文挑战第33天】在现代IT基础设施的管理中,自动化运维已成为提高效率、减少错误的关键技术。Ansible作为一款开源的自动化配置管理和应用部署工具,以其简洁性、易用性和强大的功能受到广泛欢迎。本文将介绍Ansible的基本概念、安装步骤和简单使用,通过实际案例展示其在自动化运维中的应用。
|
5天前
|
运维 Ubuntu Devops
自动化运维工具的魅力:Ansible入门
【9月更文挑战第5天】在快速变化的IT世界里,自动化运维不再是可选项,而是必需品。Ansible,一款简单却强大的自动化工具,正成为众多DevOps工程师的首选。本文将带你了解Ansible的基本概念、安装步骤以及如何编写简单的Playbook,从而开启你的自动化之旅。
54 35
|
2天前
|
存储 弹性计算 运维
自动化监控和响应ECS系统事件
阿里云提供的ECS系统事件用于记录云资源信息,如实例启停、到期通知等。为实现自动化运维,如故障处理与动态调度,可使用云助手插件`ecs-tool-event`。该插件定时获取并转化ECS事件为日志存储,便于监控与响应,无需额外开发,适用于大规模集群管理。详情及示例可见链接文档。
|
6天前
|
运维 监控 安全
python在自动化运维中的妙用分享
python在自动化运维中的妙用分享
22 8
|
6天前
|
运维 Ubuntu Linux
掌握自动化运维:使用Ansible进行服务器配置管理
【9月更文挑战第5天】本文旨在通过深入浅出的方式,介绍如何利用Ansible这一强大的自动化工具来简化和加速日常的服务器配置管理工作。文章将首先概述自动化运维的重要性,接着详细讲解Ansible的基本概念、安装过程及其在服务器配置中的应用实例。我们将通过具体的操作步骤和代码示例,展示如何使用Ansible编写任务,以及如何执行这些任务以实现批量的服务器配置。最后,文章将探讨一些高级用法,帮助读者进一步提升自动化运维的能力。
|
6天前
|
运维 监控 Devops
自动化运维之路:从脚本到DevOps
【9月更文挑战第4天】本文通过探索自动化在运维中的应用,揭示从简单的shell脚本到复杂的DevOps实践的转变过程。我们将讨论如何利用自动化工具来提升效率、减少错误并优化工作流程,同时分享一些实用的代码示例,帮助读者理解自动化运维的实际应用场景。
24 5
|
7天前
|
存储 运维 应用服务中间件
自动化运维:提升效率的秘诀
【9月更文挑战第3天】本文旨在探讨如何通过自动化运维来提高工作效率和减少人为错误,从而确保系统的高可用性和可靠性。我们将深入讨论自动化运维的核心概念、实施步骤以及面临的挑战,并配以实际代码示例,帮助读者更好地理解和应用自动化运维技术。
23 6
|
4天前
|
运维 监控 安全
自动化运维:提升效率与可靠性的现代策略
【9月更文挑战第6天】在数字化时代,自动化运维不再是可选项,而是企业保持竞争力的必需品。通过整合先进的技术和实践,自动化不仅提升了运维的效率,还增强了系统的稳定性和安全性。本文将探讨自动化运维的核心概念、实施步骤以及面临的挑战,同时提供实用的代码示例,帮助读者构建和优化自己的自动化运维体系。
12 2
|
6天前
|
运维 应用服务中间件 持续交付
自动化运维的利器:Ansible在配置管理中的应用
【9月更文挑战第4天】在现代企业中,随着服务器数量的增加和业务的复杂性提高,传统的手动运维方式已经无法满足快速、高效、稳定的业务需求。自动化运维应运而生,成为提升工作效率、减少人为错误的关键技术。本文将介绍Ansible这一自动化运维工具,通过实例展示其在配置管理中的应用,帮助读者理解如何借助Ansible简化日常运维工作,实现服务器的批量管理与自动化部署。
28 4
|
6天前
|
运维 Prometheus 监控
自动化运维工具链的构建与实践
【9月更文挑战第4天】在现代IT运维管理中,自动化工具链的搭建是提升效率、保障稳定性的关键。本文将通过一个实际案例,展示如何从零开始构建一套高效的自动化运维体系,涵盖从监控、部署到故障处理的完整流程,并分享实践中的经验教训和成效分析。
20 4

热门文章

最新文章