终端出厂后自动化运维方案

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: 终端出厂后自动化运维方案

以往,设备不够智能,联网能力弱,所以卖出去的终端,很难运维,都是靠人力去维护。


现在乃至未来,设备越来越智能,联网能力也强,网络设施完善,流量也越来越便宜。那么本着能让数据跑路不让人跑路的宗旨,未来的设备出厂应具备一种自动化的运维手段和配套的云服务能力。像智能手机一样,没有听说卖出去的手机也需要厂家的运维人员维护吧,出厂自带一套系统服务,可以远程升级固件,自带应用商店,远程维护设备的基础服务,甚至可以选择性的收集应用日志,或者选配提供配套的云服务能力,如海康的安防类产品,除了产品本身外,就具备云服务能力。


数据也是个重要资产。有数据可以让调度更智能,合理调配资源。有数据可以让经营更高效,营收运维数据可视化。


比如车载终端数量众多,运维一直是个痛点,以往都没有引起重视。以往机器网络2G太慢且单片机性能有限,流量也贵,脱机业务多,不能把运维做到极致。现在乃至以后,机器性能也好,网络也快,流量也便宜,联机业务也多。要是能有个终端运维监控云平台服务,独立于现有业务多好。让以后出厂的终端全都接入,且能区分各个地方的终端设备,数量能支持上万台以上,独立的一套云服务,完全不影响现有业务。所有的设备出厂内置运维监控系统服务。前端可视化,监控每个地方的在运行终端数量,停运的终端数量,基本的数据可视化分析,终端的状态监控(交易统计,未传记录数目)。可基于此拓展日志自主采集,报警主动推送运维公众号,独立于平台可远程升级应用。


愿景是打造一款云运维体系,类似于手机一样出厂内置系统服务。让运营可视化,对卖出去的终端心中有数,只要机器网络是正常的,让运维彻底解放。甚至可以实现主动运维,机器有问题了主动上报,提前捕获异常信息,早于客户发现问题之前,提前把问题解决了提升用户的使用体验。或者向用户开放一些运维监控服务,数据统计分析服务,让数据变资产。通过后台的服务可远程升级,维护,数据统计分析,日志采集。即便机器不联网,通过后台监控数据分析也能发现问题。后续根据监控大数据,也可统计分析终端网络和健康情况,反馈给硬件部门优化。



大致需要实现的功能模块有:



各个模块功能介绍:


c语言日志模块:负责记录应用的日志,并写入到日志文件中。支持日志文件的切割,限制日志文件大小,每天产生一个文件,自动清理超7天的日志文件。


终端状态更新模块:记录一些必要的状态信息如终端号,未传记录数,终端当班汇总,信号状态,报警码,经纬度信息等,定时没5分钟或十分钟更新到status.json文件中。


监控服务模块:常驻设备中,负责定时间隔10分钟与后台云服务交互,读取终端记录的状态信息文件status.json文件内容,上送至后台,同时接收后台指令。


FTP文件传输模块:负责把终端产生的日志文件压缩打包,并且当收到后台响应控制命令时触发此模块上送终端的日志文件。


Golang服务模块:实现终端的状态监控,指令下发等接口服务。


公众号推送模块:当收到终端上报的有报警码时,主动推送报警信息。后台监控服务监控到设备异常时也推送报警信息。


前端UI:可展示当前运营的设备总数,在线的设备数,设备的当班情况,未传记录情况,报警记录等。





这不仅是个想法,除了前端UI部分功能待完善,其他的模块我都已经实现了。


目前仅是个人作品,利用两周左右下班后的加班时间,每晚回到家都十一二点,多亏有了点儿兴趣爱好才能坚持下来。这疫情期间周末待在家里也不停歇,除了吃饭就是在电脑旁一坐一整天,晚上要么睡不着,要么做梦都是代码,要么半夜想到问题就爬起来,翻几页书查查资料。一个人从终端干到后台,再从后台干到前端造出来了一个雏形,验证下想法。


为什么要做这件事?本来仅是个想法,能否做成也未知。同事的一句话提醒了我,做自己喜欢的事或认为有意义的事,不管结果如何,不也是一种乐趣吗?权当系统的学习锻炼了。万事开头难,难在迈出第一步,有了想法,就去干吧。没准哪天若真能够帮助现场同事减轻些运维的压力也有点儿小小的成就感。学习也可以是一种兴趣爱好。兴趣是最好的老师,最好的坚持。生活应当给自己树立一个个小目标,翻越一座座山峰,迎接一个个挑战。生活的乐趣就是有事做,做自己喜欢做的事。且个人还觉得这件事是有价值的。相信以后的终端肯定有人会效仿接入监控运维。这么干仿佛是个趋势,毕竟流量越来越便宜,设备越来越智能了嘛。有个词叫做"趋势",趋势来了即便你不行动,也会有人去做。


比如最近新出的鸿蒙系统OpenHarmony 2.0,HarmonyOS是一款“面向未来”、面向全场景的分布式操作系统,需提前为之储备些东西。要选择面向未来,不能只看到眼前的生态不健全或者弱小,或者文档资料少而选择停止不前或保持观望。也不能选择等待,等别人趟好路多分享点经验再去用。那样只会丧失先机,等真正火起来的时候再去追已经失去了机会。要努力做一个发明者,创造者而非消费者,消费者永远不可能走在前面。


要尝试着去看懂趋势。就目前来说,由于国际大环境对咱的封锁,国人唯有自强不息,重视基础科学研究,发展和打造国内生态和产业链,才不至于到处被卡脖子。好消息是无论是操作系统,半导体芯片还是光刻机,cpu架构和指令集,国产化都在进行中并且好消息不断,未来这方面的国产化会是个趋势。


以上仅是个人的一点儿思考和想法。想法可以是无边界的。毕竟未来是什么样,谁能够看得准。人的认知都是有限的,谁说的就一定对呢?往往对的是少数人。面对一个新事物,只有敢于面对挑战和困难,走在前面趟路的人才可能最终赢得胜利。这样的人往往比较固执,有所坚持,让坚信的努力变成让别人看得见。也只有这样敢于探索和创新,才能走在别人前面。最终经过实践检验和时间沉淀下来的,才是真知灼见,让我们拭目以待吧。


相关文章
|
3月前
|
机器学习/深度学习 人工智能 运维
构建高效运维体系:从自动化到智能化的演进
本文探讨了如何通过自动化和智能化手段,提升IT运维效率与质量。首先介绍了自动化在简化操作、减少错误中的作用;然后阐述了智能化技术如AI在预测故障、优化资源中的应用;最后讨论了如何构建一个既自动化又智能的运维体系,以实现高效、稳定和安全的IT环境。
84 4
|
3月前
|
运维 Linux Apache
,自动化运维成为现代IT基础设施的关键部分。Puppet是一款强大的自动化运维工具
【10月更文挑战第7天】随着云计算和容器化技术的发展,自动化运维成为现代IT基础设施的关键部分。Puppet是一款强大的自动化运维工具,通过定义资源状态和关系,确保系统始终处于期望配置状态。本文介绍Puppet的基本概念、安装配置及使用示例,帮助读者快速掌握Puppet,实现高效自动化运维。
70 4
|
2月前
|
机器学习/深度学习 运维 监控
智能化运维:从自动化到AIOps的演进之路####
本文深入探讨了IT运维领域如何由传统手工操作逐步迈向高度自动化,并进一步向智能化运维(AIOps)转型的过程。不同于常规摘要仅概述内容要点,本摘要将直接引入一个核心观点:随着云计算、大数据及人工智能技术的飞速发展,智能化运维已成为提升企业IT系统稳定性与效率的关键驱动力。文章详细阐述了自动化工具的应用现状、面临的挑战以及AIOps如何通过预测性分析和智能决策支持,实现运维工作的质变,引领读者思考未来运维模式的发展趋势。 ####
|
2月前
|
机器学习/深度学习 数据采集 人工智能
智能化运维:从自动化到AIOps的演进与实践####
本文探讨了智能运维(AIOps)的崛起背景,深入分析了其核心概念、关键技术、应用场景及面临的挑战,并对比了传统IT运维模式,揭示了AIOps如何引领运维管理向更高效、智能的方向迈进。通过实际案例分析,展示了AIOps在不同行业中的应用成效,为读者提供了对未来智能运维趋势的洞察与思考。 ####
90 1
|
2月前
|
机器学习/深度学习 数据采集 人工智能
智能运维:从自动化到AIOps的演进与实践####
本文探讨了智能运维(AIOps)的兴起背景、核心组件及其在现代IT运维中的应用。通过对比传统运维模式,阐述了AIOps如何利用机器学习、大数据分析等技术,实现故障预测、根因分析、自动化修复等功能,从而提升系统稳定性和运维效率。文章还深入分析了实施AIOps面临的挑战与解决方案,并展望了其未来发展趋势。 ####
|
2月前
|
机器学习/深度学习 数据采集 运维
智能化运维:机器学习在故障预测和自动化响应中的应用
智能化运维:机器学习在故障预测和自动化响应中的应用
64 4
|
3月前
|
机器学习/深度学习 存储 测试技术
从0到1:如何规划一套流量回放自动化测试方案
本文介绍了流量回放自动化测试的完整方法,从企业战略到交付的四个关键环节:Discovery(深度挖掘)、Define(定义目标)、Design(详细设计)和Delivery(交付与反馈)。通过这些步骤,帮助企业优化系统性能和稳定性,确保产品的高质量。
74 4
|
3月前
|
运维 jenkins 持续交付
自动化部署的魅力:如何用Jenkins和Docker简化运维工作
【10月更文挑战第7天】在现代软件开发周期中,快速且高效的部署是至关重要的。本文将引导你理解如何使用Jenkins和Docker实现自动化部署,从而简化运维流程。我们将从基础概念开始,逐步深入到实战操作,让你轻松掌握这一强大的工具组合。通过这篇文章,你将学会如何利用这些工具来提升你的工作效率,并减少人为错误的可能性。
|
3月前
|
运维 Prometheus 监控
运维中的自动化实践每月一次的系统维护曾经是许多企业的噩梦。不仅因为停机时间长,更因为手动操作容易出错。然而,随着自动化工具的引入,这一切正在悄然改变。本文将探讨自动化在IT运维中的重要性及其具体应用。
在当今信息技术飞速发展的时代,企业对系统的稳定性和效率要求越来越高。传统的手动运维方式已经无法满足现代企业的需求。自动化技术的引入不仅提高了运维效率,还显著降低了出错风险。本文通过几个实际案例,展示了自动化在IT运维中的具体应用,包括自动化部署、监控告警和故障排除等方面,旨在为读者提供一些实用的参考。
|
3月前
|
机器学习/深度学习 数据采集 运维
智能化运维:机器学习在故障预测和自动化响应中的应用
【10月更文挑战第1天】智能化运维:机器学习在故障预测和自动化响应中的应用
81 3