阿里云日志SLS的功能:
同城冗余高可用存储,提供云上同城容灾服务能力;
- 提供机房级容灾能力:
当服务终端或灾难导致机房不可用时,提供强一致性的服务能力,可满足关键业务系统对于 RPO=0 的强需求。 - 更高的SLA可用性指标:
SLS “同城区域冗余”存储能够提供99.95%的可用性SLA指标,相比于“本地冗余存储”99.9% SLA 指标,具有更高的可用性证。 - 一键开通:
SLS“同城区域冗余”能非常方便构建云上同城容灾服务能力。采用多副本机制自动将用户数据分散存放在同城相距数十公里3个不同可用区内。
运维领域基础模型发布
- 支持Trace请求的高延时分析能力:
支持OT协议的Trace数据的高延时诊断。 - 支持指标的异常检测:
可准确识别时序指标的形态,辅助可以做好更加智能的巡检。 - 文本的分词标注:
针对日志场景,提供丰富的LogNER的能力,辅助抽取带有语义信息的日志模板。 - 支持标注能力:
用户可通过平台的标注能力,从零开始积累高质量的运维数据标签,为未来的根因诊断模型的训练提供了无限可能。
高性能查询分析引擎新升级
- 查询功能优化与性能提升:
查询支持全局纳秒有序,每秒查询百亿~千亿行日志。 - 分析性能提升:
分析性能提高100~300%,每秒处理数十亿行日志。 - 分析规模提升:
单用户最大并发提升20倍,内存使用上限提升10倍,支持更大规模、更复杂查询。
我公司的日志服务:
1、如有一个运维领域基础模型,你希望这个模型支持哪些场景的能力?
高性能查询分析引擎相关的运用,由于目前是面向旅游方面的订单日志,日志量很大,使用ES进行保存的相关日志,并且还需要定期进行删除日志,目前只保留了2个月内的日志记录。随着国内旅游业的复苏,目前日志查询也越来越慢了,如果可以支持对于热门景点订单的日志进行特殊的分析、查询的话,可以解决目前公司内存在的问题。
自动化分析检索模型的运用,如果存在特别的日志,进行报警的处理,比如直接钉钉提醒,邮件、短信提醒等功能;
全流程分析链路的功能,由于旅游订单的流程比较长,在遇到问题的时候,可能进行全链路的日志分析处理,这样可以清晰的分析出来问题的原因,以及对应哪个环节出现的问题,方便问题的排查与定位;
2、你有什么场景的日志数据,需要保存3个月以上?
订单的支付日志,财务系统的日志需要保存三个月以上的,因为这些数据的周期比较长,在遇到问题的时候,需要进行订单的日志分析。比如说订单变更操作、支付操作、退款操作、财务结算操作等等;
3、AI是否是运维人以后必须掌握的技能?
是的,随着技术的进步,AI会逐渐进入各大行业,首当其冲的应该是技术行业,因为很多的时候AI可以代替普通的程序员,AI也能代替普通的运维人员,并且比运维人员更加的智能,比如说本次SLS日志一样,很多功能都是非常实用的,也是一些运维人员需要掌握的技能(机房容灾能力,如果一个服务器挂了,可以进行容灾的处理,不至于所有的机房都会受到影响、智能分析的能力,如果出现404了或者一些cpu、内存的原因导致的错误,可以快速分析出来,已经定制好解决方案进行解决)。