3.5.16.2.Getting started
创作人:管辉俊
审稿人:胡征南
机器学习入门
Machine Learning 特性,可以分析数据并为其行为模式生成模型。面对海量数据,想靠手动操作根本不可能;使用 Elasticsearch 的机器学习特性对数据完成行为建模,轻松找出异常活动、基础设施问题和业务趋势。Machine Learning 可灵活应用于各种用例和数据集,实时对结果进行可视化。
无监督机器学习
有两种类型的分析可以推断出数据中的模式和关系,而无需培训或干预:anomaly detection异常检测和outlier detection孤立点检测。
异常检测需要时间序列数据。它构造了一个概率模型,并可以连续运行以识别发生的异常事件。模型随着时间的推移而发展;你可以利用它的洞察力来预测未来的行为。
孤立点检测不需要时间序列数据;通过分析每个数据点与其他数据点的距离以及周围点的密度,它来识别数据集中的异常点。它不会连续运行;只会生成一个数据集副本,其中每个数据点都会注释一个离群点的分数。得分表示数据点与其他数据点相比在多大程度上是异常值。
监督机器学习
有两种类型的分析的命令训练数据集:classification分类和regression回归
这两种情况下,结果都是数据集的副本,其中每个数据点都带有预测注释和经过训练的模型,你可以将其部署到新数据的预测中。
分类学习数据点之间的关系,可以预测离散的分类值,例如 DNS 请求是来自恶意域还是良性域。
回归学习数据点之间的关系,可以预测连续的数值,例如 Web 请求的响应时间。
机器学习作业
Kibana 7.x 支持四种类型的作业:
l Single-metric:数据分析仅在一个索引字段上执行。
l Multi-metric:可以对多个索引字段执行数据分析,但是,每个字段都分别进行分析。
l Advanced:可以对多个索引字段执行数据分析,提供检测器和影响者的完整配置设置。
l Population:对不常见数据的分布行为的数据分析,例如检测总体中的异常值。
《Elastic Stack 实战手册》——三、产品能力——3.5 进阶篇——3.5.16. Machine learning ——3.5.16.2.Getting started(中) https://developer.aliyun.com/article/1227257