《Elastic Stack 实战手册》——三、产品能力——3.5 进阶篇——3.5.16. Machine learning——3.5.16.4.Data frame analytics(2) https://developer.aliyun.com/article/1227192
我们接下来的兴趣点是找到在 King County 这个地方哪些 zipcode 是比较异常的地方。这个即便是在中国的房地产中,也是非常有意思的一个兴趣点,比如我们可以发现北京的那个区域的房价比较突出:价钱比较高,或者价钱比较低。
我们接下来对数据进行 Transform。我们按照之前的方法来进行操作。显然针对我们的情况,我们选择 zipcode 作为 entity。
我们选择 zipcode 为 entity,然后按照上面的显示分别计算出来它们的 aggregations。
我们可以看到类似如上文档的索引 king-country-real-estate。
接下来我们使用 Elastic 机器学习提供的 Outlier Detection 来判定哪些 zipcode 是异常的。
《Elastic Stack 实战手册》——三、产品能力——3.5 进阶篇——3.5.16. Machine learning——3.5.16.4.Data frame analytics(4) https://developer.aliyun.com/article/1227189