带你读《Elastic Stack 实战手册》之60:——3.5.16.4.Data frame analytics(2)

本文涉及的产品
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
简介: 带你读《Elastic Stack 实战手册》之60:——3.5.16.4.Data frame analytics(2)


《Elastic Stack 实战手册》——三、产品能力——3.5 进阶篇——3.5.16. Machine learning——3.5.16.4.Data frame analytics(1) https://developer.aliyun.com/article/1227193



Outlier Detection 展示

 

使用一个真实的例子来进行演示。我们可以到地址House Sales in King County, USA | Kaggle下载。这是一个在美国 King County 地区的房屋销售真实数据。一旦下载完数据,我们可以使用 Kibana 来把数据导入:

image.png


image.png


我们选择解压缩文件中的 kc_house_data.csv 文件:

image.png


image.png


我们把索引的名字取为 king-county-house-prices。我们在摄入时,会发现 ingest pipeline 会自动帮我们把数值进行转换,并创建一个叫做 location 的字段。它里面包含有文档中的经纬度。点击上面的 Import 按钮:

image.png


image.png

image.png


这样,我们就成功地创建了一个叫做 king-county-house-prices 的索引。我们点击上面的按钮,这样我们可以在 Discover 的页面中进行查看:

image.png


很显然这不是一个时序的数据。在这个页面,我们可以查看这个数据集的各个字段,比如面积,多少个 bed rooms,多少个 bath rooms 地理位置信息等。

 

在进行下面的操作之前,我们先来创建一个运行时字段 bedrooms_per_bath,它表示一个

bathroom 对应于多少个 bedrooms。这对于有些客户来说,也是一个比较感兴趣的参数。打开 Kibana:

image.png


image.png

image.png

我们把如下的脚本填入到 Define script 框中:

if(doc['bathrooms'].value == 0) {
  emit(0);
} else {
    emit((double)doc['bedrooms'].value/(double)doc['bathrooms'].value);
}

点击 Save 按钮。这样我们就生成了一个叫做 bedrooms_per_bath 的动态字段。


image.png



《Elastic Stack 实战手册》——三、产品能力——3.5 进阶篇——3.5.16. Machine learning——3.5.16.4.Data frame analytics(3) https://developer.aliyun.com/article/1227191

相关实践学习
使用阿里云Elasticsearch体验信息检索加速
通过创建登录阿里云Elasticsearch集群,使用DataWorks将MySQL数据同步至Elasticsearch,体验多条件检索效果,简单展示数据同步和信息检索加速的过程和操作。
ElasticSearch 入门精讲
ElasticSearch是一个开源的、基于Lucene的、分布式、高扩展、高实时的搜索与数据分析引擎。根据DB-Engines的排名显示,Elasticsearch是最受欢迎的企业搜索引擎,其次是Apache Solr(也是基于Lucene)。 ElasticSearch的实现原理主要分为以下几个步骤: 用户将数据提交到Elastic Search 数据库中 通过分词控制器去将对应的语句分词,将其权重和分词结果一并存入数据 当用户搜索数据时候,再根据权重将结果排名、打分 将返回结果呈现给用户 Elasticsearch可以用于搜索各种文档。它提供可扩展的搜索,具有接近实时的搜索,并支持多租户。
相关文章
|
机器学习/深度学习 安全 测试技术
带你读《Elastic Stack 实战手册》之60:——3.5.16.4.Data frame analytics(1)
带你读《Elastic Stack 实战手册》之60:——3.5.16.4.Data frame analytics(1)
109 0
|
机器学习/深度学习 索引
带你读《Elastic Stack 实战手册》之60:——3.5.16.4.Data frame analytics(3)
带你读《Elastic Stack 实战手册》之60:——3.5.16.4.Data frame analytics(3)
|
机器学习/深度学习 Ubuntu 数据挖掘
带你读《Elastic Stack 实战手册》之60:——3.5.16.4.Data frame analytics(4)
带你读《Elastic Stack 实战手册》之60:——3.5.16.4.Data frame analytics(4)
103 0
|
存储 SQL NoSQL
带你读《Elastic Stack 实战手册》之37:——3.4.2.18.Denormalizing / flattening data
带你读《Elastic Stack 实战手册》之37:——3.4.2.18.Denormalizing / flattening data
125 0
|
监控 API 调度
带你读《Elastic Stack 实战手册》之54:——3.5.13.Transform (3)
带你读《Elastic Stack 实战手册》之54:——3.5.13.Transform (3)
122 0
|
存储 监控 数据挖掘
带你读《Elastic Stack 实战手册》之54:——3.5.13.Transform (1)
带你读《Elastic Stack 实战手册》之54:——3.5.13.Transform (1)
168 0
|
机器学习/深度学习 API 索引
带你读《Elastic Stack 实战手册》之54:——3.5.13.Transform (4)
带你读《Elastic Stack 实战手册》之54:——3.5.13.Transform (4)
136 0
|
SQL 安全 API
带你读《Elastic Stack 实战手册》之54:——3.5.13.Transform (2)
带你读《Elastic Stack 实战手册》之54:——3.5.13.Transform (2)
153 0
|
机器学习/深度学习 运维 安全
带你读《Elastic Stack 实战手册》之59:——3.5.16.3.Anomaly detection(2)
带你读《Elastic Stack 实战手册》之59:——3.5.16.3.Anomaly detection(2)
118 0
|
机器学习/深度学习 运维 API
带你读《Elastic Stack 实战手册》之59:——3.5.16.3.Anomaly detection(3)
带你读《Elastic Stack 实战手册》之59:——3.5.16.3.Anomaly detection(3)
110 0