开发者社区> 问答> 正文

日志服务的GetHistograms是什么?


GetHistograms 接口查询指定的 project 下某个 logstore 中日志的分布情况。还可以通过指定相关参数仅查询符合指定条件的日志分布情况。
当日志写入到 logstore 中,日志服务的查询接口(GetHistograms 和 GetLogs)能够查到该日志的延时因写入日志类型不同而异。日志服务按日志时间戳把日志分为如下两类:

  • 实时数据:日志中时间点为服务器当前时间点 (-180秒,900秒]。例如,日志时间为 UTC 2014-09-25 12:03:00,服务器收到时为 UTC 2014-09-25 12:05:00,则该日志被作为实时数据处理,一般出现在正常场景下。
  • 历史数据:日志中时间点为服务器当前时间点 [-7 x 86400秒, -180秒)。例如,日志时间为 UTC 2014-09-25 12:00:00,服务器收到时为 UTC 2014-09-25 12:05:00,则该日志被作为历史数据处理,一般出现在补数据场景下。

其中,实时数据写入至可查询的延时为3秒。

请求语法






请求参数

名称类型必选描述
logstorename字符串需要查询日志的 logstore 名称。
type字符串查询 logstore 数据的类型,在 GetHistograms 接口中该参数必须为 histogram。
from整型查询开始时间点(精度为秒,从 1970-1-1 00:00:00 UTC 计算起的秒数)。
to整型查询结束时间点(精度为秒,从 1970-1-1 00:00:00 UTC 计算起的秒数)。
topic字符串查询日志主题。
query字符串查询表达式。关于查询表达式的详细语法,请参考查询语法


请求头


GetHistograms 接口无特有请求头。关于日志服务 API 的公共请求头,请参考 公共请求头

响应头


GetHistograms 接口无特有响应头。关于日志服务 API 的公共响应头,请参考 公共响应头

响应元素


GetHistograms 请求成功,其响应 Body 会包括查询命中的日志数量在时间轴上的分布情况。响应结果会把您查询的时间范围进行均匀分割成若干个(1 到 60 个不等)子时间区间,并返回每个子时间区间内命中的日志条数。由于日志服务需要在限定时间内返回结果以保证实时性,每次查询只能扫描指定条数的日志量。当需要查询日志数据量非常大时,该接口的响应结果可能并不完整。所以响应元素中有专门成员表示请求返回结果是否完整。具体响应元素格式如下:
名称类型描述
progress字符串查询结果的状态。可以有 Incomplete 和 Complete 两个选值,表示结果是否完整。
count整型当前查询结果中所有日志总数。
histograms数组当前查询结果在划分的子时间区间上的分布状况,具体结构见下面的描述。

上表中的 histograms 数组中的每个元素结构如下:
名称类型描述
from整型子时间区间的开始时间点(精度为秒,从 1970-1-1 00:00:00 UTC 计算起的秒数)
to整型子时间区间的结束时间点(精度为秒,从 1970-1-1 00:00:00 UTC 计算起的秒数)
count整型当前查询结果在该子时间区间内命中的日志条数
progress字符串当前查询结果在该子时间区间内的结果是否完整,可以有 Incomplete 和 Complete 两个选值。


细节描述

  • 该接口中涉及的时间区间(无论是请求参数 from 和 to 定义的时间区间,还是返回结果中各个子时间区间)都遵循“左闭右开”原则,即该时间区间包括区间开始时间点,但不包括区间结束时间点。如果 from 和 to 的值相同,则为无效区间,函数直接返回错误。
  • 该接口的响应中子区间划分方式是一致稳定的。如果您在请求查询的时间区间不变,则响应中子区间划分结果也不会改变。
  • 如上所述,该接口一次调用必须要在限定时间内返回结果,每次查询只能扫描指定条数的日志量。如果一次请求需要处理的数据量非常大的时候,该请求会返回不完整的结果(并在返回结果中的 progress 成员标示是否完整)。如此同时,服务端会缓存 15 分钟内的查询结果。当查询请求的结果有部分被缓存命中,则服务端会在这次请求中继续扫描未被缓存命中的日志数据。为了减少您合并多次查询结果的工作量,服务端会把缓存命中的查询结果与本次查询新命中的结果合并返回给您。因此,日志服务可以让您通过以相同参数反复调用该接口来获取最终完整结果。因为您的查询涉及的日志数据量变化非常大,日志服务 API 无法预测需要调用多少次该接口而获取完整结果。所以需要您通过检查每次请求的返回结果中的 progress 成员状态值来确定是否需要继续。需要注意的是,每次重复调用该接口都会重新消耗相同数量的查询 CU。


特有错误码


GetHistograms 接口除了可能返回日志服务 API 的 通用错误码,还可能返回如下特有错误码:
HTTP 状态码(Status Code)错误码(Error Code)错误消息(Error Message)描述(Description)
404LogStoreNotExistlogstore {Name} not exist.日志库(logstore)不存在。
400InvalidTimeRangerequest time range is invalid.请求的时间区间无效。
400InvalidQueryStringquery string is invalided请求的查询字符串无效。

上表错误消息中 {name} 表示该部分会被具体的 LogstoreName 来替换。


示例


以杭州地域内名为 big-game 的 project 为例,查询该 project 内名为 app_log 的 Logstore 中,主题为 groupA 的日志分布情况。查询区间为 2014-09-01 00:00:00 到 2014-09-01 22:00:00,查询关键字是 error。

请求示例:




[font=PingFangSC, 'helvetica neue', 'hiragino sans gb', arial, 'microsoft yahei ui', 'microsoft yahei', simsun, sans-serif]在这个响应示例中,服务端把整个 Histogram 划分到两个均等的时间区间,分别为 [2014-09-01 00:00:00, 2014-09-01 11:00:00) 和 [2014-09-01 11:00:00, 2014-09-01 22:00:00)。由于您的数据量过大,第一次查询会返回不完整数据。响应结果告知您命中日志条数为 3,但整体结果不完整,仅在时间段 [2014-09-01 00:00:00 2014-09-01 11:00:00)结果完整且命中 2 条,而在另外一个时间段结果不完整但已经命中 1 条。在这个情况下,如果您希望得到完整结果,则需要重复调用上面的请求示例若干次直到整个响应中的 progress 成员值变成 Complete (例如下响应):
[font=PingFangSC, 'helvetica neue', 'hiragino sans gb', arial, 'microsoft yahei ui', 'microsoft yahei', simsun, sans-serif]

展开
收起
轩墨 2017-10-23 14:27:13 1895 0
0 条回答
写回答
取消 提交回答
问答排行榜
最热
最新

相关电子书

更多
数据采集:日志数据上传 立即下载
低代码开发师(初级)实战教程 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载