文档备案控制台

开发者社区问答正文

OpenSearch行业算法版aggregate子句用法（group by）

已解决

OpenSearch行业算法版aggregate子句用法（group by）

展开

收起

提个问题 2024-06-11 15:13:59 317 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

社区答人

开发者社区问答官方账号

官方回答

采纳回答
aggregate子句介绍及用法
语法：
aggregate=group_key:field, range:number1~number2, agg_fun:func1#func2, max_group:number2, agg_filter:filter_clause, max_group:number
参数介绍：
- group_key：field为要进行统计的字段名，【必选参数；field必须配置属性字段】。
- agg_fun：func可以为count()、sum(id)、max(id)、min(id)四种系统函数【必选参数】。
- range：表示分段统计，可用于分布统计，只支持单个range参数。【非必选，不支持string类型】。
- agg_filter：表示仅统计满足特定条件的文档【非必须参数】。
- agg_sampler_threshold：抽样统计的阈值【非必须参数】。
- agg_sampler_step：抽样统计的步长【非必须参数】。
- max_group：最大返回组数，默认为1000。【非必须参数】。
常见示例：
- 分别根据多个字段统计：aggregate=group_key:group_id,agg_fun:sum(price)#max(price);group_key:company_id,agg_fun:count()
抽样：aggregate=group_key:group_id,agg_fun:sum(price), agg_sampler_threshold:10000, agg_sampler_step:5
range：aggregate=group_key:group_id,agg_fun:count(),range:10~50
agg_filter使用：aggregate=group_key:group_id,agg_fun:max(hits+replies),agg_filter:create_timestamp>1423456781

注意：
在aggregate子句使用的字段都需要配置为属性字段。
统计子句中展示facet部分，需设置config子句中的format为fulljson格式。
目前暂不支持将统计后的结果二次排序或者过滤,聚合后的总数目前只能在召回的结果里自行处理聚合总数。
受引擎性能影响，aggregate统计子句仅能保证10w的召回量下的文档数统计准确，超过10w的文档数统计不保证准确。
aggregate不支持二次分组（如果想二次分组，只能自行实现）。
aggregate不支持嵌套使用，多aggreate子句是分开统计的。
opensearch支持group by，然后count*。
具体报错信息请查看：错误码文档。
2024-06-11 15:14:00

赞同展开评论

问答分类：

算法智能开放搜索 OpenSearch

问答标签：

智能开放搜索 OpenSearch算法 opensearch算法算法用法算法opensearch 智能开放搜索 OpenSearch行业算法版

问答地址：

开发者社区 > 人工智能 > 问答

关联地址：

问产品> 开放搜索 OpenSearch

相关问答

开放搜索 OpenSearch

OpenSearch行业算法版和高性能检索版如何设置向量召回相关度分数阈值

282

1

0

我们这边再填写算法备案的内容，请问一下我们OpenSearch LLM智能问答版的算法性能是多少？

279

1

0

咱们OpenSearch这边的LLM智能问答，使用的是什么大模型和模型算法？

285

1

0

OpenSearch行业算法版和高性能检索版支持将tablestore作为数据源吗

240

1

0

智能开放搜索OpenSearch行业算法版或高性能检索版设置最大返回数量

333

1

0

OpenSearch行业算法版和高性能检索版中文档数与数据库中数量不一致

221

1

0

为什么要学习算法和数据结构？

1125

1

0

数据结构和算法的算法思路有哪些？

983

1

0

数据结构中顺序表的C 语言算法一般都会研究什么呢？

1018

1

0

数据结构与算法中，快速排序的算法描述的具体内容是什么？

707

1

0

归属于问产品:

开放搜索 OpenSearch

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

阿里云服务器多少钱一年？价格贵不贵？有优惠吗？

阿里云服务器问题解答，你关心的问题都在这！

阿里云 ECS 公网 IP有什么更换技巧？

idea 插件，更新记忆规则，经常死机

总是提示您已达到配额使用上限，请升级订阅计划，以获得更多使用资源。问题反馈。但已经购买了资源

相关文章

零信任架构下的数据流转：固信加密文件扫描白名单与阿里云安全基座的联动解析

百炼网关实践：用 RocketMQ LiteTopic 让限流比降了 10 倍

全网电影信息爬取：从单机脚本到分布式采集系统的工程实践

舆情监控多平台采集，代理 IP 池怎么配才不相互污染？

校园异常行为目标检测数据集：5类别 | 目标检测

还有其他疑问?