备案控制台

开发者社区

开发者社区云计算文章正文

ets和dets的效率建议

2017-05-18 1273

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

ets表的底层是由哈希表实现的,不过ordered_set例外,它是由平衡二叉树实现的。所以不管是插入还是查找,set的效率要比ordered_set高.采用set还是ordered_set取决于你的需求，当你需要一个有序的集合时，显然应当采用ordered_set模式。

duplicate_bag要比bag的效率要高, 因为bag要和原来的记录比较是否有相同的记录已经插入. 如果数据量很大,相同的记录越多,bag的效率就越差.

一张ets表是由创建它的进程所拥有, 当此进程调用ets:delete或者进程终止的时候, ets表就会被删除.

一般情况下, 插入一个元组到一张ets表中, 所有代表这个元组的结构都会被从process的堆栈中,复制到ets表中; 当查找一条记录时, 结果tuple从ets表中复制到进程的堆栈中。

但是large binaries却不是这样! 它们被存入自已所拥有的off-heap area中。这个区域可以被多个process,ets表,和binaries所共享。它由引用计数的垃圾回收策略管理, 这个策略会跟踪到底有多少个process/ets表/binaries引用了这个large binaries. 如果引用数为0的话, 此大型二进制数据就会被垃圾回收掉.

看起来很复杂, 实际结论就是: 两进程间发送包含大型binary数据的消息其实费用很低, 往ets表插入binary类型元组也很划算。我们应该尽

文章转自庄周梦蝶，原文发布时间 2007-09-27

boxti

目录

相关文章

cheems~

|

4月前

|

存储缓存关系型数据库

海量数据去重的hash，bitmap与布隆过滤器Bloom Filter

海量数据去重的hash，bitmap与布隆过滤器Bloom Filter

cheems~

53 1 1

路飞H

|

6月前

|

存储数据采集缓存

海量数据去重的Hash、bitmap、BloomFilter、分布式一致性hash

海量数据去重的Hash、bitmap、BloomFilter、分布式一致性hash

路飞H

97 1 1

三分钟热度的鱼

|

3月前

|

分布式计算大数据 Java

maxcompute函数问题之数据量较大经常OOM如何解决

MaxCompute函数包括内置函数和自定义函数（UDF），它们用于在MaxCompute平台上执行数据处理和分析任务；本合集将介绍MaxCompute函数的使用方法、函数编写和优化技巧，以及常见的函数错误和解决途径。

三分钟热度的鱼

57 3 3

我也要当昏君

|

4月前

|

存储缓存关系型数据库

海量数据去重hash与布隆过滤器

海量数据去重hash与布隆过滤器

我也要当昏君

19 0 0

时间不会赖着不走

|

11月前

|

人工智能

ES聚合中的Filter Bucket(过滤桶)详解

ES聚合中的Filter Bucket(过滤桶)详解

时间不会赖着不走

440 0 0

小小工匠

|

12月前

|

算法数据挖掘索引

白话Elasticsearch47-深入聚合数据分析之Cardinality Aggs-cardinality算法之优化内存开销以及HLL算法

白话Elasticsearch47-深入聚合数据分析之Cardinality Aggs-cardinality算法之优化内存开销以及HLL算法

小小工匠

117 0 0

小小工匠

|

12月前

|

数据挖掘

白话Elasticsearch53-深入聚合数据分析之Collect Model_bucket优化机制：深度优先、广度优先

白话Elasticsearch53-深入聚合数据分析之Collect Model_bucket优化机制：深度优先、广度优先

小小工匠

51 0 0

小小工匠

|

12月前

|

数据挖掘

白话Elasticsearch49-深入聚合数据分析之 Percentile Ranks Aggregation-percentiles rank以及网站访问时延SLA统计

白话Elasticsearch49-深入聚合数据分析之 Percentile Ranks Aggregation-percentiles rank以及网站访问时延SLA统计

小小工匠

60 0 0

wu@55555

|

存储

Elastic实战: 通过bucket_sort针对聚合后结果实现分页、排序

elaticsearch中实现聚合操作十分常见，同时es本身存储的数据量一般都比较大，因此聚合结果数量通常都比较多，所以针对聚合结果进行分页，也是非常常见的需求

wu@55555

307 0 0

Elastic实战: 通过bucket_sort针对聚合后结果实现分页、排序

yf7ofoc6z6jaq

ODPS_数据倾斜查看key分布的通用方案_200628

odpssql数据倾斜

yf7ofoc6z6jaq

615 0 0

热门文章

最新文章

订票系统不再瘫痪阿里云确认与12306合作

29.4. Maatkit Essential command-line utilities for MySQL

hdu 2051 Bitset （java）

sqlplus格式的使用

想上威胁情报？先搞明白这五个问题吧

kbmmw 中XML 操作入门

kotlin 语言入门指南(一)--基础语法

LINUX 硬连接和软连接

Android常用工具类封装---SharedPreferencesUtil

What are TCHAR, WCHAR, LPSTR, LPWSTR, LPCTSTR (etc.)?

如何本地安装AFFiNE并将服务发布至公网实现团队远程访问协作

【Linux-14】进程地址空间＆虚拟空间＆页表——原理＆知识点详解

如何在CentOS7一键安装宝塔面板并实现固定地址访问内网宝塔进行管理

【Mysql】在多表查询过程中如果已经起了别名，就不能通过表名限定字段

Windows文件搜索神器Everything安装配置结合内网穿透实现公网查询本地文件

【Web 前端】 jQuery 里的 ID 选择器和 class 选择器有何不同？

CentOS安装MeterSphere并实现无公网IP远程访问本地测试平台

【Web 前端】网页上有 5 个div元素，如何使用JQ来选择它们？

本地MinIO存储服务通过Java程序结合cpolar实现远程连接上传文件

【Web 前端】jQuery 库中的 $() 是什么？

相关电子书

更多

低代码开发师（初级）实战教程

冬季实战营第三期：MySQL数据库进阶实战

阿里巴巴DevOps 最佳实践手册

下一篇

2024年阿里云免费云服务器及学生云服务器申请教程参考