《智能数据时代：企业大数据战略与实战》一3.7　速度与精度的抉择-阿里云开发者社区

《智能数据时代：企业大数据战略与实战》一3.7　速度与精度的抉择

2017-05-02 1446

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

本节书摘来自华章出版社《智能数据时代：企业大数据战略与实战》一书中的第3章，第3.7节，作者 TalkingData ，更多章节内容可以访问云栖社区“华章计算机”公众号查看

3.7　速度与精度的抉择

以往的大数据分析通常需要在性能和精度之间进行折中。造成这种情况的原因是当时的技术往往需要几个小时或几天的时间来运行相应的算法，分析大规模的数据集。采用了集群处理的Hadoop解决了部分的存在问题，同时其他可以增强性能的技术也已经开发完成。但是，对于大多数普通组织而言，实时的大数据分析还只是一个梦想，这主要由于此类组织没有足够的预算扩展自己的存储和处理能力，而大数据对这两种能力则有着近乎无限的需求。
上述约束所带来的结果就是，要想快速地获得结果就必须缩小数据分析的范围，这可能会导致结果准确度的降低。而追求精度的话又不得不选择规模更大的数据集并投入更多的处理时间。
随着技术的发展和创新，选择的空间也在不断扩大。目前行业正在使用内存中处理技术来解决速度与精度无法共存的问题。该方法的原理是将待处理的数据存入易失性存储器而不是硬盘。如果使用普通的物理磁盘驱动器，我们需要读写磁盘中的所有输入和输出数据，与之相比在高速缓存中加载数据集并直接对其应用算法可以节省很多时间。

《智能数据时代：企业大数据战略与实战》一3.7　速度与精度的抉择

3.7　速度与精度的抉择

华章出版社

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

《智能数据时代：企业大数据战略与实战》一3.7 速度与精度的抉择

3.7 速度与精度的抉择

华章出版社

热门文章

最新文章

相关课程

相关电子书

《智能数据时代：企业大数据战略与实战》一3.7　速度与精度的抉择

3.7　速度与精度的抉择