• 思考与总结:扇区和磁盘的区别是什么

    簇也是操作系统弄出来的概念(不禁问,整这么多概念啥呢)这好比汉语中嘛整这么多成语,什么叔叔阿姨之类的称呼嘛呢,全部叫你不就省事了么?有的题目会问,磁盘的读写单位是?千万不要联系到操作系统层面去了...
    文章 2015-09-08 947浏览量
  • Hadoop HDFS概念学习系列之HDFS Block(八)

    什么在HDFS中要使用这么大的数据块呢?原因和在磁盘上使用大磁盘块的原理是一样的。在普通文件系统中使用较大的磁盘块,可以减少管理数据块需要的开销,如在Linux中可以减少保存在i-node中磁盘地址表中的信息链的...
    文章 2017-11-21 1158浏览量
  • 亚马逊数据专家十年经验总结:成为数据科学家的关键四...

    Karolis Urbonas:我的职业生涯从投资公司的证券分析师起步,那时候主要用的还是 Excel;之后转到银行业做商务智能(BI,即 business inelligence);再之后去做咨询;最后才来搞所谓的“数据科学”——开发预测模型...
    文章 2017-08-02 1160浏览量
  • 数仓治理:数据地图长什么样?

    数据地图长什么样 01背景讲好什么数据地图,还有从数据治理说起,很多公司的数据治理搞的就仅仅是看了几篇网上了理论文章,就开,最终不了了之。为什么?其中一个很重要的原因是没有做好数据地图。开始打仗了,...
    文章 2021-09-10 25浏览量
  • Linux buffer/cache内存占用过高

    理解cache是干什么的就可以明白清缓存必须保证cache中的数据跟对应文件中的数据一致,才能对cache进行释放。所以伴随着cache清除的行为的,一般都是系统IO飙高。因为内核要对比cache中的数据和对应硬盘文件上的数据...
    文章 2020-03-15 1054浏览量
  • 【观点】离开了信息化,大数据就是为他人作嫁衣

    因为大数据与其泛泛的去找那些比你相关性不大的数据,或者要深度挖掘才能找到弱相关的数据,不如好现在手上跟自己强相关的数据。第三,留意其他维度的数据。比如银行已经知道自己的客户用什么方式来归类了,哪个该...
    文章 2017-05-02 878浏览量
  • 什么是阿里云服务器【针对新手用户的详细解答】

    阿里云有什么用?都还不是很了解,今天由阿里云活动代金券免费领取平台“尊托云数zuntop.cn”来为大家介绍一下阿里云以及阿里云产品都是用的,我们什么时候需要用到阿里云。阿里云创立于2009年,是阿里巴巴集团...
    文章 2019-04-17 2780浏览量
  • 码农翻身讲操作系统3:硬盘与键盘的故事

    还有inode表(当然是存放文件和目录的inode 了)和真正的数据块。对了,我的磁盘分区表只有64个字节,而每个分区项占用16个字节,所以只能容纳4个分区。如果你想多于4个分区,你就需要把其中一个设为扩展分区,...
    文章 2018-02-06 1229浏览量
  • 突破Java面试(45)-高并发系统的架构设计

    数据库咋用的?就是深挖你到底是如何抗下高并发的。因为真正过高并发的人一定知道,脱离了业务的系统架构都是在纸上谈兵,真正在复杂业务场景而且还高并发的时候,那系统架构一定不是那么简单的,用个redis,用mq...
    文章 2019-07-12 4211浏览量
  • 解析业务数据的特征——《企业大数据实践路线》之三

    但是这个是很初级的一个过程,你即便把它拼出来也不代表有什么用,比较浅。它背后还有东西,是什么?第一个我们来看访问信息,访问信息里面有来源IP,有请求时间和请求地址。请求地址通过简单的清洗,就把它分析出来...
    文章 2019-01-13 1990浏览量
  • 线性资本王淮:明年人工智能泡沫将达到顶点

    在工业圈的时候,以前手下有三个KGD,这种你就用数据模型之类来干活就行了,千万不要提NOP,这种乱七八糟的各种模型,还是很多传统统计学习的方式。我最后负责的是大数据反欺诈,我不知道有多少人创业的?都是学生...
    文章 2017-08-01 942浏览量
  • 杜跃进:数据安全不仅是数据不被偷走,而是没有滥用

    甚至你可能担心存在阿里巴巴里面的数据会被其他的部门强行要走,你也不知道他干什么。我说的都是大实话,但这都是事实的情况,你可以把阿里巴巴这四个字换成任何一家公司,并不一定要很有名,并不一定要BAT,随便...
    文章 2016-07-13 3266浏览量
  • 干货|下一代数据网:数据驱动的云网链一体化

    数据的隐私,首先数据是我的,你凭什么拿去,拿去有没有好处,这个好处是不是我应该得到。这才是我们认为下一阶段大数据的核心问题。从刚刚讲的大数据和网络视角下,我们再看区块链是什么情况。首先,我们认为...
    文章 2018-09-13 1109浏览量
  • [面试]什么是堆和栈,它们在哪儿?

    不过需要一些汇编语言、操作系统、计算机组成原理的的基础,知道那几个寄存器是干什么的,要知道计算机的流水线指令工作机制,保护/恢复现场等概念。三个回复者都涉及到了操作系统中虚拟内存;在比较速度的时候,...
    文章 2014-08-19 1519浏览量
  • 如何彻底毁掉硬盘上的数据

    只要盘片没有变(如果了会留下难以清理的残渣),专家就可以相对轻松地恢复数据。Chozick 说,如今的固态硬盘和闪存存储器会更容易“溺死”,它们大多配有板载加密,也就是说设备的电路板必须解码存储芯片上的一切...
    文章 2017-05-02 1329浏览量
  • ETL学习笔记之二:ETL与BI

    无论是稠密纬合适稀疏维,无论数据块否包含事实,都必须要预留单元。星型模式的基本思想就是保持立方体的多维功能,同时也增加了小规模数据存储的灵活性。雪花模式 有时候,需要对星型模式的维度需要进行规范化,...
    文章 2017-07-03 3034浏览量
  • 数据时代的中小企业创业

    传统的办法做的话,消费者1万买的家具有4000是交租金的。高扬于是在百度首先通过搜索引擎去精准的找客流,其次是通过数据分析找到最流行的爆款。这样一个单品一个月可以把全国的需求聚集起来,做几百上千件,...
    文章 2017-04-03 975浏览量
  • Greenplum技术浅析

    最后好多人都在问:Oracle太烂了,这么好的设备,性能还这么差,我们嘛还要?呜呼哀哉,Greenplum是好,但并不“神奇”,我们不要被这些”神奇“的数据挡住了视线。 对于Greenplum,我其实也处于一知半解的...
    文章 2014-04-22 1735浏览量
  • Java中NIO和IO的比较

    NIO面向块的操作在一步中产生或者消费一个数据块。按块处理数据比按(流式的)字节处理数据要快得多,同时数据读取到一个它稍后处理的缓冲区,需要时可在缓冲区中前后移动。这就增加了处理过程中的灵活性。通俗来说,...
    文章 2017-04-26 839浏览量
  • 隐私数据开价50元/月,你卖吗?

    “从道德上来讲,消费者知道自己的数据去了哪、谁在和结果是什么都是合情合理的。Acquisti 如是说。然而,Datacoup 并不会告知消费者他们的数据去了哪,而且除了 Datacoup 还有 Twitter、Facebook 和信用卡公司...
    文章 2017-04-03 743浏览量
  • 纯JDBC系统的开发随想

    因为JDBC太基础,用的好与用不好有着天壤之别。就像一把利剑,是否对你有利要看你握着剑柄还是剑刃。着这里,我不是因为项目用了JDBC费劲而批判什么,而是要为JDBC正个身,把自己开发JDBC系统的体验与大家分享,JDBC...
    文章 2017-11-15 889浏览量
  • linux命令实践-关于inode

    dentry是用来干什么的呢?它实现了文件名和inode编号的映射。当然dentry还有其它的功能。而数据块就是存放实际数据的地方喽。我们可以看到,inode编号是存放在超级块里的,并不存放在inode里,就像文件名不存放在...
    文章 2017-11-14 990浏览量
  • HBase内部结构

    Data:数据块,每个HFile有多个Data,这个就是存放数据用的,Data是可选的,但是几乎没有HFile不包含Data的 Meta:元数据块:Meta是可选的,Meta块只有在文件关闭的时候才会写入.Meta块存储了该HFile文件的元数据信息 ...
    文章 2018-12-06 1357浏览量
  • 数据社区整理的Linux运维笔试面试题(47题)

    bin-log是干什么用的?主上100G数据,从库同步失败,差距很大,如何恢复?11.你们公司都使用什么监控,都分别来做什么?12.你维护网站的时候,出现过什么问题呢?故障如何解决呢?Linux服务配置及管理 1.请写出...
    文章 2018-06-06 5168浏览量
  • 带你入坑大数据(一)-HDFS基础概念篇

    1.NameNode全权管理数据块的复制,它周期性从集群中的每个DataNode接收心跳信号和块状态报告(blockReport),接收到心跳信号意味着该DataNode节点工作正常,块状态报告包含了该DataNode上所有数据块的列表 ...
    文章 2020-07-16 403浏览量
  • 在AWS上的架构部署与设计

    第一个服务是S3,S3大家知道干什么的对吧?对象存储,什么叫对象存储呢?区别于我们的存储,大家笔记本电脑上都有一硬盘,这个硬盘叫存储,那对象存储和存储区别是什么呢?简单来说对象存就像网盘,大家都有...
    文章 2021-08-19 1740浏览量
  • 探寻复制和粘贴的神秘国度

    PS:本文是08年发表于Cfan上的一篇知识性文章,感觉对初学者理解复制、粘贴还是有点用的,所以贴于此。本文转自windyli 51CTO博客,原文链接:http://blog.51cto.com/windyli/314776,如需转载请自行联系原作者
    文章 2017-11-08 832浏览量
  • 什么说阿里巴巴本身是云上数据中台的最佳实践

    作者:品鉴[更多内容详见数据中台官网 https://dp.alibaba.com ]数据中台门在阿里巴巴集团干什么的,由哪个部门掌管?数据中台在阿里巴巴的主要作用是什么呢?外面吹嘘这么神秘的数据中台在阿里实践的如何呢?今天小...
    文章 2019-10-15 2849浏览量
  • 【干货】张长水:图像识别与机器学习

    他们雇了几十个美工,一天到晚标数据了几年,但是数据库才几十万张图片。所以标数据是一个非常花钱的事。因此做机器学习的人就在考虑,能不能不用那么费心去标数据而把图像识别做得更好一点。比如这张图片,只要...
    文章 2017-04-03 895浏览量
  • 3年Java开发6个点搞定高并发系统面试疑惑

    那高并发绝对搞挂你的系统,你要是 redis 来承载写那肯定不行,人家是缓存,数据随时就被 LRU 了,数据格式还无比简单,没有事务支持。所以该 mysql 还得 mysql 啊。那你咋办? MQ 吧,大量的写请求灌入 MQ ...
    文章 2019-09-09 1146浏览量
1 2 3 4 ... 41 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化