• 闭环、沉淀、持续的企业级数据赋能体系

    数据银行采集平台(U-SDC)重点解决以上几个核心问题,使用户埋点可见、控、管,为用户埋点推荐合适的优秀方案,使用户埋点能够智能调试和验证,大幅降低埋点采集的成本,从而最终达成数据质量的根本性提升,...
    文章 2019-12-19 1532浏览量
  • 闭环、沉淀、持续的企业级数据赋能体系

    数据银行采集平台(U-SDC)重点解决以上几个核心问题,使用户埋点可见、控、管,为用户埋点推荐合适的优秀方案,使用户埋点能够智能调试和验证,大幅降低埋点采集的成本,从而最终达成数据质量的根本性提升,...
    文章 2020-03-02 1987浏览量
  • mongodb数据结构学习1-增删改查

    find命令两个可选参数,criteria为查询条件,projection为返回的字段,如果不传入条件数据返回该集合的所有文档。修改文档-update命令 update命令可以更新指定文档的特定字段值,也可以替换整个文档,如果更新...
    文章 2015-06-28 807浏览量
  • SQL Server 2008 数据挖掘的概念

    与以下关系图的突出显示相同,数据挖掘过程的第一步就是明确定义业务问题,并考虑解答该问题的方法。该步骤包括分析业务需求,定义问题的范围,定义计算模型所使用的度量,以及定义数据挖掘项目的特定目标。这些任务...
    文章 2009-03-02 865浏览量
  • 直播报名|回到科技的初心,一同探寻数字时代的新未来

    未来将会出现全新的二八法则,分布式将成为主流。集中式和分布式再也不是二一,更像是一种包含关系。未来分布式将包含集中式,因为集中式能够解决的问题,分布式一样能够解决,反之则不然。那么,作为全新一代原生...
    文章 2020-09-09 215浏览量
  • 数据库基础及实践技术——SQL ...关系数据库规范化理论

    为什么会出现以上种种操作异常呢?因为这个关系模式没有设计好,在它的某些属性之间存在着“不良”的函数依赖。如何改造这个关系模式?克服以上种种问题,是我们这里要解决的问题,也是我们讨论函数依赖的原因。解决...
    文章 2017-08-01 878浏览量
  • 数据分析师面试题攻略

    数据从哪儿来,所数据哪些字段是必要的,如何描述这些数据等。对数据的初步了解可以帮助分析数据的可用性和实用性,减少返工造成的资源浪费。(3)数据准备 数据准备是指对已确定的基本数据进行必要的转换、...
    文章 2015-06-10 2758浏览量
  • 从0到1建立基于大数据的质量平台

    数据是特别耗费资源的,如果这方面不加以控制,产品的性价比就大打折扣,结合优酷大数据平台的经验,这块一定要强关联业务,比如说在数据预计算处理的时候,需要考虑可选维度或必选维度,亦或是哪些维护可以合并...
    文章 2018-03-08 12463浏览量
  • 中国互联网大会:数据挖掘解决微博商业化难题

    我个人感受非常深的,在今天开放的数据,隐私问题,很多情况是能避免的,越来越多开放的社区出现了。你使用一个产品,你使用微博,就意味着有这个问题,因为这个产品开放的时候,就是开放的,你关注什么人,不存在...
    文章 2017-04-03 897浏览量
  • 《软件测试价值提升之路》——3.4 随机出错

    3.4.1 问题案例十多年前我曾经参与解决一个产品的随机问题,这个问题导致产品宕机,重启后就能正常处理业务,但是宕机在一个月内总会发生,时间不固定,也没有发现和哪些操作有关系。这个问题持续影响客户的应用...
    文章 2017-05-02 1402浏览量
  • FlinkX 如何读取和写入 Clickhouse?

    注意:推荐splitPk使用表主键,因为表主键通常情况下比较均匀,因此切分出来的分片也不容易出现数据热点。目前splitPk仅支持整形数据切分,不支持浮点、字符串、日期等其他类型。如果用户指定其他非支持类型,FlinkX...
    文章 2020-08-21 1589浏览量
  • 《SQL与关系数据库理论——如何编写健壮的SQL代码》》...

    否则EMP就会出现身处根本不存在部门的员工,数据库也就不再是“现实的真实模型”(a faithful model of reality)了。1.4.2 完整性特征 完整性约束(integrity constraint,简称为约束)基本上就是结果必须为TRUE的...
    文章 2017-07-03 936浏览量
  • 全网最全95道MongoDB面试题1万字详细解析

    当完成后,数据会出现在新的分片里(shard)。29、如果我在使用复制技术(replication),可以一部分使用日志(journaling)而其他部分则不使用吗?可以。30、当更新一个正在被迁移的块(Chunk)上的文档时会发生什么?...
    文章 2020-06-11 1001浏览量
  • 歪理邪说解析架构设计师上午考试试题之一(分析2010下...

    大家都知道,现在的数据库,就是传统的数据库,都是关系数据库, 关系规范化,就是关系运算,就是第一范式、二、三、四范式的东东,当然是逻辑设计。关系运算,就是代数里关系运算,数学的东西,总是有逻辑的吧!...
    文章 2012-11-04 773浏览量
  • 深度学习的解释性研究(一):让模型「说人话」

    机器学习解决的是从数据中发现知识和规律的问题,如果我们对想要处理的数据特征所知甚少,指望对所要解决的问题本身有很好的理解是不现实的,在建模之前的解释性方法的关键在于帮助我们迅速而全面地了解数据分布的...
    文章 2018-05-30 3477浏览量
  • 某二手交易平台大数据平台从 0 到 1 演进与实践

    数据生命周期管理:哪些是热数据哪些是冷数据,核心和非核心,长期和短期,防止数据的无限膨胀,带来繁重的存储、维护成本和计算资源的浪费。大数据场景下的实时多维分析:比如大数据场景下的实时去重计算,我们...
    文章 2020-06-06 651浏览量
  • 数据库的设计总结

    2.使用ER图对数据库进行逻辑建模(跟我们所的具体的数据库管理系统是没有关系的),大部分的表关系也是在这一步完成的 3.物理设计:根据数据库自身的的特点把逻辑设计转换为物理设计;4.维护优化:新的需求进行建...
    文章 2020-05-26 996浏览量
  • 云上应用系统数据存储架构演进

    选择合适的存储组件1)根据场景定义需求准确的定义需求是对组件的前置条件,切勿仅根据功能性需求来进行匹配,还需考虑一些基础性需求,例如存储组件提供的 SLA、数据可靠性、扩展性、运维性等等。从上面的表...
    文章 2021-09-01 198浏览量
  • 软件工程之软件需求分析

    尽管工作人员的姓名也 以用做其身份标识,但不同的工作人员有可能会出现姓名重复,因此有必要为工作人员设置一 个专门的身份标识码。(4)仓库以商品品种为基本单位进行管理,所有商品都要由计划部门按品种进行...
    文章 2018-08-19 1065浏览量
  • 如何设计可靠的灰度方案

    而且这次查询一般会是一个查库操作,而使用全量业务数据去查库,常常会出现DB性能问题,甚至会出现由于灰度数据的分布问题导致分布式DB出现单库单表的热点,这里的DB问题不做深入。总之这个方案可以有效减轻甚至规避...
    文章 2021-08-20 242浏览量
  • 重磅,企业实施大数据的路径

    政府拥有海量的数据,如交通数据、社保数据等,一旦这些数据能够公开,将带来大量的创业机会,也给企业带来更多考虑问题的维度,所以企业都希望政府能够尽快地公开数据。(六)找好切入点,小步快走 关于实施...
    文章 2017-05-02 656浏览量
  • 重磅,企业实施大数据的路径

    政府拥有海量的数据,如交通数据、社保数据等,一旦这些数据能够公开,将带来大量的创业机会,也给企业带来更多考虑问题的维度,所以企业都希望政府能够尽快地公开数据。(六)找好切入点,小步快走 关于实施...
    文章 2017-05-02 1506浏览量
  • 数据库原理与应用(第3版)》——1.2 数据管理技术...

    从1.2.1节的介绍我们可以看到,在数据库管理系统出现之前,人们对数据的操作是直接针对数据文件编写应用程序实现的,这种模式产生很多问题。在有了数据库管理系统之后,人们对数据的操作全部是通过数据库管理系统...
    文章 2017-05-02 1137浏览量
  • 如何高效运作机器学习团队(机器学习入门第四篇)

    构思阶段:在这个阶段,需要有对问题相关领域有深入研究的专家,他们知道哪些因素可能影响选择或者结果。例如,如果你正在建立房屋估值模型,那么你需要一个真正的房地产专家,他们知道如何对房屋进行估价以及影响...
    文章 2017-08-21 3399浏览量
  • 寻找全球最强算法!通过手机安装的 App,从二十万人中...

    2.在 Kaggle 社区,第一次出现 TalkingData 中国的数据,上面的大神对此很感兴趣,甚至把kaggle 排行榜上所谓的“上古神兽”炸出来不少,Kaggle 比较牛的那些人玩的时间长了,兴趣不大,已经不太爱在平台上出现。...
    文章 2017-08-09 820浏览量
  • HBase内部结构

    如果block size配置的很小,就会产生很多block索引,这样会给内存带来很大的压力,将会取得与预期相反的效果,同时,由于压缩的数据很小,压缩效率也低,将会出现数据容量增大的情况 Data内部 Data数据块的第一位存储的是块...
    文章 2018-12-06 1360浏览量
  • 写有价值的技术文档

    系统交互(可选) 新功能牵涉到系统交互时,需要提供系统交互文档。系统交互文档重点描述系统间的数据流,这份文档包括 新功能牵涉到系统内部哪些模块,模块内的交互方式(API/MESSAGE/直接访问/etc.) 和哪些外部系统...
    文章 2016-06-06 5167浏览量
  • 大道至简的数据治理方法论

    首先,我们来了解一下脏数据的种类,明白我们可能面对哪些问题。1 数据缺失:缺一些记录,或者一条记录里缺一些值(空值),或者两者都缺。原因可能有很多种,系统导致的或人为导致的可能性都存在。如果有空值,为了...
    文章 2017-08-01 2065浏览量
  • 20 万网络节点背后的数据创新应用

    大家通常是敲着代码再看监控系统有没有异常,还会出现漏告警或者误告警,阈值告警无法解决这个问题。第二,维护困难。业务的发展,需要持续开发代码,业务发生变化,配置得不到变更,必然会导致大量告警出现。第三,...
    文章 2018-08-02 1075浏览量
  • 阿里在数据库智能优化路上,做了哪些探索与实践?

    比如一条SQL查询有10个可选的访问路径,MySQL优化器目标是要从这10个路径选择访问代价最低的一个路径。而What-ifoptimizer要做的事情是如何规划出第11条路,让这条路比现有的10条路都快。难点在于这条路是不存在的,...
    文章 2017-08-22 5883浏览量
1 2 3 4 ... 24 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化