• 漫谈数据仓库】如何优雅地设计数据分层

    这里其实就是我们现在大数据技术发挥作用的一个主要战场。我们的数据主要会有两个大的来源: 业务库,这里经常会使用 Sqoop 来抽取,比如我们每天定时抽取一次。在实时方面,可以考虑用 Canal 监听 Mysql 的 Binlog...
    文章 2017-11-01 2541浏览量
  • 漫谈阿里大数据

    大数据这个概念,其实在上世纪九十年代就有人提出来了,当时希望通过将所有零散的数据归并起来,然后进行数据挖掘,以看到以前存在的问题,去预测未来几年的趋势,来指导商业决策。比如保险行业,人寿保险会通过...
    文章 2017-02-23 7216浏览量
  • 阿里巴巴飞天大数据平台MaxCompute(原名ODPS)全套...

    解决大数据难题 阿里云MaxCompute获科技大奖MaxCompute 2.0 NewSQL演进之路 MaxCompute2.0 对开源系统的支持融合MaxCompute2.0索引优化实践MaxCompute 2.0 基于BigBench标准的最新测试进展MaxCompute 2.0 生态开放...
    文章 2017-05-05 123054浏览量
  • Reading List 2015-03

    Github 上大数据/数据挖掘/推荐系统/机器学习相关资源 https://github.com/Flowerowl/Big-Data-Resources 基于项目流行度的协同过滤TopN推荐算法 计算准确率、召回率、覆盖率 ...
    文章 2016-04-08 3083浏览量
  • 数据蒋堂】功夫都在报表外-漫谈报表性能优化

    2017年,自主创新研发新一代的数据仓库、云数据库等产品即将面世。数据蒋堂 《数据蒋堂》的作者蒋步星,从事信息系统建设和数据处理长达20多年的时间。他丰富的工程经验深厚的理论功底相互融合、创新思想传统观念...
    文章 2017-05-01 1869浏览量
  • 数据质量漫谈

    数据仓库的所有数据基础都是源数据(ODS),在开发数仓之前,需要对源数据进行探查,才能保证产出的数据仓库的准确性。题库业务的数据缺少打点,数据建设主要基于业务架构的一些中间表和结果表,在开发前期,没有...
    文章 2021-12-24 578浏览量
  • 数据质量漫谈

    一切数据分析、数据挖掘数据应用的效果都会打折扣&xff0c;甚至出现完全错误的结论&xff0c;或者导致资损。然而数据质量问题却是广泛存在的&xff0c;且治理的难度很&xff0c;因为数据的生产、加工、流转、应用涉及到...
    文章 2021-12-27 319浏览量
  • 剑破冰山—Oracle开发艺术 前言

    我们7位Oracle技术专家来自北京、加拿大、上海、福建、海南、河北等地,在电信、制造、统计、航空、金融、证券等行业工作多年,工作领域包括项目管理、系统架构、数据库、数据仓库和数据挖掘等。本书共分20章。苏...
    文章 2017-11-15 1612浏览量

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化