ODPS技术架构及应用实践
DT时代,数据是宝贵的生产资料,不断扩大的数据规模给ODPS带来极大地挑战。阿里巴巴坚持对ODPS的投入开发,采用内聚式平台系统架构,各个组件紧凑内聚,除了结构化数据处理SQL、分布式编程模型MapReduce外,还包含图计算模型、实时流处理和机器学习平台。随着ODPS对外开放的不断推进和第三方数据
这个心理学博士忽悠了马云8年……
“8年前,别人都说我忽悠了马云,因为云计算这么不靠谱的东西他也信了;其实是马总忽悠了我,他让我相信这事只有在阿里干的成。”王坚在一次采访中说。本文将向读者介绍王坚是如何一步步将云计算变成现实的。
DII—算法服务利器
随着集团内各种离线处理、实时反馈、在线学习和分析系统的发展壮大,为算法同学使用数据提供了更多的手段和玩法,能够从数据中挖掘出更多的宝藏。但是仅仅产出数据是不够的,他们需要将数据结合算法在线服务的方式应用到业务中去,才能真正产生价值。从搜索事业部的现状来看,算法的作用方式主要有两种,一种是嵌入引擎内.
详解IBM大数据应用五大方向
摘要:IBM全球副总裁王阳博士详解IBM大数据应用的五大方向:探索大数据发现和业务相关的兴趣点、全面了解客户优化每次客户互动、分析海量机器数据提高运营效率、利用IT新技术从现有数据仓库中获得更多价值并降低成本、分析大数据所有类型和来源强化传统安全方案。
从分析性数据库ADS中导出数据
ADS是阿里云提供的分析性数据库,实现百亿数据毫秒级计算。
将ADS中的数据导出,有2种思路,通过select或dump实现。这两种方法各有优缺点。
MaxCompute与OSS非结构化数据读写互通(及图像处理实例)
MaxCompute作为阿里巴巴集团内部绝大多数大数据处理需求的核心计算组件,拥有强大的计算能力,随着集团内外大数据业务的不断扩展,新的数据使用场景也在不断产生。在这样的背景下,MaxCompute(ODPS)计算框架持续演化,而原来主要面对内部特殊格式数据的强大计算能力,也正在一步步的通过新增的非结构化数据处理框架,开放给不同的外部数据。