大数据时代的特种兵:阿里数据产品团队

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 你可能用过数据魔方、淘宝指数、淘宝时光机这些好玩的产品,为其对大数据的运用点赞,或许你还对阿里巴巴在大数据这领域所做的工作感到好奇。在这里,Segmentfault 给大家来介绍一下这些炫酷产品背后的团队:阿里数据平台事业部数据产品团队。

你可能用过数据魔方淘宝指数淘宝时光机这些好玩的产品,为其对大数据的运用点赞,或许你还对阿里巴巴在大数据这领域所做的工作感到好奇。在这里,Segmentfault 给大家来介绍一下这些炫酷产品背后的团队:阿里数据平台事业部数据产品团队

阿里巴巴集团在2012年设立首席数据官岗位(CDO),并成立了数据平台事业部,负责推进数据分享平台战略。这个数据产品团队,就是数据平台事业部的,尽管只是十几人的小团队,但他们把自己定义为特种部队,以普及大数据为自己的使命。

image.png

数据产品团队的前世今生

早在“平台、金融、数据”三步战略提出之前,阿里就已经在探索数据的玩法。数据魔方的最早需求,来自于某个超大的品牌商希望能查看淘宝平台上的行业综合数据,他们的开发团队发现这样的产品对淘宝上的所有卖家更有价值,于是数据魔方就诞生了。


数据魔方早在2010年就正式发布,成为阿里巴巴首次对外开放商业数据的产品。淘宝魔方为淘宝平台上的卖家提供类目行业数据,帮助卖家实现数据化经营,因此在发布之后就快速积累了数十万的卖家用户,成为了一个具备持续影响力的产品。其数据产品团队也顺理成章的正式组建,团队定位于基于阿里巴巴海量的商业数据,对外部用户提供数据产品与服务。


这个团队接下来的产品是淘宝指数,淘宝指数是一款的免费数据分享平台,是方便淘宝卖家了解淘宝搜索热点、购物趋势、定位消费人群,研究细分市场的工具,同时也是第三方研究人员甚至买家研究淘宝数据的良好助手。


2012年的双12,这个数据产品团队推出了淘宝时光机,通过对用户行为深度挖掘,结合情感化与可视化的产品手段,淘宝时光机产生了轰动性的社会反响。


大数据是当代最富科幻质感的领域

大数据是非常广阔的领域,就在阿里巴巴内部,也有不同层面、不同团队在做大数据相关的事情。如何在这样的大环境下,找到数据产品团队的核心竞争力?阿里数据产品团队负责人玄澄认为,数据产品的价值,一是把目前已经发生的事情,通过数据展现出来,开拓人们的视野,增强人们对周围世界的认知。


现在这个数据产品团队既有数据魔方这样商业性的产品,也有淘宝时光机这样充满趣味性,但是不盈利的产品。在淘宝时光机成功之后,这个团队有大半年的时间在摸索新的方向,有几个产品立项但最终被放弃,然而最终也找到了一个重磅级的神秘武器,会面向品牌商进一步展现数据的商业价值。这个产品被其团队负责人玄澄评价为是透过互联网大数据增强人们商业认知的巅峰产品,比如可以查询淘宝平台上购买某品牌化妆品的区域分布,那么在线下开一个化妆品店面的选址就会非常精准。


团队负责人玄澄认为,相对于其他业务或者产品来说,数据产品是一个巨大的、不受限的新领域,数据产品可以服务于卖家、也可以服务于中小企业提供经营决策、也可以服务于消费者提供消费指导,甚至政府机关。数据产品的形态也是不受限制的,未来的数据业务和产品形态逐渐的成熟和壮大后,一定会细分出很多不同的细分的数据产品类型。同时,玄澄也坚信,数据产品还有着第二个更巨大的价值,那就是预测未来的发展趋势,大数据是当代最富科幻质感的领域,用数据预知未来是自己的终极使命。对大数据的商业化应用,所有一线的互联网企业都想做、在做,也有很多创业公司在做,但阿里巴巴手握这个星球上最大的消费者在线数据库,拥有行业中最有价值的在线商业数据,这些数据需要以最领先的数据技术做引线,用丰富的想像力去点燃,将引爆这个时代最炙热明亮的火焰。


玄澄还表示说,目前第二个领域还是比较空白的,这样的领域需要创新和探索,需要自由和灵活的玩法,有更多的想象空间。团队遇到的挑战就是数据产品与技术的创新,怎样挖掘数据中的价值,探索新的大数据商业模式,推动大数据突破临界点,是他们数据产品团队面对的最大挑战。


能前能后,还能移动

为了迎接大数据的技术挑战,这个数据产品团队把自己定义为大数据时代的特种兵,并且建立了一支技术上从前到后的全功能团队,技术特点就是“能前能后,还能移动”。

他们的数据产品是国内最早将 Node.js 应用于商业产品的团队。他们团队中的苏千、朴灵是国内Node.js界最有影响力的工程师,团队多名成员活跃在Node社区,通过组织社区活动、撰写Node技术书籍等方式,积极促进Node.js在国内的发展。团队还用了两年的时间,让阿里的技术平台上大部分基础服务都能支持到Node.js。

image.png

数据可视化是数据产品的比较重要的能力,团队同时也是行业内最领先的数据可视化团队之一,通过开源datav.js前端数据可视化组件库,维护datavlab.org数据可视化专业站点等方式,推动数据可视化在产业界的认知与应用。

image.png

同时由于要做“未来”的产品,所以需要更多创新思维的人,用负责人玄澄的话说,就是不走寻常路。数据产品团队现在的成员,也是各具特点,不仅有Fawave作者苏千、《深入浅出Node.js》作者朴灵这样的技术高手,也有文科、建筑专业出身半路转行的,还有两个中学时代的黑客,一个曾经的国家二级运动员、上海市射击冠军。团队成员既有慕名而来,也有通过各种渠道推荐、挖掘来的,但即使用了各种方法招人,仍然远远不够用,web开发、移动互联网开发、算法工程师、数据开发工程师,个个都需要,当然,在技术本身之外,对数据的敏感与理解能力也是非常重要的。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
7月前
|
人工智能 数据管理 Serverless
阿里云数据库走向Serverless与AI驱动的一站式数据平台具有重大意义和潜力
阿里云数据库走向Serverless与AI驱动的一站式数据平台具有重大意义和潜力
452 2
|
7月前
|
人工智能 运维 Cloud Native
、你如何看待阿里云数据库走向Serverless与AI驱动的一站式数据平台?
、你如何看待阿里云数据库走向Serverless与AI驱动的一站式数据平台?
202 2
|
弹性计算 分布式计算 大数据
阿里云计算平台大数据基础工程技术论文入选 VLDB 2023
近日,在 VLDB 2023 上,由阿里云计算平台大数据基础工程技术团队主导,与计算平台 MaxCompute 团队、华东师范大学数据科学与工程学院、达摩院合作的论文入选 Industrial Track
|
7月前
|
人工智能 数据管理 大数据
阿里云数据库走向Serverless与AI驱动的一站式数据平台是一个很有前景和意义的发展方向
阿里云数据库走向Serverless与AI驱动的一站式数据平台是一个很有前景和意义的发展方向
108 2
|
6月前
|
存储 分布式计算 专有云
MaxCompute产品使用问题之阿里公有云的数据如何迁移到阿里专有云
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
69 10
|
5月前
|
机器学习/深度学习 运维 算法
|
7月前
|
机器学习/深度学习 运维 算法
大数据基础工程技术团队4篇论文入选ICLR,ICDE,WWW
近日,由阿里云计算平台大数据基础工程技术团队主导的四篇时间序列相关论文分别被国际顶会ICLR2024、ICDE2024和WWW2024接收。
|
7月前
|
人工智能 Cloud Native 数据管理
阿里云数据库:向Serverless与AI驱动的一站式数据平台迈进
众所周知,在人工智能迅猛发展的现在,在AI驱动下的数据平台,正在向一站式、智能化的方向演进,还有就是云原生+Serverless的不断深入,一站式数据平台将让数据管理开发像“搭积木”一样简单实用,以性价比更高、体验更优的云数据库服务,助推用户业务提效增速。据悉阿里云数据库正在朝着Serverless与AI驱动的方向发展,构建一站式、智能化的数据平台,这一发展趋势将为用户提供更简单、实用的数据管理开发体验,以提高业务效率和降低成本。那么本文就来分享一下如何看待阿里云数据库的这一转变,并展望云原生和Serverless对数据管理与开发的未来带来的更多可能性。
147 1
阿里云数据库:向Serverless与AI驱动的一站式数据平台迈进
|
7月前
|
人工智能 运维 数据管理
阿里云数据库走向Serverless与AI驱动的一站式数据平台
阿里云数据库走向Serverless与AI驱动的一站式数据平台
329 2
|
7月前
|
大数据 BI
阿里十年大数据专家谈“云上数据中台之道”含内部PPT
从大数据的概念被正式提出,到马云老师预言人类正从IT时代走向DT时代,大数据浪潮迭起。大数据同仁共同认知的一点是,大数据会对社会创新、产业变革、业务创新及每个人的角色定位产生近乎决定性的影响。