数据实践之美:31位大数据专家的方法、技术与思想. 导读

简介:

 

数据实践之美:31位大数据专家的

方法、技术与思想

天善智能 著

 

前 言

朝阳门和小笼包

2016年3月5日,天善智能在北京举办“数据为王·互联网大数据沙龙”活动。在活动开始前的3月2日,我在家里收到了几本有关大数据相关的书籍,当时还没有弄清楚是怎么回事,后来打电话问梁勇(天善智能创始人之一)才知道这几本书是机械工业出版社华章分社的副总编杨福川寄过来的,代表华章支持我们的线下沙龙活动。

3月5日之后的某一天晚上,我约了杨总编出来以当面表示感谢。3月份的北京还比较冷,那两天风也比较大,我们俩约在朝阳门附近见面。见面一开口说话便发现都是湖北老乡,一个来自武汉,一个来自孝感,瞬间就感觉话题多了很多。

我们俩虽然都在北京,但是各自都有各自混吃的“地盘”,对于朝阳门附近到底哪些地方有什么好吃的一概不知。一路边走边聊,最后逛到地下一家小店。看看也到吃饭的点了,四周也没有什么合适的餐馆就只能这样将就着了。坐下之后,两人要了两份小笼包,一份粥和一份面,就坐在小饭桌上边吃边聊了。没有任何的刻意和客气,就像老朋友一样……

饭后聊了很多有关创业的话题,包括天善这个团队是如何结缘,如何辞职全职创业的。也聊到我们对大数据领域的一些认识和看法,圈内的故事,以及我们社区和社群的资源。

其间,聊到2015年我们在网上发布的19万字的商业智能BI年刊时,杨总编说:“你们社区在大数据和BI领域有不少专家资源,也积累了不少内容,为什么当时不考虑出书呢?”

“我们没有出版社的资源,也不知道出书的流程和方式”。

“需要的话,我们以后可以帮你”。

策划一本书的想法从那时就开始萌发了,就是在那个3月份略有点凉的夜晚,在朝阳门吃着小笼包结的缘。

关于本书

最初策划这本书的时候,我想过一个问题:究竟是系统性地深入讲解某个特定的与数据相关的主题(比如大数据、数据分析、商业智能等);还是去系统化,只讲解一些与数据实践相关的经验和技巧,每篇文章相对独立。

最后我们的选择是去系统化,每一篇都是一个独特的视角,即使是同一个视角,我们也希望不同的作者能够写出不同的观点,甚至冲突。因为我们觉得这本书承载的应该更多的是启发,而不是教化。

我们期望这本书是一本数据实践的Hacks集合,作者由来自互联网、传统行业、大数据公司等一线的数据工作者、科学家、技术VP、产品经理以及高级咨询顾问组成,如实地反映和总结他们在各自技术领域的真实工作经验和技巧。

2016年的4月份,我们在杨总编的帮助下,开始在天善智能社区和社群发起了写书的号召。

在写书号召发出的几天之内,我们就陆续接到来自大数据、数据分析、数据挖掘和商业智能BI领域100多位专家的报名,当然我们也力邀了一些在数据领域比较知名的朋友们加入。随后经过几轮筛选和审阅,最终有33篇稿件符合要求。

这33篇文章,我们根据主题分为了5个部分:

Part 1 数据化思维,专注思维

Part 2 数据治理,专注技术

Part 3 BI与数据可视化

Part 4 数据分析与数据挖掘

Part 5 大数据化之路,主要讲解不同行业是如何应用大数据的

所有文章独立成篇,在满足碎片化阅读的同时,也能让读者进行深入的思考和横向比较,帮助用户在碰到类似问题的时候打开思路、获得经验上的快速成长。

致谢

在此感谢各位作者艰辛的付出,同时感谢所有报名了但是因为各种原因最后未能成为本书的作者的朋友们,真诚感谢大家的努力和支持。

感谢北京铂金智慧网络科技有限公司(Ptmind)给本书提供的宝贵建议和支持。

我们不得不提这本书的作者们,他们是来自百度、腾讯、IBM、埃森哲、Teradata、美特斯邦威、帆软软件、永洪科技、好未来、ETHINK象形科技、万达、乐逗游戏、况客、北京易莱信科技、奥威软件、达观数据、诸葛IO、中科软、神策数据、融360、奥美互动、先进数通、同程旅游等知名公司的CEO、VP、CTO、技术总监、高级分析经理、架构师、咨询总监……都是数据领域的专家。

在本书的写作过程中,我们也得到了来自安徽象形科技(ETHINKBI)技术VP彭耀先生和北京易莱信科技的创始人&CEO汪尚先生的大力支持。彭耀在有关书籍的命名上给予了很多建议。汪尚在书籍文章分类上给予了我们专业的意见。

 

吕品 天善智能联合创始人&运营总监

NO.1 数据化运营的方法论体系 张子良 // 2

NO.2 数据化营销中的“一·二·三” 叶秋萍 // 9

NO.3 企业数据化管理之巅—同业对标 王卫东 // 21

 

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
6月前
|
机器学习/深度学习 传感器 分布式计算
数据才是真救命的:聊聊如何用大数据提升灾难预警的精准度
数据才是真救命的:聊聊如何用大数据提升灾难预警的精准度
438 14
|
5月前
|
存储 人工智能 大数据
云栖2025|阿里云开源大数据发布新一代“湖流一体”数智平台及全栈技术升级
阿里云在云栖大会发布“湖流一体”数智平台,推出DLF-3.0全模态湖仓、实时计算Flink版升级及EMR系列新品,融合实时化、多模态、智能化技术,打造AI时代高效开放的数据底座,赋能企业数字化转型。
1112 0
|
5月前
|
数据可视化 大数据 关系型数据库
基于python大数据技术的医疗数据分析与研究
在数字化时代,医疗数据呈爆炸式增长,涵盖患者信息、检查指标、生活方式等。大数据技术助力疾病预测、资源优化与智慧医疗发展,结合Python、MySQL与B/S架构,推动医疗系统高效实现。
|
5月前
|
人工智能 Cloud Native 算法
拔俗云原生 AI 临床大数据平台:赋能医学科研的开发者实践
AI临床大数据科研平台依托阿里云、腾讯云,打通医疗数据孤岛,提供从数据治理到模型落地的全链路支持。通过联邦学习、弹性算力与安全合规技术,实现跨机构协作与高效训练,助力开发者提升科研效率,推动医学AI创新落地。(238字)
351 7
|
6月前
|
传感器 人工智能 监控
数据下田,庄稼不“瞎种”——聊聊大数据如何帮农业提效
数据下田,庄稼不“瞎种”——聊聊大数据如何帮农业提效
221 14
|
5月前
|
传感器 人工智能 监控
拔俗多模态跨尺度大数据AI分析平台:让复杂数据“开口说话”的智能引擎
在数字化时代,多模态跨尺度大数据AI分析平台应运而生,打破数据孤岛,融合图像、文本、视频等多源信息,贯通微观与宏观尺度,实现智能诊断、预测与决策,广泛应用于医疗、制造、金融等领域,推动AI从“看懂”到“会思考”的跃迁。
440 0
|
6月前
|
机器学习/深度学习 传感器 监控
吃得安心靠数据?聊聊用大数据盯紧咱们的餐桌安全
吃得安心靠数据?聊聊用大数据盯紧咱们的餐桌安全
208 1
|
6月前
|
数据采集 自动驾驶 机器人
数据喂得好,机器人才能学得快:大数据对智能机器人训练的真正影响
数据喂得好,机器人才能学得快:大数据对智能机器人训练的真正影响
573 1
|
8月前
|
数据采集 分布式计算 DataWorks
ODPS在某公共数据项目上的实践
本项目基于公共数据定义及ODPS与DataWorks技术,构建一体化智能化数据平台,涵盖数据目录、归集、治理、共享与开放六大目标。通过十大子系统实现全流程管理,强化数据安全与流通,提升业务效率与决策能力,助力数字化改革。
287 4
|
8月前
|
分布式计算 DataWorks 数据处理
在数据浪潮中前行:记录一次我与ODPS的实践、思考与展望
本文详细介绍了在 AI 时代背景下,如何利用阿里云 ODPS 平台(尤其是 MaxCompute)进行分布式多模态数据处理的实践过程。内容涵盖技术架构解析、完整操作流程、实际部署步骤以及未来发展方向,同时结合 CSDN 博文深入探讨了多模态数据处理的技术挑战与创新路径,为企业提供高效、低成本的大规模数据处理方案。
407 3