超越Hadoop的大数据分析之致谢

简介:

本文翻译自《BIG DATA ANALYTICS BEYOND HADOOP》译者:许巧辉

首先,我要衷心感谢Vineet Tyagi、AVP和Impetus的创新实验室主管。Vineet对我帮助很大,并促使我写这本书。在6、7月份,每个工作日他给我3个小时的时间写作本书,这是帮助我完成本书的关键。任何学术活动都要专门花费很多时间——这时候就得加倍努力,因为我必须在工作之余写作。Vineet令写作成为我工作的一部分。

我也想对Pankaj Mittal、CTO和SVP、Impetus表示感谢,他对研发的全心支持,像我这样的研发全职工作。荣誉对他来说,就是Impetus能够有一个无支付和收入压力的研发团队。这真的释放了我并有助于我专注于研发。在IT行业工作,写书是一个艰巨的任务。感谢Pankaj实现这点及类似的活动。

Praveen Kankariya是Impetus的CEO,他是我灵感的源泉,指导着我。感谢Praveen的支持!我还要感谢在Impetus的Nitin Agarwal博士、AVP和领导、数据科学实践小组。Nitin帮助我塑造一些思想,尤其是在我们讨论机器学习算法的认识/实现之后。他是一个我敬仰的、擅长从生活中找到灵感的人。Nitin是印度管理学院(IIM)印多尔的前教授,这充分体现了我对他的高评价。

这本书的形成离不开Pranay Tonpay,他是Impetus的资深架构师,在我的研发团队主导实时分析流。他一直在帮助实现本书的思想,包括在Spark和Storm上的一些机器学习算法。他是我团队中首要感谢的人,特别感谢Pranay。

Jayati Tiwari是Impetus的资深软件工程师,在Spark和Storm上贡献一些机器学习算法。她对Storm非常了解——其实,她是被视为团队中的Storm专家。她开发了一种倾向于理解的机器学习和Spark。团队因她的存在,增添不少乐趣。感谢Jayati!

Sai Sagar是Impetus的软件工程师,在GraphLab上帮助机器学习算法的实现。感谢Sagar,很高兴团队拥有你。

Ankit Sharma是Impetus的原数据科学家,现在是Snapdeal的研发工程师,他写了逻辑回归(LR)的一小部分,这是本书第3章解释LR的基础。还有我们在机器学习上的一些很好的讨论,感谢Ankit。

我还要感谢编辑者Jeanne Levine、Lori Lyons 和其他工作人员Pearson,他们一直在帮助这本书从我给的雏形到最终形态。还要感谢Pearson这家出版社,使得这本书面世。

我要感谢Gurvinder Arora,他是我们的技术作家,审阅了本书的各个章节。

我想借此机会感觉我的博士指导教授,印度理工学院(IIT)马德拉斯的Janakiram博士,他在我成长的岁月里激励着我走向研究生涯。我欠他很多——他塑造了我的技术思想,道德价值观,并使我学会将整个职业生涯作为灵感的来源。其实,写这本书的想法灵感来源于他最近发布的书(Building Large Scale Software Systems with Tata McGraw-Hill publishers)。不仅仅要感谢DJ教授,我还要感谢我所有的老师,从我在Sankara的高中学校开始,在Sri Venkateshwara College 学院(SVCE)的教师和所有在IIT马德拉斯的教授,是他们成就了我的今天。

我要感谢Edd Dumbill博士,以前在O’Reilly,现在是硅谷数据科学的VP——他是大数据的编辑者,也是我发表文章所在地。他一直帮忙审阅这本书。他是2013年2月加州Strata会议的组织者,当时我谈论了一些beyond-Hadoop的概念。这些谈论本质上也是为了这本书。我也借此机会感谢Strata组织者接受我一些谈论的建议。

我也要感谢Paco Nathan博士审阅这本书,并且为这本书写了前言。他的评论很鼓舞人心,正如他的职业生涯一样。我很崇拜他,感谢Paco!

我还要感谢团队的其他成员Pranav Ganguly,他是Impetus的资深架构师,给了我足够大的压力,并且顺利处理大数据管理线程。非常高兴团队拥有他和Nishant Garg。感谢我的所有团队成员。

如果没有一个强大的家庭后盾,那将是困难的,甚至不可能写成这本书。我的妻子Vidya在确保家庭和睦、幸福中扮演着重要角色。她献出我们本可以一起共度的大量时间,以致于我可以专注的写书。我的孩子Prahaladh和Purvajaa已足够成熟来让我做这个工作。感谢他们三个共同营造一个甜蜜的家庭。我也要感谢我的父母,在我的生命中,他们对我早期的教育、灌输道德。

最后,也是必不可少的。感谢上帝给了我一切,永远感谢全能的主照顾我。 

目录
相关文章
|
6月前
|
人工智能 分布式计算 数据可视化
Hadoop 已死,AI 吞噬世界!
在数据领域,AI 正逐步重塑数据处理和分析的各个环节,从 ETL、数据治理到数据分析和消费方式均会发生根本性变化。Kyligence 联合创始人 & CEO,Apache 顶级开源项目。
|
6月前
|
存储 分布式计算 Hadoop
【云计算与大数据技术】Hadoop MapReduce的讲解(图文解释,超详细必看)
【云计算与大数据技术】Hadoop MapReduce的讲解(图文解释,超详细必看)
308 0
|
SQL 分布式计算 Hadoop
【大数据Hadoop实战篇】 1
【大数据Hadoop实战篇】
|
存储 分布式计算 资源调度
【大数据Hadoop实战篇】 2
【大数据Hadoop实战篇】
|
存储 分布式计算 监控
【Hadoop技术栈篇】认识Hadoop,起源和发展
Hadoop是Apache旗下的一个用java语言实现开源软件框架,是一个开发和运行处理大规模数据的软件平台。允许使用简单的编程模型在大量计算机集群上对大型数据集进行分布式处理。
446 0
【Hadoop技术栈篇】认识Hadoop,起源和发展
|
存储 SQL 分布式计算
大数据入门-三分钟读懂Hadoop
大数据入门-三分钟读懂Hadoop
181 0
大数据入门-三分钟读懂Hadoop
|
存储 SQL 分布式计算
Hadoop系列之大数据启蒙
Hadoop系列之大数据启蒙
225 0
Hadoop系列之大数据启蒙
|
SQL 存储 分布式计算
Hadoop 怎么了,大数据路在何方
近期 Hadoop 消息不断,众说纷纭。本文以 Hadoop 的盛衰变化为楔子聊下大数据分析的发展现状和未来趋势。
|
存储 分布式计算 大数据
Hadoop资料整理导向
一、Hadoop快速入门 分布式计算开源框架Hadoop_入门实践 一篇不错的hadoop介绍文章 用 Hadoop 进行分布式数据处理---- 入门 Hadoop入门实验 Hadoop入门 一...
1598 0
下一篇
无影云桌面