那些年,阿里巴巴技术男神们写的书!

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
云解析 DNS,旗舰版 1个月
简介: 本文将为大家带来8本阿里巴巴技术人撰写的书籍,有Java、大数据、机器学习、笔试心得等。

书籍名称:《离线和实时大数据开发实战》

_Java_

内容提要:
阿里巴巴大数据开发专家撰写,源于十余年工作实践,只讲实用有效的“招式”。庖丁解牛式式讲解离线和实时开发平台架构、原理、开发示例,涵盖查询与优化、建模、数仓开发、流计算开发等核心技术。
本书包含三篇,共计12章内容。
第一篇——数据大图和数据平台大图(第1~2章),主要站在数据处理和数据处理平台的角度,对数据、数据技术、数据相关从业者与角色、离线与实时数据平台架构等,给出整体性介绍。
第二篇——离线数据处理(第3~7章),离线数据是目前整个数据开发的根本和主战场,本篇详细介绍了离线数据处理的各种技术:Hadoop MapReduce、HDFS和Hive的架构、关键原理与使用,以及Hive优化实践、数据建模设计与改良、虚构的某全国连锁零售超市的数据仓库/数据湖实践。
第三篇——实时数据处理(第8~12章),主要介绍了实时数据处理的各项技术,包含Storm、Spark Streaming、Flink、Beam以及流计算SQL等,结合案例讲解实时开发原理、实践、性能优化、数据倾斜和反压机制等。

书籍名称:《机器学习实践应用》

_Java_

内容提要:
机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度等多门学科,专门研究计算机怎样模拟或实现人类的学习行为。机器学习是人工智能的核心,是使计算机具有智能的根本途径。本书通过对机器学习的背景知识、算法流程、相关工具、实践案例以及知识图谱等内容的讲解,全面介绍了机器学习的理论基础和实践应用。书中涉及机器学习领域的多个典型算法,并详细给出了机器学习的算法流程。本书适合任何有一定数据功底和编程基础的读者阅读。通过阅读本书,读者不仅可以了解机器学习的理论基础,也可以参照一些典型的应用案例拓展自己的专业技能。同时,本书也适合计算机相关专业的学生以及对人工智能和机器学习感兴趣的读者阅读。

书籍名称:《阿里巴巴Java开发手册》


_Java_

内容提要:

《阿里巴巴Java开发手册》的愿景是码出高效,码出质量。它结合作者的开发经验和架构历程,提炼阿里巴巴集团技术团队的集体编程经验和软件设计智慧,浓缩成为立体的编程规范和最佳实践。众所周知,现代软件行业的高速发展对开发者的综合素质要求越来越高,因为不仅是编程相关的知识点,其他维度的知识点也会影响软件的最终交付质量,比如,数据库的表结构和索引设计缺陷可能带来软件的架构缺陷或性能风险;单元测试的失位导致集成测试困难;没有鉴权的漏洞代码易被黑客攻击等。所以,本手册以开发者为中心视角,划分为编程规约、异常日志、单元测试、安全规约、MySQL数据库、工程结构、设计规约七个维度,每个条目下有相应的扩展解释和说明,正例和反例,全面、立体、形象地帮助到开发者的成长和团队代码规约文化的形成。

从严格意义上讲,《阿里巴巴Java开发手册》超越了Java语言本身,明确作为一名合格开发者应该具备的基本素质,因此本手册适合计算机相关行业的管理者和研发人员、高等院校的计算机专业师生、求职者等阅读,希望成为大家如良师益友般的工作手册、工具字典和床头书。

书籍名称:《大数据是这样计算的:XLab实例入门》

_XLab_

内容提要:

随着大数据分析方法的发展、分析工具的改进,大数据分析的门槛降低了。基于大数据算法平台,数据分析师们已经不再被数据的“大”所困扰,他们可以轻松地探索大数据,挖掘大数据的价值。

《大数据是这样计算的:XLab实例入门》侧重介绍大数据分析方法和算法的应用,选取了10个不同领域的真实数据集,针对每个数据的特点,选择适合的方法和算法,和读者一起体验数据探索、数据分析、建模预测的过程;通过实例计算的结果,读者会更加了解各种方法和算法的长处和局限。《大数据是这样计算的:XLab实例入门》的实例都运行在大数据算法平台XLab上。

《大数据是这样计算的:XLab实例入门》适合对大数据分析感兴趣的读者阅读,也可供数据分析师、算法工程师等专业人员参考使用。

书籍名称:《大数据之路:阿里巴巴大数据实践》


_

内容提要

在阿里巴巴集团内,数据人员面临的现实情况是:集团数据存储已经达到EB级别,部分单张表每天的数据记录数高达几千亿条;在2016年“双11购物狂欢节”的24小时中,支付金额达到了1207亿元人民币,支付峰值高达12万笔/秒,下单峰值达17.5万笔/秒,媒体直播大屏处理的总数据量高达百亿级别且所有数据都需要做到实时、准确地对外披露……巨大的信息量给数据采集、存储和计算都带来了极大的挑战。

《大数据之路:阿里巴巴大数据实践》就是在此背景下完成的。《大数据之路:阿里巴巴大数据实践》中讲到的阿里巴巴大数据系统架构,就是为了满足不断变化的业务需求,同时实现系统的高度扩展性、灵活性以及数据展现的高性能而设计的。

《大数据之路:阿里巴巴大数据实践》由阿里巴巴数据技术及产品部组织并完成写作,是阿里巴巴分享对大数据的认知,与生态伙伴共创数据智能的重要基石。相信《大数据之路:阿里巴巴大数据实践》中的实践和思考对同行会有很大的启发和借鉴意义。

书籍名称:《机器学习在线:解析阿里云机器学习平台》


_

内容提要

近几年,机器学习平台获得了飞速发展,积累了大量高效的机器学习算法组件,基于这些组件可以快速实现业务流程、解决具体问题。阿里云机器学习平台的丰富算法功能可以在线使用,不需要购买硬件,不需要安装配置各种环境;数据和计算资源一直处在“在线”状态,不必担心数据太大或计算资源不足的问题。机器学习平台降低了我们使用机器学习知识的门槛,将各个算法作为组件,即使不了解背后的理论知识,仍可以仿照书中实例,将组件连接起来解决一些实际问题。

《机器学习在线:解析阿里云机器学习平台》适合机器学习算法的初学者及中级用户快速入门,在机器学习实践中学习。

书籍名称:《技术之瞳——阿里巴巴技术笔试心得》

_

内容提要

《技术之瞳——阿里巴巴技术笔试心得》由阿里巴巴集团校园招聘笔试项目组所著,收集了阿里历年校招中的精华笔试题,涉 及多个领域。《技术之瞳——阿里巴巴技术笔试心得》中内容大量结合了阿里巴巴的实际工作场景,以例题、解析、习题的形式,引 导读者深入理解技术上的关键点、紧要处,夯实基础,启发思考。《技术之瞳——阿里巴巴技术笔试心得》内容不仅专业、有趣,更 是将理论知识与实践应用结合起来,以场景化的问答娓娓道来!

《技术之瞳——阿里巴巴技术笔试心得》是每一位有志于投身互联网行业的技术人员入行的必备参考。

书籍名称:《尽在双11——阿里巴巴技术演进与超越》


_11_

内容提要

“双 11”,诞生于杭州,成长于阿里,风行于互联网,成就于新经济,贡献于全世界。

从 2009 年淘宝商城起,双 11 已历经八年。每年的双 11 既是当年的结束,又是走向未来的起点。技术的突破创新,商业模式的更替交互,推动着双 11 迈步向前。

《尽在双11——阿里巴巴技术演进与超越》是迄今唯一由阿里巴巴集团官方出品、全面阐述双 11 八年以来在技术和商业上演进和创新历程的书籍。内容涵盖在双 11 背景下阿里技术架构八年来的演进,如何确保稳定性这条双 11 生命线的安全和可靠,技术和商业交织发展的历程,无线和互动的持续创新与突破,以及对商家的赋能和生态的促进与繁荣。

《尽在双11——阿里巴巴技术演进与超越》主要面向广大互联网技术和商业从业者,内容包括基础设施、云计算、大数据、AR/VR、人工智能、物联网等技术领域的剖析,以及在电商、金融、客服、物流等商业层面的洞察;同时,《尽在双11——阿里巴巴技术演进与超越》也可以作为了解科技与商业最新发展的一个窗口,供科研人员和高校在校师生参考。

《尽在双11——阿里巴巴技术演进与超越》也包含丰富的双 11 发展历程中的故事性片段,生动有趣,可读性强,读者可以在由衷感叹双 11 背后艰辛的演进历程之余,更为透彻地体会到阿里人在技术和商业创新上坚韧不拔、矢志不渝的精神。

书籍名称:《逆流而上:阿里巴巴技术成长之路》

_

内容提要

《逆流而上:阿里巴巴技术成长之路》是阿里巴巴集团荣耀背后的技术血泪史。《逆流而上:阿里巴巴技术成长之路》通过分享业务运行过程中各个领域发生的典型“踩坑”案例,帮助大家快速提升自我及团队协作,学习到宝贵的处理经验及实践方案,为互联网生产系统的稳定共同努力。从基础架构、中间件、数据库、云计算、大数据等技术领域中不断积累经验,颠覆技术瓶颈,不断创新以适应不断增长的需求。

《逆流而上:阿里巴巴技术成长之路》主要面向互联网技术从业人员和在校师生,使读者能够通过此书基本了解阿里在各技术领域的能力,学习在如此规模下可能出现的问题以及解决方案的探讨和沉淀分享。

书籍名称:《深入分析Java Web技术内幕(修订版)》


_Java_Web_

内容提要

《深入分析Java Web技术内幕(修订版)》新增了淘宝在无线端的应用实践,包括:CDN 动态加速、多终端化改造、 多终端Session 统一 ,以及在大流量的情况下,如何跨越性能、网络和一个地区的电力瓶颈等内容,并提供了比较完整的解决方案。

《深入分析Java Web技术内幕(修订版)》主要围绕Java Web 相关技术从三方面全面、深入地进行了阐述。首先介绍前端知识,即在JavaWeb 开发中涉及的一些基本知识,包括Web
请求过程、HTTP、DNS 技术和CDN 技术。其次深入介绍了Java 技术,包括I/O 技术、中文编码问题、Javac 编译原理、class 文件结构解析、ClassLoader 工作机制及JVM 的内存管理等。最后介绍了Java 服务端技术,主要包括Servlet、Session 与Cookie、Tomcat 与Jetty服务器、Spring 容器、iBatis 框架和Velocity 框架等原理介绍,并介绍了服务端的一些优化技术。

《深入分析Java Web技术内幕(修订版)》不仅介绍这些技术和框架的工作原理,而且结合示例来讲解,通过通俗易懂的文字和丰富、生动的配图,让读者充分并深入理解它们的内部工作原理,同时还结合了设计模式来介绍这些技术背后的架构思维。

你看过几本?点此领取赠书!

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
人工智能 达摩院 大数据
阿里技术的四个历史瞬间
阿里技术的四个历史瞬间
629 0
阿里技术的四个历史瞬间
|
新零售 存储 物联网
首届阿里巴巴中间件技术峰会资料回顾
感谢大家观看由云栖社区、阿里中间件联合举办的《首届阿里巴巴中间件技术峰会》,下面是本次活动相关资料回顾,以供参考(目前仍在更新中,敬请保持关注)。
20351 7
|
Kubernetes Cloud Native Serverless
2020 云原生生态大会,最值得期待的技术盛会!
为了推广云原生技术理念、推进和优化云原生生态发展,一场来自阿里云、CNCF、VMware、PingCAP、网易数帆、字节跳动、Zilliz 等重磅演讲嘉宾集结的云原生领域盛会—“2020 云原生生态大会”即将开幕!
2020 云原生生态大会,最值得期待的技术盛会!
|
运维 Kubernetes Cloud Native
为什么 K8s 在阿里能成功?| 问底中国 IT 技术演进
本文描述了阿里巴巴在容器管理领域的技术演进历程,解读了为什么 K8s 最终能够大获成功的原因,以及到今年 双11 阿里巴巴内部的 K8s 应用情况。内容着重描述了阿里巴巴基于 K8s 的云原生改造实践过程的三大能力升级,在对应能力升级过程中沉淀的技术解决方案,以及通过这些能力升级所取得的业务价值。
为什么 K8s 在阿里能成功?| 问底中国 IT 技术演进
|
大数据 人工智能 算法框架/工具
阿里巴巴集团副总裁贾扬清:开源大数据生态前瞻
本文整理自开源大数据专场中阿里巴巴集团副总裁,阿里巴巴计算平台事业部总裁贾扬清先生的精彩演讲,将为大家讲述开源大数据与人工智能生态前瞻,分享阿里云对开源的态度,以及对大数据和人工智能的未来规划。
6065 0
|
机器学习/深度学习 存储 分布式计算
阿里巴巴大数据生态下的一些「魔法」
阿里巴巴的大数据生态
6788 0
|
新零售 NoSQL 关系型数据库
【云栖大会】阿里巴巴积极拥抱开源 正式开源全球化OpenMessaging和ApsaraCache项目
很多MariaDB的运用源自我们的开发者,维基百科用的就是MariaDB,我们也从阿里巴巴中获得了很多开源的支持和贡献,确保能给大家提供功能丰富的数据库产品。
3860 0
阿里巴巴的2019:感谢有你
2019年,谢谢有情有义的你和阿里巴巴一起,做了这些有价值的有意义的事: