“阿里巴巴大数据系统体系”学习笔记-纲领篇
‘你是做什么的?’
‘数据产品经理’看到对方一脸懵逼之后,再补充一句‘大数据相关的工作’
‘哦~,高大上,不懂’
过去5年,‘大数据’是最火的一个概念,被纷繁解读。在我看来,数据跟石油、煤炭一样是一种资源。
人工智能PK金牌速记员之实战录
引言
在2016年3月23日阿里云年会上,2000余名同学们见证了一场人机大战的好戏--阿里云iDST团队的实时语音识别系统在现场演讲分享环节实时挑战世界速记比赛亚军, 马总御用金牌速录师姜毅先生。这位神一般的速录师, 拥有超人的短时记忆功能, 超级的打字速度和惊人的正确率.要PK这样的对
阿里巴巴飞天大数据架构体系与Hadoop生态系统
先说Hadoop
什么是Hadoop?
Hadoop是一个开源、高可靠、可扩展的分布式大数据计算框架系统,主要用来解决海量数据的存储、分析、分布式资源调度等。Hadoop最大的优点就是能够提供并行计算,充分利用集群的威力进行高速运算和存储。
Python网络爬虫实战三例(附视频讲解)
抓取简书用户信息
之前我写的爬虫都是将已知的固定数据的网址存到list中,然后遍历list中的网址。这次针对简书,我们使用递归来试一下。
什么是递归
程序(或函数)调用自身的编程技巧称为递归( recursion)。