更多深度文章,请关注云计算频道:https://yq.aliyun.com/cloud
随着科技的发展,人类社会拥有数据的规模增长很快,每时每刻、从天到地都有大量数据被产生和存储下来。这些数据被积累下来,到底怎么样使用才能创造出我们想要的价值呢?这些都是数据科学关注的事情!
那么如何转行到数据科学领域呢?有没有数据科学入门的方法?有没有相关的数据科学的实战案例?
答案是YES,你要的这些这里全都有!数据科学的全部干货,全部都在这里!
一.数据科学杂谈篇:
摘要:从量化金融到机器学习,有哪些准备我们可以进行?
摘要:数据科学是一个热门的领域,本文介绍数据科学家目前使用的一些热门编程语言,主要是从通用性、性能等方面分析,想入门的或行业研究者可以参考并发表一下自己的观点哦。
摘要:本文是关于数据科学家面试题的一些建议,希望能够给大家一些启发。
4. 经历多个数据科学岗位后,对于数据科学面试他分享了以下求职心得
摘要:作者拥有多份数据科学求职的经验,现在分享给各位小伙伴。
5. 2017数据科学职位报告:R超过SAS,但仍不如Python
摘要:本文以美国最大的招聘网站Indeed.com为统计平台,通过对某一天数据科学职位的招聘数量进行统计分析,得出数据科学软件的变化趋势。
6. 第二热门语言:从入门到精通,Python数据科学简洁教程
摘要:本文介绍了一些常见的用于数据分析任务的Python库,如Numpy、Pandas、Matplotlib、Scikit-learn以及BeautifulSoup等,这些工具库功能强大,便于上手。有了这些帮助,数据分析会变得分外简单。
7. 数据分析师的基本素养——论如何成为一名数据科学家 Part 1
摘要:本篇文章是Quora网站上"如何成为一名数据科学家"问题的高分答案集锦,来自不同领域的回答者结合自己的切身经验,分享了对数据科学家成长之路的看法。本篇文章收录了其中部分评价较高的回答,可为初学者了解或入门数据科学指明方向。
8. 数据分析师的基本素养——论如何成为一名数据科学家 Part 2
摘要:本篇文章是Quora网站上"如何成为一名数据科学家"问题的高分答案集锦,来自不同领域的回答者结合自己的切身经验,分享了对数据科学家成长之路的看法。本篇文章收录了其中部分评价较高的回答,可为初学者了解或入门数据科学指明方向。
摘要:本文是关于回归知识的45道小问题,包括了理论和实践知识,快来试一试~
10. 考察数据科学家数据降维知识的40道题,快来测测吧(附答案)
摘要:本文例举了一个针对数据科学家的数据降维测试,测试总共有40道题,涉及的内容主要有PCA、t-SNE以及LDA降维技术。想检验下自己对降维技术掌握的情况就赶快测测吧。
11. 用机器学习研究UFO目击报告!数据科学之魅:隐含狄利克雷分布
摘要:LDA算法太难?怎么也学不明白?学明白了也不知道有什么用?来看看这篇文章!真正的学以致用!
摘要:本文概述了学习数据挖掘与数据科学的七个步骤,每一步都给出了详细的学习资源,便于初学者按照指南开展数据挖掘与数据科学的学习。
摘要:当开始进入数据科学领域时,我们可能会犯一些错误。本文罗列了9种初学者常见的错误,并提出避免犯错的建议。
14. 硅谷资深数据科学家教你认清探索性数据分析(EDA)的价值
摘要:本文主要介绍了探索性数据分析的价值,说明了探索性数据分析(EDA)是什么以及详细介绍了两种假设,另外文中分析了探索性数据分析对于建模而言是很重要的一步,能够帮助数据科学家找到模型结果出错的原因。
15:摩根大通机器学习与金融大数据指南——未来的华尔街大亨|大数据+机器学习+金融工程师
摘要:本文总结了J.P.摩根最新的280 页研究报告中的13亮点,极为详尽地梳理、预测了金融从业者未来都需要具备相关机器学习以及数据分析的能力,分析了金融行业的现状与未来,对于金融从业者以及想从事金融行业者具有重要的借鉴意义。
摘要:本文是行业资深从事人员写的关于数据科学的个人反思,一份关于数据科学之路及科研认知的心路历程,相信本文对许多有抱负的数据科学家是非常有用的。
17. 考察数据科学家支持向量机(SVM)知识的25道题,快来测测吧
摘要:本套自测题专为SVM及其应用而设计,目前超过550人注册了这个测试,最终得满分的人却很少,[doge],一起来看看你的SVM知识能得多少分吧,顺便还能查漏补缺哦。
二.数据科学实战篇:
1. 了解人工智能之分类和预测 - 数据科学中的预测,分类和回归分析
摘要:本文作者阐述了她对机器学习在数据分析学科方面的应用现状和展望。给了初涉这个领域的人们一个初步的介绍。
2.Python股市数据分析教程——学会它,或可以实现半“智能”炒股 (Part 1)
摘要:本篇文章是"Python股市数据分析"两部曲中的第一部分,主要介绍金融数据分析的背景以及移动均线等方面的内容。
3. Python股市数据分析教程——学会它,或可以实现半“智能”炒股 (Part 2)
摘要:本篇文章是"Python股市数据分析"两部曲中的第二部分。在本篇文章中,我们讨论了均线交叉策略的设计、回溯检验、基准测试以及实践中可能出现的若干问题,并结合Python代码实现了一个基于均线交叉的交易策略系统。
4. 玩笑到现实,大数据涉足文学研究--用数据模型分析莎翁著作
摘要:自然语言研究一直以来都是计算机研究的一个重要方向。随着大数据时代的到来,人们也越来越关注自然语言这方面的进展。而文学是自然语言这个皇冠上的明珠。人们都拭目以待大数据摘下这颗明珠的那一天。
5. 成为技术高手:想更了解自己的偶像么?教你用技术手段挖掘他/她的关系
摘要:是否在不同的电影中,总是能看到那些熟悉却叫不上名字的演员么,想知道他们之间相互的关系么?本文将带你一步一步地挖掘出他们的关系。想更了解自己的偶像么,那就试试吧。
摘要:大数据时代,任何事件之间都可能具有一定的相关性。啤酒和尿不湿有关系吗?今天就带你来看一下,如何用Python来分析购物之间那些潜在的规则。
摘要:本文主要讲述了如何在python中用七步就能完成中数据准备。
摘要:这篇博客主要介绍处理不平衡数据的技巧,给出了七种适用于特定问题及数据集的方法,避免由于数据集不平衡而得到的一个假的好模型。另外作者也指出本文不是一个技术列表,建议读者不局限于此、尝试结合不同的方法设计出合适的模型。
9. Vega数据可视化工具——教你轻松玩转大数据可视化 | 附代码
摘要:Vega是一种大数据可视化的高效工具,本文以分析游隼的迁徙情况为例,展示了Vega工具的强大能力及易学易用特点。
摘要:概率分布在许多领域都很常见,包括保险、物理、工程、计算机科学甚至社会科学,如心理学和医学。它易于应用,并应用很广泛。本文重点介绍了日常生活中经常能遇到的六个重要分布,并解释了它们的应用。
本系列博客内容由北邮@爱可可-爱生活老师推荐,@阿里云云栖社区组织翻译,翻译小组袁虎负责整理,审阅:主题曲哥哥。本系列长期更新,更多关于数据科学的优质好文,多多推荐!