资源总结——七步学习数据挖掘与数据科学

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 本文概述了学习数据挖掘与数据科学的七个步骤,每一步都给出了详细的学习资源,便于初学者按照指南开展数据挖掘与数据科学的学习。

首发地址:https://yq.aliyun.com/articles/68449


想知道如何学习数据挖掘和数据科学吗?本文概述了七个步骤,指的资源能让你成为一名数据科学家。

作者为Gregory Piatetsky,是一名数据挖掘与数据科学方面的专家。

208d17688bcff0df08dbd8d6fab25db9d0cf32bf

以下为7个步骤用于学习数据挖掘和数据科学。虽然有编号顺序,你可以并行或以不同的顺序学习:

语音:学习RPython以及SQL语音

工具:了解如何使用数据挖掘和可视化工具

教材:阅读介绍性教科书了解基础知识

教育:观看网络研讨会,参加课程,考虑获得数据科学中的证书或学位

数据:检查可用的数据资源并在那里找到东西

竞赛:参加数据挖掘竞赛

通过社交网络,团体和会议与其他数据科学家交流

另外,不要忘记订阅KDnuggets新闻邮件,并跟随@kdnuggets了解关于分析、大数据、数据挖掘和数据科学最新消息。

交互使用数据挖掘与数据科学——见我的分析行业概览报告,报告中有关于相关术语演变和普及比如统计、知识发现、数据挖掘、预测分析、数据科学以及大数据。

 1 学习语言

民意调查表明,数据挖掘最流行的语言RPythonSQL

这里有很多的资源,比如:

免费电子书资源关于R语音的数据科学

Python数据科学入门

Python数据分析:现实世界数据的灵活工具

不可或缺的Python:数据源到数据科学

W3学校学习SQL

工具:数据挖掘,数据科学和可视化软件

许多的数据挖掘工具用于不同的任务,但最好是使用支持数据分析的整个过程的数据挖掘套件。

你可以使用开源(免费)的工具,如启动KNIMERapidMinerWeka

然而,对于许多分析工作需要知道SAS,它是全球领先的商业工具并得到广泛应用。

其他受欢迎的分析和数据挖掘软件包括MATLABStatSoft推出STATISTICAMicrosoft SQL ServerIBM SPSS Modeler以及Rattle

可视化是任何数据分析的重要组成部分——学习如何使用Microsoft ExcelR graphics,以及Tableau 。其好的可视化工具包括TIBCO SpotfireMiner3D

3教材

网络上有很多的数据挖掘和数据科学教材,但你可以参考以下这些:

数据挖掘与分析:基本概念与算法

数据挖掘:机器学习工具实践与方法

统计学习、数据挖掘以及预测的要素

LION书籍:学习与智能优化

大数据集挖掘

StatSoft推出的电子统计教材

教育:网络研讨会、课程、证书以及学位

可以通过观看一些许多免费的关于数据分析、大数据,数据挖掘和数据科学的网络研讨会和网络直播开始学习。

也有许多短期和长期的在线课程,其中许多是免费的-KDnuggets在线教育目录

特别参考以下课程:

 机器学习

 从数据中学习

 开放式在线学习应用数据科学

 使用Weka进行数据挖掘

 本文作者的数据挖掘课程

最后,考虑获得关于数据挖掘和数据科学的证书或高级学位,如MS-KDnuggets关于分析、数据挖掘和数据科学教育的目录

数据

你需要数据进行分析-KDnuggets关于数据挖掘的目录,包含:

 政府、联邦、州、城市、本地和公共数据站点和门户

 数据API、集线器、商场、平台、门户和搜索引擎

 免费公共数据集

竞争

再一次强调,最好是边学边做,所以在学习的同时也可以参加Kaggle竞赛 -从初学者竞赛开始,比如使用机器学习预测泰坦尼克号生存

交流:会议、团体和社交网络

你可以加入许多同团体-关于分析、大数据,数据挖掘以及数据科学前30的 LinkedIn组织

AnalyticBridge是一个分析和数据科学活跃的社区。

你也可以参加一些关于分析、大数据、数据挖掘、数据科学与知识发现的会议和研讨会

此外,考虑加入ACM SIGKDD,它会举办一年一度的KDD大会——该领域领先的研究会议。

……

还可以参考其它的回答:

如何开始学习数据科学

关于数据科学的使用简介

通过Metromap课程成为一名数据科学家

获取免费数据科学教育


 本文由北邮@爱可可-爱生活 老师推荐,阿里云云栖社区组织翻译。

 

文章原标题《7 Steps for Learning Data Mining and Data Science》,作者:Gregory Piatetsky,译者:海棠

文章为简译,更为详细的内容,请查看原文

翻译者: 海棠 

Wechat:269970760 

Email:duanzhch@tju.edu.cn

微信公众号:AI科技时讯

157f33dddfc596ede3681e0a2a0e7068dc288cc1

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
机器学习/深度学习 算法 数据可视化
数据挖掘(1)--基础知识学习
数据挖掘(Data Mining,DM)是知识发现(KDD)最核心的部分。 数据挖掘数学理论基础的发展,与统计学的发展密不可分。
130 0
|
5月前
|
机器学习/深度学习 数据采集 算法
数据科学基础:数据挖掘与分析的技术探讨
【6月更文挑战第15天】本文探讨数据科学中的数据挖掘与分析技术,阐述其基础理论,包括数据预处理、探索和模型建立,并介绍统计分析、机器学习、深度学习等方法。面对数据质量、算法选择等挑战,数据挖掘在智能决策、个性化服务、预测等方面展现广阔前景,将在跨领域融合中发挥更大作用,同时也需关注隐私安全与技术伦理。
|
6月前
|
机器学习/深度学习 自然语言处理 数据可视化
【Python百宝箱】数据科学的黄金三角:数据挖掘和聚类
【Python百宝箱】数据科学的黄金三角:数据挖掘和聚类
226 2
|
机器学习/深度学习 Ubuntu 前端开发
数据挖掘基础学习一:VMware虚拟机Ubuntu上安装Python和IPython Notebook(Jupyter Notebook)完整步骤及需要注意的问题(以ubuntu-18.04.3为例)
数据挖掘基础学习一:VMware虚拟机Ubuntu上安装Python和IPython Notebook(Jupyter Notebook)完整步骤及需要注意的问题(以ubuntu-18.04.3为例)
920 0
数据挖掘基础学习一:VMware虚拟机Ubuntu上安装Python和IPython Notebook(Jupyter Notebook)完整步骤及需要注意的问题(以ubuntu-18.04.3为例)
|
机器学习/深度学习 人工智能 算法
数据科学、机器学习和数据挖掘的差异
数据科学、机器学习和数据挖掘的差异
192 0
数据科学、机器学习和数据挖掘的差异
|
机器学习/深度学习 算法 数据挖掘
【数据挖掘】神经网络简介 ( 有向图本质 | 拓扑结构 | 连接方式 | 学习规则 | 分类 | 深度学习 | 机器学习 )(二)
【数据挖掘】神经网络简介 ( 有向图本质 | 拓扑结构 | 连接方式 | 学习规则 | 分类 | 深度学习 | 机器学习 )(二)
268 0
|
机器学习/深度学习 物联网 数据挖掘
【数据挖掘】神经网络简介 ( 有向图本质 | 拓扑结构 | 连接方式 | 学习规则 | 分类 | 深度学习 | 机器学习 )(一)
【数据挖掘】神经网络简介 ( 有向图本质 | 拓扑结构 | 连接方式 | 学习规则 | 分类 | 深度学习 | 机器学习 )(一)
760 0
|
机器学习/深度学习 人工智能 运维
【数据挖掘】数据挖掘简介 ( 6 个常用功能 | 数据挖掘结果判断 | 数据挖掘学习框架 | 数据挖掘分类 )
【数据挖掘】数据挖掘简介 ( 6 个常用功能 | 数据挖掘结果判断 | 数据挖掘学习框架 | 数据挖掘分类 )
791 0

热门文章

最新文章