Interview:人工智能&大数据岗位面试—【数据分析师】的简介、技能、待遇、进阶的详细攻略(一)

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: Interview:人工智能&大数据岗位面试—【数据分析师】的简介、技能、待遇、进阶的详细攻略

数据分析师的简介


      数据分析师 是数据师的一种,指的是不同行业中,专门从事行业数据搜集、整理、分析,并依据数据做出行业研究、评估和预测的专业人员。

      这是一个用数据说话的时代,也是一个依靠数据竞争的时代。目前世界500强企业中,有90%以上都建立了数据分析部门。IBM、微软、Google等知名公司都积极投资数据业务,建立数据部门,培养数据分析团队。各国政府和越来越多的企业意识到数据和信息已经成为企业的智力资产和资源,数据的分析和处理能力正在成为日益倚重的技术手段。

      博主也曾经说过:得数据分析师者,得武林;得数据者,得天下。


1、网友经验之谈


经验之谈部分源自:知乎-路人甲,https://www.zhihu.com/people/sgai/posts


      入行之后,才发现数据分析其实可以分为两种:一种类似产品经理、一种偏向数据挖掘,类似产品经理向更加注重业务,对业务能力要求比较高;数据挖掘向更加注重技术,对算法代码能力要求比较高。

(1)、数据分析师基本技能


数据库基础:比如SQL Server、Orcale等,我们都知道数据分析师每天都会处理海量的数据,这些数据来源于数据库,那么怎么从数据库取数据?如何建立两表、三表之间的关系?怎么取到自己想要的特定的数据?等等这些数据选择问题就是你首要考虑的问题,而这些问题都是通过SQL解决的,所以SQL是数据分析的最基础的技能。

统计学基础:数据分析的前提要对数据有感知,数据如何收集?数据整体分布是怎样的?如果有时间维度的话随着时间的变化是怎样的?数据的平均值是什么?数据的最大值最小值指什么?数据相关与回归、时间序列分析和预测等等。

语言编程基础:比如Python或者R,这一点是必备项也是加分项,在数据挖掘方向是必备项,语言相比较工具更加灵活也更加实用。

(2)、作为一个商业数据分析师自己的理解,把数据分析师的工作日常总结为下面几个方面:


产生数据:我这里所说的产生数据,并不是说去做开发或是做数据采集。我这里所说的数据是每当业务上有新的功能点需要开发上线的时候,数据分析师需要去围绕着这些功能会产生哪些业务变化、这个功能上线的目的是什么、上线之后该如何衡量效果等一系列问题,在功能上线前做好数据的埋点、以及可以衡量最终效果的指标。这样当功能上线的时候,你可以快速的衡量业务效果。

提供数据:第一步的数据产生有方便了第二步的数据提供。提供数据可能是作为一个数据分析师每天都要做的事情,甚至有时候大半天都在做这件事情。数据需求的来源是多方的,各种业务方以及产品经理。商业数据分析师是公司业务方面的数据的出口,为了能准确的给需求方提供数据,你需要跟业务方有充分的沟通,对公司的数据维度有详细的了解。

解释数据:作为数据分析师,是不能止步于提供数据的。提供数据之余,你也要会解释数据,这些数据是怎么来的?好的数据坏的数据都需要去知道,那样才能取长补短。

探索数据:光有解释数据是不够的,因为数据分析并不是解决能看出来的问题,还要能提出发现解决一些探索性的问题。比如,给新用户怎样的激励,才能让他们的次日留存达到最佳?比方说Linkedin探索出来的让新用户拥有六个以及以上好友可以很好提高他们的留存。探索数据通常是一个长期的比较大的项目,探索数据并不存在一个标准的答案,也通常可能是几个月出不了一个好的结论。

影响数据:A/B Test是为了探索更好的方向,更受用户喜欢的功能。通过数据论证可以说服业务方听询数据分析师的意见。推送的消息文本应该怎么发?发给几个实验组看看效果;这个按钮应该设计成什么颜色,配上什么文字?多设计几套上线几个不同分组看效果。通过不断的A/B Test,数据分析师会更好的辅助产品的迭代,影响数据的产生。

(3)、数据分析师的能力认知


数据分析师的能力分为:分析能力和业务能力。其中,分析能力决定一个数据分析师的下限,业务能力决定一个数据分析师的上限。


(4)、数据分析学习的两大阶段


(4.1)、培养自己做分析的能力:最终实现,对数据的整体感知,知道什么时候该用什么图表,掌握好一些基本的算法和分析库。


       第一阶段的基础是要有数据,分析能力相对来说是死板的,通常你需要学会掌握下面这些技能:


数据分析常用哪些算法?

需要用哪些库?

如何进行计算?

进行可视化,每一种图表的用途是什么?

       还要学会使用工具,有两种,一种是语言编程的工具,想怎么分析就怎么分析;另一种是可视化的小工具,比如Tableau、Power BI等。


(4.2)、培养自己做业务的能力:技术不再是障碍,重点是要有自己的idea。技巧是多学、多看、多做。


我想要做什么?分析什么?

是否有数据能提供支持?把你想做的抽象成数据。

数据获取/数据清洗

开始进行分析(语言、工具)


相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
5月前
|
数据采集 人工智能 算法
数据没洗干净,分析全白干:聊聊大数据里的“洗澡水”工程
数据没洗干净,分析全白干:聊聊大数据里的“洗澡水”工程
195 1
|
28天前
|
数据可视化 大数据 关系型数据库
基于python大数据技术的医疗数据分析与研究
在数字化时代,医疗数据呈爆炸式增长,涵盖患者信息、检查指标、生活方式等。大数据技术助力疾病预测、资源优化与智慧医疗发展,结合Python、MySQL与B/S架构,推动医疗系统高效实现。
|
1月前
|
机器学习/深度学习 搜索推荐 数据挖掘
数据分析真能让音乐产业更好听吗?——聊聊大数据在音乐里的那些事
数据分析真能让音乐产业更好听吗?——聊聊大数据在音乐里的那些事
142 9
|
2月前
|
数据采集 传感器 人工智能
没有大数据,哪来人工智能?——聊聊“大数据喂养下的AI进化史”
没有大数据,哪来人工智能?——聊聊“大数据喂养下的AI进化史”
176 6
|
2月前
|
数据可视化 数据挖掘 大数据
基于python大数据的水文数据分析可视化系统
本研究针对水文数据分析中的整合难、分析单一和可视化不足等问题,提出构建基于Python的水文数据分析可视化系统。通过整合多源数据,结合大数据、云计算与人工智能技术,实现水文数据的高效处理、深度挖掘与直观展示,为水资源管理、防洪减灾和生态保护提供科学决策支持,具有重要的应用价值和社会意义。
|
3月前
|
存储 数据挖掘 大数据
基于python大数据的用户行为数据分析系统
本系统基于Python大数据技术,深入研究用户行为数据分析,结合Pandas、NumPy等工具提升数据处理效率,利用B/S架构与MySQL数据库实现高效存储与访问。研究涵盖技术背景、学术与商业意义、国内外研究现状及PyCharm、Python语言等关键技术,助力企业精准营销与产品优化,具有广泛的应用前景与社会价值。
|
4月前
|
人工智能 自动驾驶 大数据
“AI再聪明,也得靠大数据喂饱它”:聊聊大数据与人工智能的双剑合璧
“AI再聪明,也得靠大数据喂饱它”:聊聊大数据与人工智能的双剑合璧
325 2
|
4月前
|
机器学习/深度学习 Java 大数据
Java 大视界 -- Java 大数据在智能政务公共资源交易数据分析与监管中的应用(202)
本篇文章深入探讨了 Java 大数据在智能政务公共资源交易监管中的创新应用。通过构建高效的数据采集、智能分析与可视化决策系统,Java 大数据技术成功破解了传统监管中的数据孤岛、效率低下和监管滞后等难题,为公共资源交易打造了“智慧卫士”,助力政务监管迈向智能化、精准化新时代。
|
4月前
|
数据采集 自然语言处理 分布式计算
大数据岗位技能需求挖掘:Python爬虫与NLP技术结合
大数据岗位技能需求挖掘:Python爬虫与NLP技术结合
|
6月前
|
存储 关系型数据库 MySQL
大数据新视界 --面向数据分析师的大数据大厂之 MySQL 基础秘籍:轻松创建数据库与表,踏入大数据殿堂
本文详细介绍了在 MySQL 中创建数据库和表的方法。包括安装 MySQL、用命令行和图形化工具创建数据库、选择数据库、创建表(含数据类型介绍与选择建议、案例分析、最佳实践与注意事项)以及查看数据库和表的内容。文章专业、严谨且具可操作性,对数据管理有实际帮助。
大数据新视界 --面向数据分析师的大数据大厂之 MySQL 基础秘籍:轻松创建数据库与表,踏入大数据殿堂

热门文章

最新文章