新手大数据必问十个问题

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 新手大数据必问十个问题

无论在学习群、星球还是私底下,总有很多想学大数据的同学会问这几个问题。今天列举了这十个高频问题,虽然基础,但是经典。




1. 电脑需要什么配置?


学大数据的电脑配置主要在内存方面,至少8G,上不封顶,一般16G够用。当然这只是学习层面,自己搭虚拟机玩玩。工作中,公司自然会给你分配服务器让你工作。



2. 有哪些方向?


数据开发、数据分析、数据挖掘。其中每个大方向又拆分了几个小方向。


三者的联系是,数据过来之后先进行开发,然后进行分析,最后从数据中挖掘出价值并进行应用。



3. 用Java还是Python?


数据分析和数据挖掘基本使用Python。


数据开发不局限于语言。数据开发大多数Java,少部分Python,也有Scala,具体看公司项目技术栈。因为大部分大数据框架都支持Java接口,而且大部分公司项目技术栈都用Java,所以Java居多。Python更多地使用在脚本或者前期的框架粘合。Scala大多用在Spark框架。


具体可以去招聘网站的JD看,先看自己想去的公司,最后再看自己所在城市的公司。



4. 需要学机器学习吗?


数据挖掘需要机器学习的知识,部分数据分析岗位需要机器学习知识。


数据开发大多数是不需要的,但有些公司的数据开发岗位也要涉及到推荐系统模型等,或者要使用Spark的mlib库等等。初学者不需要特意去学,可等到后期技能拓展或者工作中需要再学。



5. 哪个方向好?


都好,兴趣为王!想做算法相关的学数据挖掘,想做开发写代码的就学数据开发,想接触业务层面的可以学数据分析,更多的可以结合自己之前的专业技能、工作经历及之后想从事的工作内容进行考虑。



6. 需要数学知识吗?


数据开发和一般岗位的数据分析师都不需要什么数学知识,除了数据挖掘和部分数据分析进行建模时需要进行统计等操作才需要数学知识。



7. 需要高学历吗?


入门级别的都不用看学历。看学历指数:数据挖掘 > 数据分析 > 数据开发。数据分析和开发正常本科就够了,数据挖掘大多是本科以上。



8. 薪资高吗?


大环境下,薪资:数据挖掘 > 数据开发 > 数据分析。同一家公司同一级别的岗位,数据开发正常高于普通开发。


具体看城市、公司以及工作年限。



9. 就业前景和市场需求怎么样?


市场需求怎么样,看培训机构的动作就知道了,今年市场上涌起一大批大数据的培训机构。而且随着企业上云,数字化转型,5G时代的到来,对数据会越来越重视。


无论哪个方向的就业前景都是明朗的,大数据的三大方向后期可以进阶纯技术架构,纯业务管理,技术与业务结合的解决方案架构师,也可以三者之间相互转型。


第一批大数据专业的学生现在大三,至少得再过2,3年,学校的课程才会相对完善,并能批量生产。不过科班的学生都知道,是不是科班只有在简历上写的不一样,上课玩的游戏都一样的



10. 数据开发和后台开发的区别?


大数据开发相当于后台开发的升级版,要处理的数据量更多,应付的场景更复杂。


-----end-----

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
SQL 机器学习/深度学习 分布式计算
峰哥帮读者精准押题,211程序媛字节、阿里大数据面经分享
峰哥帮读者精准押题,211程序媛字节、阿里大数据面经分享
峰哥帮读者精准押题,211程序媛字节、阿里大数据面经分享
|
6月前
|
分布式计算 监控 大数据
《吊打面试官》- 大数据工程师50道中大厂面试真题保姆级详解
《吊打面试官》- 大数据工程师50道中大厂面试真题保姆级详解
103 1
《吊打面试官》- 大数据工程师50道中大厂面试真题保姆级详解
|
6月前
|
运维 前端开发 大数据
大数据必知必会系列——面试官一问就懵:你们做过的项目技术是如何选型的?[新星计划]
大数据必知必会系列——面试官一问就懵:你们做过的项目技术是如何选型的?[新星计划]
74 0
|
6月前
|
消息中间件 资源调度 大数据
学了1年大数据,来测测你大数据技术掌握程度?大数据综合复习之面试题15问(思维导图+问答库)
学了1年大数据,来测测你大数据技术掌握程度?大数据综合复习之面试题15问(思维导图+问答库)
69 0
|
消息中间件 分布式计算 Kubernetes
爆款阿里P5到P7晋升之路,九大源码文档助我超神果然努力幸运并存
前言 相信有许多的程序员,工作了这么多年;但是依然不知道自己掌握的技术栈+项目,究竟达到了阿里的什么职级,还有薪资水平是什么样的;
|
存储 算法 Java
|
消息中间件 存储 分布式计算
面试系列一:精选大数据面试真题10道(混合型)-附答案详细解析 (一)
精选大数据面试真题10道(混合型)-附答案详细解析
449 0
面试系列一:精选大数据面试真题10道(混合型)-附答案详细解析 (一)
|
SQL 运维 分布式计算
关于轻松入门学习大数据这件事
平时工作中经常会说大数据分析怎么样,自己好奇,却又觉得学习门槛高,一直没有机会入手
关于轻松入门学习大数据这件事
|
存储 分布式计算 算法
专科生阿里大数据一面面经「已过」「附详细答案」
专科生阿里大数据一面面经「已过」「附详细答案」
专科生阿里大数据一面面经「已过」「附详细答案」