
著有畅销书《数据分析思维》,全网同号
想要分析的时候,没有数据,就是巧妇难为无米之炊。以前想找一个数据需要费尽心思在网上去搜,最终还找不到自己想要的数据。通过编程爬虫数据,学习成本又太高,毕竟你的目标不是想要成为爬虫工程师,只是想要拿到数据来分析。那有没有傻瓜式的获取数据方法呢?下面介绍4种获取数据的方法,选择一种适合你自己的方法就可以。方法一:直接获取10大行业免费数据1)如何选择行业?不知道如何选择行业的,可以在下面网站里看到各个行业的分析报告:如何选择入职行业 :https://www.zhihu.com/question/24995484/answer/516813008艾瑞研究-艾瑞网(行业报告):http://report.iresearch.cnTalkingdata报告(行业报告):http://mi.talkingdata.com199IT互联网数据中心(行业报告,内容多,支持搜索):http://www.199it.com2)10大行业免费数据汇总【优点】直接拿来使用【缺点】数据有限根据你确定的行业,选择一个自己感兴趣的数据。比如你确定了电商行业,然后就找一个电商行业的数据。在《数据分析思维》中汇聚了10多个行业的数据以及分析案例更多行业数据:10大行业公开数据免费下载:电商零售行业10大行业公开数据免费下载:金融行业10大行业公开数据免费下载:游戏行业10大行业公开数据免费下载:教育行业10大行业公开数据免费下载:旅游行业10大行业公开数据免费下载:文化娱乐行业(电影,音乐等)10大行业公开数据免费下载:医疗行业10大行业公开数据免费下载:汽车及出行10大行业公开数据免费下载:房产行业10大行业公开数据免费下载:自媒体等行业方法二:从数据平台获取1.国内中文平台:1)阿里云天池,官网网址:https://tianchi.aliyun.com/dataset/数据下载办法:2)DataFountain,官网地址:https://www.datafountain.cn/dataSets有的文件下载后会显示后缀是.zip, .zip是个压缩包,下载后需要减压后才能看到压缩包里的excel文件2.国外英文平台Kaggle,官网地址和如何下载数据:如何在Kaggle上查找数据方法三:傻瓜式爬虫工具(不需要编程)【优点】在网站上爬取你感兴趣领域网站的数据,可以获取到自己想要的领域数据【缺点】需要看官网教程来学习,有一定门槛1)工具: 后羿,同时有mac,windows版本网址:http://www.houyicaiji.com/打开官网后点击下图“教程”的地方有入门教程。2)工具:集搜客,只有windows版本操作指南只需要看下面红框中的内容就可以,操作指南地址:https://www.gooseeker.com/tuto/tuto爬取多少数据?数据量少一般说明不了什么问题,起码的超过几万条数据。多尝试、思维逻辑要清晰,一定要知道自己做什么,爬取什么样的数据,提前规划好了,整个过程就不会走太多的弯路。案例:https://zhuanlan.zhihu.com/p/39733403欢迎留言补充更多行业数据。上面提到3种获取数据的方法,选择一种适合你自己方法。获取数据后分析,可以使用这个里面的方法来分析:https://www.zhihu.com/question/29265587/answer/155365747
某店铺的商品信息表中记录了有哪些商品订单明细表中记录了商品销售的流水;"订单明细表"中的'商品ID' 与"商品信息表"中的'商品ID'一一对应。业务问题:每天更新"订单明细表"里的间隔周数。计算规则是当前日期与支付时间的相隔周数(值为其中一个,1周,2周,4周,8周,16周,16周以上) 【解题思路】使用逻辑树分析方法,将问题拆解为2个子问题:1)计算当前日期与支付时间的相隔周数2)根据间隔周数条件分组1.计算当前日期与支付时间的相隔周数设计到日期,要能想到《猴子从零学会SQL》里讲过的日期函数。常用计算日期差的函数有俩datediff和timestampdiff。具体用法如下:这里使用timestampdiff函数可以直接计算两个日期的相差周数。而更新表,需要使用update函数,SQL语法如下1 update <表名> set <字段名> = `js 用下面SQL就可以得到当前日期与支付时间的相隔周数 update 订单明细表set 间隔周数 = (timestampdiff(WEEK,支付时间,NOW()));查询结果:  2.根据间隔周数条件分组 可以使用case when 条件表达式,对间隔周数按条件进行分组。 1 update 订单明细表2 set 间隔周数 = 3 (case when timestampdiff(WEEK,支付时间,NOW()) = 1 then '1周'4 when timestampdiff(WEEK,支付时间,NOW()) = 2 then '2周'5 when timestampdiff(WEEK,支付时间,NOW()) <= 4 then '4周'6 when timestampdiff(WEEK,支付时间,NOW()) <= 8 then '8周'7 when timestampdiff(WEEK,支付时间,NOW()) <= 16 then '16周'8 else '16周以上' 9 end);查询结果:  【本题考点】 1)涉及到多条件分组问题,要想到使用case when条件表达式。 2)时间问题,要想到常用的日期函数(datediff和timestampdiff)来解决。 
我是帅比了白: 1.求职成果成果汇总 2019.08开始秋招—20年春节后拿到BAT offer,共耗时6个月。 秉承在面试中跌倒,从面试中成长的理念,累计投简历超过500份,面试超过80次,拿到包括BAT,微博,映客,美菜,阳光保险,苏宁,顺丰,保利在内的全职offer近20张。 以下记录了我整个求职阶段的思考总结,同时分析了各大公司的数据算法类实习内容及启示,最后列出了BAT级别主流的面试题。 2.如何拿到offer的? 2019年秋招大厂基本全军覆没。但是我一直保持在拉勾、Boss直聘上每天投递50+岗位,不限实习和全职,所以拿到了很多的面试和笔试机会。 在后来复盘总结时发现,参加面试和笔试的过程带给我很大的成长。从一开始的抗拒和恐惧,到后来很享受面试,我逐渐把它当成了请业内人士免费帮我检验学习成果的机会。 不仅如此,在面试的交流沟通中也可以很好的从一线人员的视角了解到行业的动态和技术的落地使用情况。应当尽量抓住这些机会提升自己的视野。 期间拿到了5-6份北京上海中小公司的offer,虽然最后都拒绝掉了,不过对于信心提升来说有很大的帮助。 2020年初本来要回学校上课,后来发现居然可以在网上上课,于是又找了一份微博的实习。微博的实习更多带来的是简历含金量上的提升。 好的,鸡汤环节~年后拿到了BAT offer。 3.小白的学习路径是什么? (1)建立对互联网的认知 知道互联网是干什么的,和传统行业有什么区别;互联网在做什么样的业务,各个行业的头部互联网公司都是什么,各自都有什么拳头产品和相关产品。 (2)培养分析思维 不管后期从事什么职业方向,分析思维都能帮你走的更稳、更远。常用的分析方法要会,如何解决问题的能力要有。 (3)明确职业发展方向 分析自己的背景和优劣势,扬长避短,确定自己的发展目标。具体化每个阶段的小目标,设立时间节点。 如果不知道怎么设定目标,可以上招聘平台上搜一搜自己想去的行业、公司,都在招聘什么样的岗位,然后总结一下自己想去的岗位都要求了哪些专业技能。 (4)准备简历 准备简历可不是找个人帮你润色文字这么简单。准备简历要在内容上下功夫,让简历上呈现的内容尽可能的达到岗位的要求,这就需要首先你自己的水平达到了要求 (5)学习招聘要求的刚需技能 根据自己的职业方向确定技能树,一定要深,千万不要什么都大概会一点。学习要由浅入深,一步一个脚印,不要嫌简单,简单的你都不会何谈更高级的 (6)做项目给简历锦上添花 技能打牢以后,在没有实习机会的时候多做几个项目,做精做透。这里要强调一点,做项目并不意味着你看一遍看懂就行了,一定要自己动手完完整整的实现一遍,不然面试问到细节,你都答不上来。 4.常见面试题有哪些? (1)sql面试题考察的知识点 多表查询、标量子查询、关联子查询、窗口函数、如何分析产品日活。 (2)业务相关的面试题 常用的指标有哪些、对比分析方法、多维度拆解分析方法、漏斗分析方法、AARRR模型分析方法、假设检验分析方法、A/B 测试。 上面内容选自猴子社群会员的求职经验分享,来源:⠀ https://zhuanlan.zhihu.com/p/116487164 推荐:你有一份求职秘籍待领取
先说结论,按下面顺序去选择:行业>城市>公司>岗位。因为条件概率决定了你能走多远。接着你应该问自己下面几个问题:1.选择哪个行业?2.选择哪个城市?3.选择行业中的哪种岗位? 带着这些问题,我们下面一起聊聊。1.选择哪个行业?俗话说「男怕入错行」,就是在说选择行业很重要。前见年机械很火,有很多人选择了机械专业,毕业后发现人工智能时代来了,在这个时代趋势下,干机械的想转人工智能相关的工作,只能从零开始学起。而那些当年选择计算机专业的,却因为选对了行业,可以顺势而为。我遇到很多人找工作说自己想找互联网行业的。如果你说自己想进入“互联网行业',那就说明你还没想清楚到底要干什么。因为互联网的存在是为了解决某个行业的问题,比如滴滴、高德地图解决的是出行交通行业的问题,小学英语在线平台vipkid解决的是教育行业的问题,蚂蚁金服解决的是金融行业的问题,饿了么解决的是餐饮行业的问题。只有确定了行业,才能研究这个行业是什么,你要准备做哪些与行业相关的项目放到简历里。这样对症下药,找到工作的概率才是最大的。想想,你要找金融行业的工作,但是你简历里放的项目经验都是其他行业的,而另一个人的简历里做的都是金融相关的项目,哪个被录用的可能性更大呢?肯定是那个行业相关的。保持在行业上的积累,对于职业成长很重要。我看到过很多人技术很厉害,但是工作几年发展却受限,成为不了某个行业的专家。是因为今天跳到A行业,明天跳到B行业,这样做行业经验无法积累,导致哪个行业的业务都不精通。如果你不想做现在的职位了,要注意换岗不还行,也就是不要随意换行业,避免跳到一个陌生的领域,但是可以换到相关行业的其他职位。在一个行业的业务知识积累,可以让你成为这个领域的专家,要知道,行业经验是你的核心竞争力之一。 在风口上,猪都能飞起来。所以,在找工作的时候就要问自己:我要从事的这个行业是朝阳还是夕阳产业? 是否能给我更稳定的发展时间? 那么问题来了:“我怎么知道哪个行业是有有前途的?”了解一个行业最好的办法就是找这个行业的从业人员去问。如果没有这样的朋友,那也没关系。在2网络发达的今天,你总能在互联网上找到想要的东西,这里我列了去哪查找各个行业发展的办法:在哪里能找到各行业的分析研究报告?www.zhihu.com图标 2.选择哪个城市?当我们听到"世界是平的",似乎意味着居住在任何地方都能和外界联系并高效工作,所以家住何处似乎也变得无关紧要。《你属哪座城市》的作者研究证明,这个认识是完全错误的,全球化潮流导致的恰恰是地区差异进一步拉大,选择不同的居住地,意味着完全不同的人生。 数据显示,北京、杭州、上海、深圳、广州成开发者最喜欢工作的城市,杭州成为仅次于北京的开发者偏爱城市,首次突破了北上广深的围栏。在中国西部区域,成都、西安分别成为开发者最喜欢的西南、西北两大城市。 学过概率的人,应该知道条件概率对于一个人命运的影响。不要在沙漠里挖水,而要到水多的地方找机会。世界不是平的,城市大权影响命运。要相信,环境改变命运,越大的城市赋予你的条件概率越高。 3.选择行业中的哪种岗位?在一个行业中,往往有着多种岗位。比如餐饮行业的美团,你既可以是送外卖的,也可以是前端工程师,也可以是数据库维护工程师,或者是数据分析师。选择哪个岗位更有利于自己未来的发展呢?你需要考虑:现在的工作经历写到简历上,会对下一份工作有帮助吗? 这个岗位对我的职业规划有帮助吗? 现在的技能有助于构建我的核心竞争力吗? 如果你找的工作是在自己的“最佳领域”工作,那这份工作就会比较好。所谓的“最佳领域”,就是你热爱的、你擅长的、以及社会需要的这3个重叠的领域。 类似的,关于如何确定值得付出的事业,战略咨询师,知名博主、设计师巴德·卡德尔明确指出三条准则:擅长做的,希望做的,能赚钱的。他用下面这张图画出了这个准则: 图中有三个互相重叠的圆,分别表示:你擅长做的、喜欢做的、能赚钱的。对每个重叠部分均给出了相应的建议:1)找出赚钱的方法:如果你擅长且喜欢做某事,却不能以此为生,则应该学会找出能赚钱的方法,将技能变现;2)学会说不:如果你擅长做某事且可以赚到钱,但不喜欢,则应该学会说不;3)精进技术:如果你喜欢做某事且可以赚到钱,但不擅长,则应该精进技术,转变为擅长做的。 4.总结找工作,按以下顺序优先选择:行业>城市>岗位,这样才能确保你未来赚的更多。选择比努力更重要。猴子聊求职zhuanlan.zhihu.com图标
1. 下面是1990~2019年这30年间全球市值TOP 10公司的变迁图,你能发现什么? (图片来自网络) 一家公司做到基业长青是非常难的。再优秀的公司也有可能走向衰落。 著名的金融学者威廉·伯恩斯坦就统计过,美国股市从 1926 年以来所有的投资回报,都来自于表现最好的 1000 只股票。而这些股票的数量仅占所有上市公司数量的4% 。 整体来看,公司的半衰期为10年,10年时间衡定地消失掉一半的公司,这是规律,能活过50年的公司,只有3%,这个概率相当于几乎没有公司可以长久不衰。 这也是为什么从长期来看,全球市值10大公司没有永立不倒的。 3.这对我们有什么启发呢? 对于个人投资来说,如果只投资某个公司,那么风险其实很高,因为你很难找到基业长青的公司。巴菲特给自己太太的投资建议就是直接购买标准普尔500指数基金,而不是某个公司。 4.对于刚入职场或者转行的人来说,选择一个比较大的公司对个人职业生涯更有帮助。原因有以下几点: 1)平台就是你的条件概率,正所谓选择比努力更重要。大公司的工作经历会成为你未来跳槽找工作的敲门砖。 2)大公司投入了大量财力物力来保证成熟的人才培养体系,进入以后会有师傅带你,跟着牛人学习你才能知道如何进步。而在小公司缺乏这样的条件,你只能自己摸索着去学习。 3)大公司更加稳定,小公司风险高。目前国内中小企业平均寿命3年、大企业8年。对于刚入职场的人,一切还是空白,还要租房。要知道,创业成功率是很低的,如果刚入职场就进入小公司,你不仅技术和项目还没怎么做熟练,还要应对失业的风险。 创业公司一般给员工的薪酬都会低于业界标准,而只能靠给员工一些股票期权来弥补。如果公司倒闭了,股票期权就成了废纸。不要做无畏的冒险,人还是要有风险意识。 4)当你以后准备换下一份工作时,简历上如果列着一些不知名的小公司,这没办法让你找到一份好工作。因为大公司市场上认可度更高。记住:名企的经历=名校的经历。 那什么时候适合才去小公司呢? 刚参加工作去大公司工作几年,当这些经历让你有了足够资本去任何地方的时候,再去加入创业公司也不迟,比如你的技术已经经过几年磨砺很厉害了,你的家人和孩子也已经安排妥当。只要你有资历,去创业公司的机会什么时候都会有。 推荐:大数据时代,个人如何选择?
【题目】 公司的app(类似滴滴、uber)为用户提供打车服务。现有四张表,分别是“司机数据”表,“订单数据”表,“在线时长数据”表,“城市匹配数据”表。(滴滴面试题) 下图左表是“司机数据”表的部分数据。为了便于讲解,之后在涉及到表的时候,用下图右表来代替。右表中展示了左表的部分代表性数据。 上表中的“产品线id”: 1是表示专车,2表示企业,3表示快车,4表示企业快车 业务问题 分析出2020年8月各城市每天的司机数、快车订单量和快车流水数据。 分析出2020年8月和9月,每个月的北京市新老司机(首单日期在当月为新司机)的司机数、在线时长和TPH(订单量/在线时长)数据。 分别提取司机数大于20,司机总在线时长大于2小时,订单量大于1,乘客数大于1的城市名称数据。 (文末有模拟数据下载) 【解题思路】 为了方便数据处理,首先将这些表中所有的日期数据转化为日期格式 ‘年-月-日’ 的形式。需要使用 date_fromat 函数。 sql语句为update 司机数据 set 日期=date_format(日期,'%Y-%m-%d');update 司机数据 set 首次完成订单时间=date_format(首次完成订单时间,'%Y-%m-%d');update 订单数据 set 日期=date_format(日期,'%Y-%m-%d');update 在线时长数据 set 日期=date_format(日期,'%Y-%m-%d'); 处理后的表如下图,可以发现对应日期列已经修改过来了。 接下来看需要分析的业务问题。 提取2020年8月各城市每天的司机数、快车订单量和快车流水数据。 (1) 2020年8月各城市每天的司机数 使用逻辑树分析方法,拆解业务需求的每个部分。 “2020年8月”,可以用 between and 函数来对时间进行条件限制。 “每天的司机数”,司机数的计算用到的表是 “司机数据” 表。当出现“每天”要想到《猴子 从零学会sql》里讲过的分组汇总,来解决“每天”这样的问题。用“日期“来分组(group by),用 count(司机id) 来汇总司机数。 “各城市”,城市在“城市匹配数据“表中。也就是“每个城市”所以用“城市“来分组(group by)。 这里涉及到两个表“司机数据” 表和“城市匹配数据“表,所以遇到多表查询的情况,要想到《猴子 从零学会sql》里讲过的多表联结。下图是两表联结的条件(通过城市id联结)。 使用哪种联结呢? 因为要查询的是司机数,所以要保留“司机数据”表中的全部数据,因此使用左联结。 sql语句如下 查询结果如下图(部分展示) (2) 2020年8月各城市每天的快车订单量 “2020年8月”,可以用 between and 函数来对时间进行条件限制。 “每天的快车订单量”,对于计算快车订单量,用到的表是 “订单数据” 表。根据题目的字段解释,“产品线id”: 1是表示专车,2表示企业,3表示快车,4表示企业快车。可以用where子句把快车数据先筛选出来(产品线id=3)。 当出现“每天”要想到《猴子 从零学会sql》里讲过的分组汇总,来解决“每天”这样的问题。用“日期“来分组(group by),用 count(订单id) 来汇总订单量。 “各城市”,城市在“城市匹配数据“表中。也就是“每个城市”所以用“城市“来分组(group by)。 在 “订单数据” 表、“司机数据”表中都没有城市数据,所以需要三表联结,下面是3表的关系图。 使用哪种联结呢? 因为要查询的是快车订单量,所以要保留“订单数据”表中的全部数据,因此使用左联结来与“司机数据”进行联结(联结依据为“司机id”)。然后,因为要对第一次联结后的表的“城市id”与“城市名称”进行匹配,所以我们用左联结来进行匹配。 sql语句如下 查询结果如下图 (3) 2020年8月各城市每天的快车流水数据 “2020年8月”,可以用 between and 来对时间进行条件限制。 “每天的快车流水数据”,对于计算快车订单量,用到的表是 “订单数据” 表。根据题目的字段解释,“产品线id”: 1是表示专车,2表示企业,3表示快车,4表示企业快车。可以用where子句把快车数据先筛选出来(产品线id=3)。 当出现“每天”要想到《猴子 从零学会sql》里讲过的分组汇总,来解决“每天”这样的问题。用“日期“来分组(group by),用 sum(流水) 来汇总流水。 “各城市”,城市在“城市匹配数据“表中。也就是“每个城市”所以用“城市“来分组(group by)。 在 “订单数据” 表、“司机数据”表中都没有城市数据,所以需要三表联结,下面是3表的关系图。 使用哪种联结呢? 因为要查询的是快车流水量,所以要保留“订单数据”表中的全部数据,因此使用左联结来与“司机数据”进行联结(联结依据为“司机id”)。然后,因为要对第一次联结后的表的“城市id”与“城市名称”进行匹配,所以我们用左联结来进行匹配。 sql语句如下 查询结果如下 提取2020年8月和9月,每个月的北京市新老司机(首单日期在当月为新司机)的司机数、在线时长和TPH(订单量/在线时长)数据。 我们将新老司机分开来分析,先针对新司机进行提取,然后老司机同理可得。 (1)提取2020年8月和9月,每个月的北京市新司机的司机数。 使用多维度拆解分析方法来拆解题目为以下子问题: 1)每个月的司机数2)条件:新司机 2)时间条件:2020年8月和9月3)城市条件:北京市 先来看子问题1:每个月的司机数 对于司机数的计算,用到 “ 司机数据” 表。根据《猴子 从零学会sql》里讲过的,遇到“每个”这类型问题要用分组汇总。“每个月”按月份分组(group by),用count(司机id)来汇总司机数。 select count(司机id) as 司机数from 司机数据group by 月份; 这里的月份怎么得到呢? 可以通过“日期”列获得:date_format(日期,'%Y-%m') 所以,上面sql修改为: select count(司机id) as 司机数from 司机数据group by date_format(日期,'%Y-%m') as 月份; 子问题2,条件:新司机å 对于 ‘新司机’ 这个条件,由题目中的释义可知:首单日期在当月为新司机。因此我们通过比较 "日期" 与 “首次完成订单日” 两列的年月 相等的,即为新司机。我们用函数 year(日期) 来提取日期中的年份。用函数 month(日期) 来提取日期中的月份。 利用如下“where”条件来表示新司机。 where year(首次完成订单时间)=year(日期) and month(首次完成订单时间)=month(日期) 加入“新司机”条件后的sql如下: select count(司机id) as 新司机数from 司机数据where year(首次完成订单时间)=year(日期) and month(首次完成订单时间)=month(日期) group by date_format(日期,'%Y-%m') as 年月; 子问题3,时间条件:2020年8月和9月 利用where加条件,between...and 函数限制时间范围。where 日期 between '2020-08-01' and '2020-08-31'or 日期 between '2020-09-01' and '2020-09-31' select count(司机id) as 新司机数from 司机数据where year(首次完成订单时间)=year(日期) and month(首次完成订单时间)=month(日期) and (日期 between '2020-08-01' and '2020-08-31'or 日期 between '2020-09-01' and '2020-09-31')group by date_format(日期,'%Y-%m') as 年月; 子问题4,城市条件:北京市 利用where添加城市条件,城市id等于北京市的id。where 城市id ='100000' 最终sql如下 查询结果如下 (2) 提取2020年8月和9月,每个月的北京市新司机的在线时长。 对于在线时长的计算,用到 “ 在线时长数据” 表。根据《猴子 从零学会sql》里讲过的,遇到“每个”这类型问题要用分组汇总。“每个月”按月份分组(group by),在线时长的总长利用sum(在线时长)来计算。 而我们发现新司机在 “在线时长数据” 表 中并没有,而是在 “司机数据”表 中通过查询语句才能得到,因此我们用两个表的联结,得到 8,9月北京新司机的在线时长,然后再利用子查询,使用sum(在线时长)得到总时长。 sql语句解析如下 查询结果如下 (3) 提取2020年8月和9月,每个月的北京市新司机的TPH(订单量/在线时长)。 由题可知,TPH=订单量/在线时长。其中在线时长我们在上一题中已经求得,因此只需求出订单量即可。 订单量的计算,会用到 “订单数据” 表,用count(订单id)来计算。然后思路与上题一样,新司机在 “在线时长数据” 表中并没有,而是在 “司机数据”表 中通过查询语句才能得到。 因此我们用两个表的联结,得到 8,9月北京新司机的在线时长,然后再利用子查询,使用count(订单id)得到总订单量。 sql语句解析如下 查询结果如下 因此,2020年8月和9月,每个月的北京市新司机的TPH=订单量/在线时长=2/4=0.5。 对于老司机的司机数,在线时长以及TPH,同理可得,只需要将 “新司机” 的条件 换成 “老司机” 即可,其他语句都不变。 分别提取司机数大于20,司机总在线时长大于2小时,订单量大于1,乘客数大于1的城市名称数据。 (1) 司机数大于20的城市名称。 司机数的计算用count(司机id),用到的是“司机数据”表,城市名称在 “城市匹配数据”中,用表的联结。联结图如下。 sql语句解析如下 查询结果如下 (2) 司机总在线时长大于2小时城市名称。 总在线时长用sum(在线时长)来计算,用的是 “在线时长数据”表,而这个表中没有城市id,因此我们需要先联结“司机数据”表,得到城市id,再通过联结“城市匹配数据”表,得到对应的城市名称。 sql 语句解析如下 查询结果如下 (3) 订单量大于1的城市名称。 订单量的计算用count(订单id),乘客数的计算用count(乘客id),用到的表为“订单数据表”,而这个表中没有城市id。 我们需要先通过“司机数据”表联结,得到对应的城市id,在通过“城市匹配数据”表进行联结,得到相应的城市名称。 sql语句解析如下 查询结果如下 (4) 乘客数大于1的城市名称。 乘客数通过count(乘客id)来计算,用到的表为“订单数据”表,而这个表中并没有城市id,所以我们需要联结 “司机数据”表来得到相应的城市id,再通过“城市匹配数据”联结,得到相应的城市名称。 sql语句解析如下 查询结果如下 【本题考点】 1.这次试题重点要考察的是表的联结。当题目中涉及到多个表之间的关系时,我们要找到多个表之间是通过什么条件关联的,然后进行多表关联。 2.考查如何将复杂问题拆解为简单问题的能力,可以使用逻辑树分析方法。 3.如何下载案例数据? 推荐:如何从零学会sql?
现在招聘网站也挺多,不同的招聘网站用户人群也不一样,所以要选择适合你的招聘网站投递简历才能找到好工作。下面的的表格是排名前10的招聘类APP。 数据来源:TalkingData《2018年招聘类APP用户人群洞察报告》应用活跃指数:根据TalkingData样本数据通过预测算法预估出的全平台活跃终端数 从表格中我们可以看出,2018年2月,传统综合招聘平台代表-智联招聘、前程无忧51job的APP应用活跃指数以较大领先优势居于招聘类APP前两位。 虽然Boss直聘、猎聘同道、拉钩等平台主打高端人才招聘、互联网人才招聘等细分定位,但是在用户规模上仍然难以与传统综合平台竞争。 所以可以得出的结论是,传统综合招聘平台在用户规模上仍居于领先。 之前社群会员给我发求助问题,说自己在拉勾网上投简历,连个面试机会都没有。这其实就是忽略了传统综合招聘平台。我给他的建议是同时在综合招聘平台智联招聘、前程无忧51job上投简历,很快就收到了面试通知,这位社群会员现在已经成功拿到58同城的offer。 我们再来看看各个招聘平台的用户人群有什么不同。下面图片中对比了三个招聘类APP的用户,其中智联招聘、猎聘同道APP用户更多集中在三线及以下城市。而拉勾APP一线城市用户占比接近40% 这给我们的决策依据是,以后你找工作,就要根据自己的城市选择合适的招聘APP来投简历。例如下面这位社群会员分享的经验: @柯本在他的面试经验中是这么分享的:我投的都是苏州和上海的岗位,主要在拉勾网、Boss直聘、前程无忧、智联招聘、猎聘网上同步更新简历,投递简历。 收到的面试邀约主要来自于Boss直聘、前程无忧和智联招聘,拉勾网上被刷掉的概率很高。 这里主要说一下Boss直聘,这个偏向于及时聊天的功能。在工作日上午的时候,可以主动跟Boss们聊天,介绍一下自己的情况,表达自身意愿,获得面试机会。这个成功率还是比较高的。 总结几条经验:1)应届生,社会招聘渠道不要忽视传统招聘平台,也不要在一个招聘平台上死磕。同时在下面招聘渠道上投简历: 3)高层人才,国外招聘渠道 5)各个招聘平台都有置顶简历的付费服务,可以提高简历的曝光率。 猴子聊求职zhuanlan.zhihu.com图标
我是潘潘潘大王: 学习准备了大概3个月,然后找了现在自己满意的工作,和你聊聊我的求职经历和工作经验。 1.如何投简历才有效果? 每年有两次旺季,在这两次旺季投简历比较好找工作。 第一次是春招,每年春节后,3-5月份,是换工作的高峰,这个时候,去年的年终奖拿到手了,满意的继续留下,对待遇、奖金不满意的,就要选择离开了。很多单位趁这个时期招兵买马。俗称“金三银四”,泛指每年的春季是求职跳槽高峰期。其实,从春节后2月开始上班开始到5月份的都是所谓的“金三银四”黄金跳槽季。 第二次是秋招,在9、10月份左右,不少公司喜欢在这个时间段招聘。俗称“金九银十”。 渠道方面不要不要在一个招聘平台上死磕。同时在下面招聘渠道上投简历:智联招聘、前程无忧51job,Boss直聘、拉勾网。 不要进行海投,很多人会选择海投简历,这貌似看上去能获得更多机会,但是后续给你带来的麻烦会把你拖崩溃。 因为投递的职位不聚集,后面收到多个面试以后,你会要花费很多精力为了应付不同的职位准备不同的内容。 例如你投递了金融领域的风控职位,还投递了自媒体领域的产品经理职位,又投递了房产领域的数据分析职位,那么你要去为不同领域准备业务知识。但是你的找工作时间是有限的,这会让你无法聚焦于自己真正擅长的。 海投简历的人,往往没有想清楚自己想要什么。只有清楚的知道自己的职业规划,想明白从事哪个领域的工作,才能提高精确的定位,才能找到自己想要的工作。 还有一点要特别注意的是,不要一个简历打遍天下。也就是不要任何职位都使用同一份简历。简历只有匹配招聘要求才能更好的获得面试机会。 所以,你需要针对不同的招聘要求,个性化准备简历,这一点对转行的人尤其重要。比如你对3家公司有意向,你可以分别准备三份简历,在工作经历和项目经历描述的语句上尽量迎合目标公司的职位描述,这样得到面试机会的概率会大一点。 2.面试经历是怎样的? 要做好准备才去面试,准备好以下常见问题,面试的时候就不会自乱阵脚。且最好准备面试作品,这样比较容易脱颖而出。(1)请做个简单的自我介绍(2)为什么从上一家公司离职?(3)对我们公司有了解吗?(4)你在工作中遇到什么样的问题,用了什么方法解决? 面试前要对应聘的公司有了解,可以从企查查上看到这家公司的历史事件和各种公开信息。 还有部分问题面试官会针对简历上的工作来进行提问,所以对自己写的简历要理清思路,在心中有底。这些常见的面试问题参考在知乎上都会有,各位多看看学习。 3.现在日常的工作是做什么? 在入职后我首先是了解业务和指标,这样才能在后续的工作中发挥更大的作用。 接着因为公司数据中心刚成立没多久,很多历史数据的保存都不规范,各种合并单元格,字段乱飞,这样对后面的数据分析非常不利,我就统一按一维表的格式规范了数据。 接着在数据展现方面,他们用的都是表格来展示业绩情况,我这一看密密麻麻的表格数字,头都痛了,领导怎么会想看到这样的东西呢。 如何在茫茫表格中找到数据要表达的东西呢,然后我用BI工具做出了很多直观且具备可读性的图补充了这方面的缺陷,领导十分的满意。这给我的经验就是,你做出的东西,要让别人容易看懂才有用。 日常的工作基本包括数据清洗,写业务报告,制作业务需要的报表和可视化 4.对于职场新人,有哪些工作经验? (1)数据分析不再是某一个固定的职位,而是各行各业一个通用的能力,这给能力可以给你的职业生涯加分,可以借助这给能力让你的工作更容易出成果。 (2)数据分析的前提是必须熟悉业务,不然分析出来的东西没意义。 (3)视角要看远一点,比如领导让我出个日报,那么我就需要站在他的角度来考虑,他想看到一些怎样的数据。然后再动手收集和制作,这样做出来的报告更容易得到领导的认可。 (4)数据一定要保证准确性,否则我们做的分析统统报废。同时分析前原始数据要做好备份。 (5)要不断的学习,不管是常用的分析方法还是分析工具上,这样我们将能看到更多的事物和做更多的分析。 上面内容来自猴子社群会员的求职经验分享,来源:⠀ https://zhuanlan.zhihu.com/p/94240897 推荐:你有一份求职秘籍待领取
1.excel 不方便多人共享使用数据excel好比一个移动硬盘,你打开使用excel,你的同事就无法再使用了。数据库好比网盘,你和同事可以愉快的一起使用网盘或者数据库里的数据。2.excel无法存放大量数据excel可以存放十几万的数据,但是大数据时代,从来就不缺少数据,当数据量越来越大的时候,excel就无能为力了。而数据库却可以存放海量的数据。所以,你看到淘宝几亿人使用,背后存放商品的不是excel,而是数据库。3.excel无法处理复杂问题数据库可以应对突发事故,比如数据丢失、数据被盗。数据库可以处理复杂的业务,比如银行存取款业务。这些功能excel都不具备。因为公司的数据是放到数据库里的,所以现在的数据分析、机器学习、开发工程师等职位在招聘要求中都会要求:使用过数据库,熟悉SQL。具体的数据库和SQL关系我在《从零学会SQL:入门》课程里用“建筑施工人员”类比过,是下面图片里的关系: 从零学会SQL:入门www.zhihu.com图标
【题目】 现有用户登录时间表,记录每个用户的id,姓名,邮箱地址和用户最后登录时间。表如下: 问题:生成一张临时表(表名:用户登录表),表中呈现四列数据分别为:姓名,最后登录时间,登录时间排名,登录天数排名 要求: 1.“登录时间排名”这一列:按时间给出每个人的登录次数,登录时间最早的为1,之后的分别是2,3,4等。 2.“登录天数排名”这一列:按天给出每个人的登录次数,同一天多次登录认为是同一次,最早标记为1,之后以此类推。 【解题思路】 题目没看懂,对吧?没事,使用逻辑树分析方法,将复杂问题拆解为简单问题。 看看我们已有的字段有:姓名,最后登录时间,未知的字段 :登录时间排名,登录天数排名两列,要求的表格如下图: 接下来看如何得到这个表里的每一列。 1.“登录时间排名”这一列:按时间给出每个人的登录次数,登录时间最早的为1,之后的分别是2,3,4等。 (1)当“每个”出现的时候你能想到什么? 就是《猴子 从零学会sql》里讲过的:每个出现的时候,就要想到是分组汇总。 表里能区分“每个人”的是“姓名”,所以按“姓名”来分组(group by或者窗口函数的partiotion by)。 汇总的要求是“登录次数”(登录时间最早的为1,之后的分别是2,3,4等),这句话翻译成大白话就是用登录时间来排序,最早登录记1,第二次登录记2 ,依次排序。也就是排名。 因为是排名问题,所以使用分组(窗口函数partiotion by 姓名),并按最后登录时间升序排列(order by最后登录时间 asc),套入窗口函数的语法,得出下面的sql语句: select 姓名,最后登录时间, row_number() over (partition by 姓名 order by 最后登录时间 asc) as 登录时间排名 from 用户登录表 ; 查询结果如下: 2.“登录天数排名”这一列:按天给出每个人的登录次数,同一天多次登录认为是同一次,最早标记为1,之后以此类推。 同一天多次登录认为是同一次,也就是同一天排名相同,我们用test1登录次数举例,如下图: 排名问题,要使用窗口函数。因为同一天登录的记录排名相同,不占用下一名次排名,所以用dense_rank函数, 按姓名分组(partiotion by,并按最后登录天数升序排列(order by,升序asc)。套入窗口函数的语法,得出下面的sql语句: select 姓名,最后登录时间, dense_rank() over (partition by 姓名 order by 最后登录时间 asc) as 登录天数排名 from 用户登录表 ; 得出查询结果如下: 发现上面的查询结果里“登录天数排名”里是登录时间,而题目要求是登录天数,所以需要使用date_format(date,format)来转化为时间格式: date_format(最新登录时间,’%Y%m%d’)。 套入上面的sql语句中就是: select 姓名,最后登录时间, dense_rank() over (partition by 姓名 order by date_format( 最后登录时间,'%Y%m&d' ) asc) as 登录天数排名 from 用户登录表 ; 查询结果如下: 3.将得到的2列合并到题目要求的表中 查询代码如下: select 姓名,最后登录时间, row_number() over (partition by 姓名 order by 最后登录时间 asc) as 登录时间排名, dense_rank() over (partition by 姓名 order by date_format( 最后登录时间,'%Y%m&d' ) asc) as 登录天数排名 from 用户登录表 ; 查询结果如下: 【本题考点】 1.考察逻辑思维能力,如何将复杂问题转化为可以解决的子问题能力。这时候可以使用逻辑树分析方法。 2.本题本质上是“分组排名”问题,就要想到用窗口函数。 3.考察窗口函数的 dense_rank, row_number的区别和使用。dense_rank函数,如果有并列名次的行,不占用下一名次的位置(即1,1,2,3);row_number函数:不考虑并列名次的情况(即1,2,3,4)。 4.考察时间格式的数据如何灵活转换,用date_format(date,format)根据format的指定的格式显示date值。 【举一反三】 下表是双十一客户购买清单表。双十一当天,商家为每位客户购买的第一个商品免单,请找出商品名称,客户姓名及购买金额。 参考答案: 双十一当天每个客户(分组)第一个下单的商品(按购买时间来排名),是“分组排名”问题,使用窗口函数来解决。 select 客户姓名 ,商品名称 ,购买金额,购买时间, rank() over (partition by 客户姓名 order by 购买时间 asc ) as 下单顺序 from 双十一客户购买清单表; 查询结果如下: 2.题目要求是商家为每位客户购买的第一个商品免单,接着上面的查询结果写,可以加入一个where子句把“下单顺序”值为1,把第1个商品筛选出来。 查询结果如下: 推荐:如何从零学会sql?
【业务问题】 下面的Excel记录了某款电商产品在1月1日发布,1个月后的新增及留存数据、商品销售数据、商品详情页浏览数据、及商品信息表: (文末有数据下载) 现在业务部门需要你分析出:(1)1月5日的DAU是多少?(2)从留存的角度来看,质量最高的新增用户来自哪一天? (3)在1月15日当天,SKU销售激活率是多少? (4)商品“品类T582”的详情页购买转化率在哪天最高?(5)1月10日当天的ARPU值是多少? 【分析思路】 1月5日的DAU是多少? DAU是日活跃用户数。定义指标日活跃用户数=当日新增的用户数+之前每日的留存老用户数。 求1月5日的日活跃用户数=1月5日当日新增用户数+1月5日前每一日新增用户在1月5日的留存用户。 (1)1月5日当日新增用户数 在“新增及留存”表格中,可直接得1月5日当日新增用户数是6680。 (2)1月5日前每一日新增用户在1月5日的留存用户 也就是1月4日的1日留存数(1月4日的1日就是1月5日),1月3日的2日留存数(1月3日的2日就是1月5日),1月2日的3日留存数(1月2日的3日就是1月5日),1月1日的4日留存(1月1日的4日以后是1月5日),这些留存数可以在“新增及留存”表中可得到,如下图。 因此,1月5日前每一日新增用户在1月5日的留存用户数= 1月4日的1日留存数(2966)+1月3日的2日留存数(2628)+1月2日的3日留存(2775)+1月1日的4日留存数(3432)=11801 所以,1月5日DAU=1月5日新增用户数+1月5日的留存老用户数=6680+11801=18481。 2.从留存的角度来看,质量最高的新增用户来自哪一天? 如何定义质量高的新增用户呢? 可以用留存率这个指标来比较,看哪天的留存率最高。 用户在某天开始使用某产品,一段时间后仍继续使用即被认为是留存用户数,也就是有多少用户留下来了。这部分留存下来的用户占当时新增用户的比例即是留存率。 在本案例中,我们可以用7日留存来定义新增用户的质量。在计算过程中将每日的7日留存作为比较的基础。 7日留存指的是一个用户留存了7日,第1日新增的用户,在第7日仍然活跃,那么他就可算做是7日留存的用户。 第7日留存率=(第一天新增的用户中,在第7天还有登录的用户数)/第一天新增总用户数=6日留存数/当日新增数 在Excel中如何计算留存率呢? 以下图为例,用6日留存数据(C3列)/当日新增(B3列) 在“新增及留存”表中计算出的第7日留存率如下: 对第7日留存率进行降序排序,结果如下: 可以看到,在这一个月内,根据第7日留存率来比较,1月9日的第7日留存率最高,达到52.35%,因此,该日的新增用户的质量最高;其次是1月17日。 3.在1月15日当天,SKU销售激活率是多少? SKU=stock keeping unit(库存量单位),针对电商而言,一款商品每个品类就是一个SKU,用以区分单品,便于电商品牌识别商品。 SKU销售激活率=当日有销售记录的品类数/SKU总数 (1)SKU总数 在本案例中,可将一个品类认为是一个SKU,所以,由“商品信息表”可知,该款电商产品的SKU数量=108(也就是商品名这一列有多少行数据) (2)当日有销售记录的品类数 “商品销售情况”表,记录的是每个商品品类在1月1日到1月31日的销售数量,如果某品类当天销售记录为0,表示当天该品类没有销售记录。 例如下面的“品类T441”在1月1日的销量为0,说明在这一天该品类没有销售记录。 我们要求1月15日当天有销售记录的品类数,就是求“商品销售情况”表中,1月15日的有多少行数据是大于0的。 因此,可以用条件计数函数(countif)来对“1月15日”这一列销售记录进行计数。公式为: =countif(商品销售情况!$P$2:$P$109,">0") 返回结果是90,也就是说1月15日当天有销售记录的品类数为90。 (3)SKU销售激活率 所以,1月15日当天,该款电商产品的SKU销售激活率=当日有销售记录的品类数/SKU总数=90/108=83.3% 4.商品“品类T582”的详情页购买转化率在哪天最高? 在本案例中,定义详情页购买转化率=当日售卖件数/当日页面浏览次数,用于衡量商品在当天的售卖情况。 (1)品类T582的每日售卖数 在这里,我们要用查找函数(vlookup)来查找品类T582的每日售卖数,公式如下: =vlookup("品类T582",商品销售情况!$A$2:$AF$109,column (B1),0) 公式解读:vlookup语法为 vlookup(要查找谁,在哪个范围里找,返回第几列,是否精确匹配) 第一个参数:要查找谁,要查找品类T582; 第二个参数:在哪个范围里找,在“商品销售情况”表的A2:AF109这个范围里找,也就是说,在“商品销售情况”表里1月1日到1月31日的所有商品销售记录里找; 第三个参数:返回第几列,找到之后,返回第几列的记录呢?要返回1月1日,1月2日,1月3日…直到1月31日的销售记录,也就是说,要返回第2列,第3列,第4列…第N列的记录。因此,在这里,我用列函数column函数来构建一个自然数序列。 column函数返回给定单元格引用的列号。如公式=column(B1),返回的是单元格B1所在的列号,即第2列,所以,返回2;公式=column(B10),返回的是单元格B10所在的列号,同样也是返回2;公式=column(C1),返回的是单元格C1所在的列号,即第3列,所以返回3。 在此案例中,我就是用列函数column函数来构建一个自然数序列,当公式往右填充时,column (B1)就会自然地变成column (C1), column (D1),column (E1)…作为vlookup函数的第三个参数,为其提供自然数序列。 第四个参数:是否精确匹配。0,代表精确匹配,1,代表模糊匹配。在本案例演示中,要精确匹配,所以用0 (2)品类T582的每日页面浏览次数 同样的原理,我们用vlookup函数来查找品类T582在1月1日到1月31日每日的浏览次数,公式为:=vlookup("品类T582",商品浏览情况!$A$2:$AF$109,column(B1),0) (3)每日详情页购买转化率 如下图我们已分别查找出品类T582在1月1日到1月31日的每日售卖数及每日浏览数。因此,当日的详情页购买转化率=当日售卖件数/当日页面浏览次数,结果如下: 可对详情页购买转化率进行降序排序,得到转化率最大值是1月29日的71.1%,也就是说,“品类T582”这个商品的详情页购买转化率在1月29日这天最高。 5.计算1月9日当天的ARPU值 ARPU=当日销售总额/当日DAU=销售数量*单价/DAU (1)当日销售总额 销售总额=销售数量*单价。 销售数量在“商品销售情况”里,单价在“商品信息表”里,涉及到多个Excel表,需要使用查找函数(vlookup),找到匹配每个商品的单价,公式为 =vlookup(A2,商品信息表!$A$2:$B$109,2,0) 然后,当日销售总额=销售数量*单价,求得每日销售总额,如图: 1月9日的DAU,根据第一个问题的方式可得:24053 那么,1月9日的ARPU=当日销售总额/当日DAU=销售数量*单价/DAU=242900/24053=10.1元。 6.总结 (1)首先需要知道常用的指标有哪些,就像《业务指标》里讲过的,要从下面4个问题出发来明确指标的统计口径。业务含义:该指标在业务上表示什么; 数据来源:从什么地方收集的原始数据; 统计时间:统计数据的时间范围是什么。 指标定义:如果是占比、比例,得定义清楚是什么除以什么;如果是相加,得定义清楚是什么加上什么。 (2)用Excel来计算指标会涉及到常用的函数,要把数据分析常用的函数掌握才能高效完成职场中的工作。 (3)案例数据如何下载? 推荐:常用的业务指标有哪些?
做好了都挺赚钱的,数据分析师偏业务,数据挖掘偏技术。对于零基础想进入这个行业的人,我更喜欢用下图来说明这两个职位的发展方向: 对于零基础的人来说,这个图是是什么意思呢?其实,任何行业随着你深入发展,都分为3个阶段:初级,中级,高级。这根打游戏闯关一样,一级一级网上爬。所以,如果是零基础进入这个行业也对应规划为这3个阶段,你按下面各个阶段要求来对号入座。 1、初级数据分析师工作内容:要求熟练使用Excel,PPT。针对产品经理提出的需求来做分析。然后用PPT做分析报告。比如说,之前社群会员面试的一家互联网教育机构,他们的要求就是用Excel整理学生买课的信息,看看哪一门课程最受大家喜欢之类的。 需要掌握的核心技能:Excel,PPT,描述统计分析,业务知识月薪:这种职位的大概薪资在一线城市的话大概税前有5000-10000常见的职位名称有:数据分析师,数据运营,商业分析,战略分析,经营分析,市场行业分析 给你看个招聘要求直观感受下: 2、中级数据分析师:工作内容:不仅要会技术还要懂业务,通过发现问题,分析问题,得出结论,为公司的决策做支持。主要干的工作是数据提取、撰写分析报告。负责和支撑各部门相关的报表,监控数据的波动和异常,找出问题,输出专题分析报告。 需要的核心技能:Excel,PPT,统计概率,业务知识熟悉SQL月薪:这种职位的大概薪资在一线城市的话大概税前大概是7000-20000+ 这个级别的招聘要求如下: 3、高级数据分析师工作内容:通过编程来处理数据,分析数据,建立模型,预测。 需要的核心技能:统计学(推论统计分析,A/B测试),熟悉SQL,编程语言Python或者是R月薪:这种职位的大概薪资在一线城市的话大概税前有15000-30000+ 来个招聘职位感受下: 对于高级数据分析师的职业发展,如果喜欢业务方向,可以往管理端发展,常见的职位名称有:数据产品经理、数据运营经理。如果喜专研技术,可以往技术专家端发展,常见的职位名称有:数据挖掘工程师、数据开发工程师、大数据工程师。 4、未来的跳槽出路是什么?如果是往业务端发展,最终可以成为业务资深专家,总经理,或者CEO。我的一位师兄,经过几年的发展,从刚毕业一名数据分析师,到现在已经是一家公司的总经理,他的优势就是既懂数据,又懂业务。他刚毕业也是在北京租房子,现在早已实现了财务自由。 来个招聘职位感受下,都需要多年行业的积累,才能成为这个行业的专家。 如果是往技术端发展,你如果工程技术能力突出,那么可以担任公司数据科学部门的老大,常见的职位名称是数据科学家。你如果理论能力非常强,可以写paper,那么可以担任研究院的一把手。我的导师因为科研能力强,现在是一个科研单位数据部门的负责人。 三、如何选择适合自己的职位呢?1、学习适合自己当前能力的知识弄清楚自己的基础是怎么样的,学习转行从事哪个岗位的难度更小些,以及自己更适合哪个岗位。很多人一上来没有任何基础,就开始啃机器学习这是不对的。因为你没有统计概率,数学基础,里面很多专业术语根本无法理解。 数据科学是一门交叉学科,除了计算机相关知识,还需要有统计学、数学基础,以及一定业务知识。所以可以作为终身职业发展目标,每天学习一点,慢慢积累进步。 搞清楚各个职位的区别,以及了解自己的基础,知己知彼,就对学习和转行有方向和信心了。最关键的是要在自己的“最佳领域”工作。所谓的“最佳领域”,就是你热爱的、你擅长的、以及社会需要的这3个重叠的领域。 2、新人如何成长呢?面对不同的职位,我们需要结合自身经历、个人能力选择一个上车,才能分享到人工智能时代的红利。数据分析师是比较适合上车的方向,因为它起步门槛相对较低,市场需求量大,未来职位发展空间好。零基础建议从初级数据分析开始学起。 3、成为一个关键时刻不放弃的人我观察过身边的人,不管是同学、同事、还是创业合作伙伴,发现大多数人越到关键的时候,越容易放弃。 然而,那些最终坚持下来的,最后都成功了。所有的成长都源于那关键时刻的一点坚持。大多数人都是刚开始一腔热血,找来一堆资料,但是遇到困难却不想解决,在进步的前一刻放弃了,所以他们从来没有感受过成功的快感。 上面是对于完全零基础想进入这个行业的人,数据分析和数据挖掘的职业发展轨迹。愿你在这个行业,成为一个关键时刻不放弃的人。猴子聊数据分析zhuanlan.zhihu.com图标
我是steryences: 入职到现在已经一个多月了,很早之前就计划把找工作以来的经历做一个总结和分享,但这件事情一直被列在我的清单里,因为各种原因拖了好久都没有完成。 毕竟反思总结是一个自我剖析的过程,正视自己的过去,并尝试着寻找和发现问题,并不是一件容易的事。 自从入职以后,每一个疲倦的夜晚,当我思考着怎么才能提升自己,把工作和生活规划好,最后都得出结论:反思整理和总结才是有效的途径。所以我终于找了个空闲的周末,把这篇求职经验写了下来。 1.之前工作是干什么的? 我在上一家公司主要做的是偏技术性的开发工作,7月底的时候我提出了离职申请。 当时我辞职的原因一方面出于公司内部人员变动,一方面是因为自己有了新的职业规划。 正常情况下离职的程序是,要提前一个月向公司提出申请,一个月后就可以离开公司了。 我本来准备在提出申请之后,利用这一个月的时间投简历,面试。但可能是因为公司正在经历业务转型,加上我刚把最近一个阶段的项目完成,所以公司根本没给我一个月的时间来进行工作上的交接,我周五申请离职,第二周周一就办完了离职手续。 2.如何准备学习的? 面对突如其来的裸辞,我还是有点受打击。在没有经过慎重考虑之后做决定,是我为自己的冲动和不计后果付出的代价。 但是我安慰自己,裸辞也不是没有好处,至少我能把精力集中到学习和找工作上面(但是我仍然不建议你裸辞,建议拿到下家offer,再考虑是否辞职,这样风险低)。 于是在调整了一个星期之后,我从8月初开始继续学习准备。我的自控力比较弱,在家就想着放松或者睡觉,所以去图书馆能让我在一种群体学习的氛围带动下,更专注更有效率,因此我决定每天跑图书馆学习。当然你也可以线上加入一些学习氛围好的群,利用群体学习的氛围带你向前。 因为我在年初就为自己制定了学习计划,所以即便裸辞之后没有工作,也不会觉得特别迷茫。 计划虽然没有严格按时完成,但我做到了把每一个阶段的学习内容都至少学完一遍,并且把总结以文章的形式写出来,这样我的投入和产出就得到了量化,心里也会比较有底气一点。 3.我是如何投简历的? 我把自己投简历的计划分为了两个阶段。 首先我准备花一个月的时间来投简历。前半个月我把投递目标聚焦在金融行业,如果收效甚微,面试邀请不多的话,我就在后半个月把目标行业放宽,把市场上需求量比较大的电商行业的工作也考虑进来。 不过在实际的求职过程中,我发现对感兴趣的企业还是金融行业偏多,想必这也是因为我学习过程中做的两篇分析报告都跟金融行业有关。 后来虽然有一些电商行业的公司也邀请我去面试,但是我对这些企业五花八门的业务模式和需求并不了解,也没有花时间去研究,所以就拒绝了。 4.面试经历是怎样的? 在每次面试之前,我都会花至少两天的时间搜集和整理求职公司的相关信息,熟读岗位的招聘要求。 然后再去衡量自己的知识技能储备与公司职位招聘要求的匹配度,从而总结出自己的优势和不足。 最开始的两次面试经历比较失败,一次卡在了笔试,印象很深刻的一个问题是:如何用数学的方式定义一个留存矩阵来表示不同人群新增客户的留存率?并尝试通过SQL语句查询相关数据来得到这样的矩阵?(可能是还没有足够的水平,我感觉这种问题就是面试造火箭的典型代表。) 第二次是卡在了技术能力方面,面试官问到了SQL中的窗口函数,我只是简单了解过,但没有真正使用过。 面试官还问了一个问题,关于如何把生产数据按月累积汇总,我当时脑子有点不清醒了,想了五分钟没有想出来,于是面试官委婉的表示我的经验和能力还达不到要求,后来就没消息了。 回去之后我开始集中提升SQL技能,把常见的面试题都做了一遍的使用。 大概在9月中下旬的时候接到了一个金融信贷公司发来的面试邀请,我很感兴趣,于是开始认真准备。 面试持续了很长时间,也分了好几轮,每次都是面完一轮等两三天收到结果,然后通知下一轮面试。 首先是HR小姐姐打电话找我,跟我介绍了公司的情况,问了我一些基本问题,包括能不能接受长期出差等等,当天晚上还发了一份行测笔试题给我做。 两天之后,部门领导面试我,问了一些简历上的问题,侧重于考察上一份工作经历和简历上写的项目。 这轮面完后过了一周,公司领导跟我进行远程视频面试,也是问工作经历和做过的项目,但是问到了以前工作的细节,也问了在做项目的时候用了哪些分析方法。虽然自己感觉回答得并不是很流畅,但还是面试通过了。 过了一周,HR约我去公司进行最后的笔试和面试。我来到公司做完一份综合了对SQL查询,还有分析思维考察的笔试题之后,HR就来跟我面试了。 我们聊了一个小时,他对我的简历进行了深度挖掘,根据我过去的每一段经历进行了探索性的提问。还好我也算是积累了一些面试经验,并且每一次面试完之后都会做一个简单的总结,所以我的回答也让HR比较满意。 最后一个人事部的总监一起进来又跟我聊了一次,他们说我刚刚的笔试题里面,SQL语句写得还不错,只是从考察分析思维的题目来看还是缺乏经验。 因此他们跟我初步谈了谈薪资,然后又给我规划了一下未来的成长计划。这一次我感觉已经快要谈成了,就等最后的offer。 果然不出我所料,虽然又拖了一个多星期,但HR最后还是通知我被录用了。因为是我感兴趣的工作,所以我没有犹豫就接受了。 5.现在的日常工作是做什么? 我现在的岗位是风险策略分析师,属于公司的风控部门。工作中涉及到的任务包括完成信用卡贷前的自动化授信审批,以及通过数据分析来制定贷中调额策略和贷后催收策略等等。 入职的第一周在学习信用卡的业务模式和流程,第二周开始接触银行的数据指标体系,并且学习利用pyhton和sql来对底层数据进行筛选和提取,得出需要用到的指标数据来进行分析和制定策略。第三周参与到贷前信用卡审批模型的测试工作中。从第五周开始到现在一直在进行贷中和贷后部分的工作。 6.对于求职的人有什么想说的? 对于求职的人来说,最重要的当属找到一个清晰明确的目标,然后将目标拆解,分阶段按计划来落实。 这种做法对于未知的前路有很强的指导意义,有助于缓解迷茫和焦虑。 总有些时候会因为各种原因而焦虑、怀疑自己,比如投简历没有收到回复,比如面试表现不好等等。 在压力下调节自己的心情很重要,但是要把握好调节的尺度,如果让自己太放松容易产生逃避心理。如果让自己太紧绷容易造成抵触情绪。 这些经历都要自己去体会。成长就是这样,过程自然很痛苦,但是破茧成蝶的一刹那就会发现,所有的努力都是值得的。 最后祝愿所有想要做出改变,正在经历转型期的朋友都能顺利实现自己的目标。 上面内容来自猴子社群会员的求职经验分享,来源:⠀ https://zhuanlan.zhihu.com/p/83026421 推荐:你有一份求职秘籍待领取
人在江湖,生不由己。人在职场,Excel必备。为了帮助更多人快速掌握职场必备技能Excel,我写了一个免费的教程《职场Excel》,能帮助你解决99%职场中遇到的问题。对,你没看错,是完全免费的。点击下面章节的名称就可以学习了。《职场Excel》第1章:快速处理数据1.如何快速选中数据2.如何查找和替换数据?3.Excel的数据类型4.如何进行数据验证?5.如何删除重复数据? 第2章:数据可视化入门1.如何制作图表?2.如何设置图表属性?3.设计图表的原则是什么?4.如何看懂图表? 第3章:数据可视化进阶1.管理项目工具甘特图如何制作?2.如何制作组合图?3.如何制作创意图表?4.数据条:让表格一目了然5.突出显示重点数据?6.如何让数据高亮显示? 第4章:用函数让工作高效1.字符串截取函数2.多表查询:vlookup函数3.查找函数:index+match组合4.求和函数 第5章:Excel函数进阶1.如何实现排名?2.自动判断:if函数3.摆脱手工计数:countif函数4.日期问题:dateif函数来搞定猴子数据分析zhuanlan.zhihu.com图标
【题目】 下面的Excel表格是骑手(外卖小哥)的配送信息 文末会给出数据下载地址。现在的业务问题是: 1、分析差评原因,并给出改善方案;2、骑手姓名重复默认为同一个骑手;同一个骑手可能在不同站点出现差评 【参考答案】 一.明确问题 需要分析导致分析差评的原因是什么,并给出改善方案。可以使用《猴子数据分析》里第6关讲过的分析方法,和第7-8关的如何用数据分析解决问题的框架来完成。 二.分析原因 使用多维度拆解分析方法,从下面3个维度展开分析,在每个维度里面使用对比分析方法来比较。 (1)差评标签:各标签占比情况如何,各站点标签占比情况对比。(2)骑手:骑手差评数、配送时间指标情况,分析典型样本的具体标签分布。(3)站点对比:站点差评指标和配送时间指标对比,评价各站点表现以及存在的问题。 分析思路如下: 通过在Excel中分列功能对“顾客配送评价标签”这一列处理,得到下面的几列。 新增两列“取餐时长”和“总时长”,指标定义如下:取餐时长=骑手接单时长+到店时长+到店等餐时长;总时长 = 取餐时长+送达时长 1.差评标签分析 下图是差评的总体情况: 下图是各站点的差评情况: 从图中可以得出结论: (1)总体情况来看,“送达超时“占比最高为29.65%,这是导致差评的主要原因;其次是态度不好、其他、少餐/撒餐。 (2)从各站点情况来看,“送达超时”出现频率都为最高。A站点“态度不好”占比第二22.56%,与占比第一的“送达超时”差距仅为1.5%;E站点“送达不通知”标签占比第二,为次要原因。 2.骑手分析 下图是骑手总体配送情况 下图是差评前5骑手配送时间情况 从上图可以得出结论: (1)配送时间指标大大高于平均值的骑手。对比差评数前5的骑手,其差评数并未相应升高,可见配送时长这一单一维度并不对用户差评起决定性作用。 (2)抽样调查骑手差评数前4位: 李*骑手: 该骑手的平均总时长、平均取餐时长、平均送达时长3项指标时长皆低于平均值。 但其对应评价标签中,出现频率最高的是“送达超时”和“其他”。其配送时间指标显然与评价不符,为防止恶意差评,需进一步沟通了解具体情况。 刘*骑手: 该骑手的平均总时长、平均取餐时长、平均送达时长3项指标时长皆高于平均值,与其对应评价标签中出现频率最高的“送达超时”相符。 陈*骑手: 该骑手平均总时长、取餐时长、送达时长3项指标时长皆低于平均值,其对应评价标签中出现频率最高的是“态度不好”,可见态度较差是该骑手获得较多差评的主要原因。 王*骑手: 该骑手平均总时长、平均送达时长低于平均值、取餐时长略高于平均值。其对应评价标签中出现频率最高的是“提前点送达”,可见该骑手常常违反规定进行“提前点送达”操作,导致用户不满,且致使其配送时间指标失真,存在欺骗行为,需要重点关注。 3.站点分析 从上图可以得出结论:(1)站点C在差评和配送时间多项指标对比中都表现最差。为所有站点中最需要调整改善的. (2)A站点在配送时间各项指标都低于平均值,表现优秀。但差评指标在所有站点中排名第二,说明该站点人员在其他方面存在一定问题。 对比之前的A站的差评标签占比情况,我们得到了相应的数据支持,“态度不好”标签占比第二为22.56%。 (3)D、F站点则在差评和配送时间的多项指标中表现优秀。 4.分析汇总 通过数据可视化图表信息,可以得出以下结论,用户差评占比最高的问题为“送达超时”。 但通过多项数据对比分析发现,骑手的配送时间长短这单一维度,并不对用户差评数起到决定性作用,“态度不好”的问题尤其需要重视,而“其他”、“少餐/撒餐”、“提前点送达”等为次要原因。 三.提出建议 1.站点C在各项指标中都表现较差,说明该站点骑手培训和管理上存在较大漏洞,总部应督促站长加强内部管理和培训,优化工作流程,提升骑手的配送效率和服务态度。 2.站点A在配送时间指标上表现优秀,但其差评原因中高比例的“态度不好”反馈,说明该站点骑手服务态度存在较大问题,容易让用户降低对平台的忠诚度,站长应加强对员工的服务培训,并增加对应的具体奖惩措施,规范骑手的服务态度。 3.建议不同站点,不同骑手间,根据数据指标,建立合理的绩效排名体系,增强内部竞争意识,提升整体公司效率。 4.对于差评标签带有:态度不好和少餐/撒餐的情况的订单,首先要给用户发送致歉短信,给予一定外卖红包奖励(金额做好控制),获取用户谅解,让用户保持对平台的好感。 对于态度恶劣的员工,在了解清楚具体情况以后,应要求员工电话回访客户致歉,并进行相应处罚。 对“提前点送达”这种可能会导致绩效考核指标失真以及破坏用户体验的违规行为,要进行重点排查和处罚。 面试题数据下载在公众号(猴子聊人物)对话框回复“资料”,在下面路径下: 参考答案来自猴子社群会员,来源: https://zhuanlan.zhihu.com/p/131404140 推荐:人工智能时代,你必须要学会这个通用技能
【题目】 “雇员表“中记录了员工的信息,“薪水表“中记录了对应员工发放的薪水。两表通过“雇员编号”关联。 查找当前所有雇员入职以来的薪水涨幅,给出雇员编号以及其对应的薪水涨幅,并按照薪水涨幅进行升序。(注:薪水表中结束日期为2004-01-01的才是当前员工,否则是已离职员工) 【解题思路】 要求出当前所有雇员入职以来的薪水涨幅,薪水涨幅=当前薪水-入职薪水。 所以,需要知道雇员的入职薪水和当前薪水。 当前薪水是“薪水表“中的“结束日期”=2004-01-01,这一行对应的薪水。 入职薪水是“雇员表“中的“雇用日期”=“薪水表“中的“起始日期”,这一行对应的薪水。 【解题步骤】 当前薪水 当前薪水是“薪水表“中的“结束日期”=2004-01-01。从“薪水表“给的案例数据可以看出,“雇员编号”(10002)有两条薪水记录,说明他经历过一次涨薪。“雇员编号”(10005)的薪水“结束日期”不是2004-01-01,说明该员工已经离职。“雇员编号”(10006)有一条薪水记录,说明他没有经历过涨薪。 select 雇员编号,薪水 as 当前薪水from 薪水表where 结束日期 = '2004-01-01'; 入职薪水 入职薪水是“雇员表“中的“雇用日期”=“薪水表“中的“起始日期”。 这涉及到两个表,因此需要用到多表联结,拿出《猴子 从零学会SQL》里面的多表联结图。 使用哪种联结呢? 因为题目要求的是“查找当前所有雇员”,所以用“雇员表”为左表,保留左表的全部数据,所以使用左联结。 select a.雇员编号,薪水 as 入职薪水from 雇员表 as a left join 薪水表 as bon a.雇员编号 = b.雇员编号where a.雇用日期 = b.起始日期; 因为雇员表中还包含了离职员工,而题目要求的是“当前所有雇员“,也就是在职员工,所以需要用where子句筛出在职的员工。也就是结束日期 = '2004-01-01'的员工编号: where a.雇员编号 in (select 雇员编号from 薪水表where 结束日期 = '2004-01-01'); 将两表联结和where条件加入,完整的sql就是: select a.雇员编号,薪水 as 入职薪水from 雇员表 as a left join 薪水表 as bon a.雇员编号 = b.雇员编号where a.雇用日期 = b.起始日期 and a.雇员编号 in (select 雇员编号from 薪水表where 结束日期 = '2004-01-01'); 3.薪水涨幅 把步骤1的查找结果当做临时表m,把步骤2的查询结果当做临时表n。两表通过“雇员编号”进行多表联结。 使用哪种联结呢? 因为要保留左表(m)的全部数据(在职的全部雇员),所以使用左联结。 select m.雇员编号,当前薪水-入职薪水 as 薪水涨幅from mleft join non m.雇员编号 = n.雇员编号; 4.按薪水涨幅进行升序 使用order by子句对查询结果排序。把表m和表n的sql代码代入,得到: select m.雇员编号,当前薪水-入职薪水 as 薪水涨幅from(select 雇员编号,薪水 as 当前薪水 from 薪水表 where 结束日期 = '2004-01-01') as mleft join (select a.雇员编号,薪水 as 入职薪水 from 雇员表 as a left join 薪水表 as b on a.雇员编号 = b.雇员编号where a.雇用日期 = b.起始日期 and a.雇员编号 in (select 雇员编号from 薪水表where 结束日期 = '2004-01-01')) as non m.雇员编号 = n.雇员编号 order by 薪水涨幅; 【本题考点】 1.考查理解业务的能力。知道如何将“薪水涨幅“指标定义为入职薪水-当前薪水。 2.考查多表联结。需要知道什么情况下使用哪种联结。 【举一反三】 查找所有学生开学以来的成绩涨幅,给出学生编号以及其对应的成绩涨幅,并按照成绩涨幅进行升序。 select m.学生编号,当前成绩-入学成绩 as 成绩涨幅from(select 学生编号,成绩 as 当前成绩 from 成绩表 where 结束日期 = '2011-10-02') as mleft join(select a.学生编号,b.成绩 as 入学成绩 from 学生表 as a left join 成绩表 as b on a.学生编号 = b.学生编号 where a.入学日期 = b.起始日期) as non m.学生编号 = n.学生编号order by 成绩涨幅; 推荐:如何从零学会sql?
我是开心鸭: 我是2021年毕业、双非一本,在春招中拿到的offer有:腾讯、字节跳动、网易、京东、美团、大众汽车。 1.如何学习准备的? 学习路线:了解市场招聘需要哪些技术?了解常用的业务指标有什么?了解常用的分析方法有哪些?简历上需要什么项目来证明自己? 学习的门槛在于如何入门。如果入门了,那么接下来的学习就会很容易。因为接下来的学习就是边做项目、边面试,你会发现你的能力会有很大提升。要知道,面试也是提升能力的一种手段。 面试前要刷常见的面试题,面试过程需要你能够手写SQL,所以面试前多锻炼在草稿纸上手写SQL的习惯。 做项目这里提一下,说一下我在面字节跳动的时候我做了两件事情,一件事情是了解抖音的业务指标并产出一篇报告,第二件事情是做一篇流媒体的分析报告。面试的时候游刃有余,非常主动。 做项目可以自行去阿里天池、kaggle上找相关行业的数据来做项目,能分析出有价值的东西,面试官就很喜欢了。 2.简历需要避免哪些坑? 简历一定要按照招聘职位要求去写,重要的事情说三遍。很多人的简历写一堆有的没的,比如自我评价、社团、无关的课程也放上去。其实人家面试官根部不看你这些。 如果你没有相关的能力,请自己先准备一个月,做个像样的项目出来放到简历上,然后再去面试,不然就是白白浪费自己的时间。 有奖学金写奖学金,但是写一个最高级别的就可以,没必要把所有的奖学金都罗列出来。简历上最重要的部分就是你的项目经验。 很多优秀的大学生同学会有竞赛经历,但是你一个项目参加四五个比赛,然后把四五个比赛的奖项都写上去,意义在哪,想告诉面试官我很会比赛?请把比赛奖杯转换成项目经验。 对于自我评价请不要放在简历上,没有面试官会喜欢套话,下面的自我评价你细细品:有较强的自主学习和自我管控能力;有较强的创新能力;细心, 善于换位思考, 易于相处;有较强的抗压能力。 3.面试中遇到哪些问题? 我是从2月开始投递简历的,我自己的投简历方案是:海投小厂、尝试中厂、内推大厂。 对于没有面试过的小白来说,小厂的面试非常适合练手。中厂的面试难度接近大厂难度,如果中厂感觉非常顺利也意味着自己可以去大厂面试了。 大厂的面试风格很不同,有的偏向于算法,比如字节。有的偏向于实践,比如阿里。有的偏向于智力题和编程题,比如腾讯。 不过在面试前一定要查好公司的业务、部门的业务,掌握主动权。但一定要找人内推。 总结一下大家面试当中的几个极端: 一问三不知; 太飘、太嚣张; 太卑微导致太紧张; 语速过快 面试就像考试,考验的是你准备充分不充分,你说期末考考了个95分就能代表你所有的能力了吗? 不能,面试也是,面试通过了也只能代表你在这个岗位是匹配度比较高的。所以一定要准备充分,想着划水找到工作是不可能的。 以上三个极端都可以通过准备来解决,因为3个极端都是对面试考察的点不了解,无脑自行发挥导致的。 (1)一问三不知 简历问你的项目,问一下回答一下,能回答出一点东西,但是追究深层逻辑就不知道是啥了。 在面试前一定要把自己做过所有的项目都整理过一遍,深度思考、头脑风暴、逻辑自洽。 尝试找同学表达自己的项目并且让他问出多个问题,看看每个问题之间能不能用逻辑联系起来。把项目拆分成多个部分,项目准备阶段、实施阶段、解决困难问题阶段、结束复盘阶段。 判断的标准就是,是否可以在面试的任何时间点都可以穿插入项目的各个阶段,把握主动权,体现自己的专业能力。 (2)太飘、太嚣张 这个通常是在技术面或者hr面的时候会遇到。hr问你你的缺点是什么。有人说我的缺点就是太聪明(没关系,虽然不是很好)。 这时候有些面试官喜欢肯定应聘者,常常初入社会的面试者会因此飘起来,然后开始释放自我,什么话都开始说了,但是面试一定要懂得克制和发挥互相平衡。 说着说着面试官问你为什么聪明,然后就开始讲自己过去有什么经历,说着说着说自己想去创业了。 这种表达面试官听到后还敢要你? 面试是一次表现自己和岗位匹配度的机会,不是表现你个人有多么优秀的机会。 (3)太卑微导致太紧张 这个是会比较容易出现的,我的建议是主动做自我介绍,可以让自己放松下来。 (4)语速过快,急着表现 这样反而没有表现好,滴滴我唯一一次业务面试挂掉的,面试官问了一个滴滴出行在七八月有下降的原因可能有什么。 回答这类问题其实要用分析方法来结构化思维,比如思考五秒在脑海里罗列出大纲,分点回答。例如:1.暑期来临,学生放假,旅游业火热。2.同比、环比看看数据是否异常,加入时间维度。3.有没有重大社会、经济事件干扰。4.APP是否出现问题,bug导致用户体现下降。5.是否是优惠券等活动导致。 但是我当时在回答的时候,为了体现自己的反应速度就讲了暑假这个维度,所以让面试官感觉思维没有打开,就被拒了。面试被拒不可怕,一定不要气馁,觉得自己不行。 很多人面试被拒,只会自我归因,这不一定是正确的。有时候要自信,相信自己的能力,找出自己的问题,分析客观存在的问题,这样才能持续进步下去。 面试被拒的正确操作是:我自己在表达过程当中有什么问题?有什么可以改善的?面试官是不是没有深入问下去,是她的问题? 4.面试经验有哪些? 在面试完之后可以这样问面试官,请问面试官您觉得优秀的员工应该是怎么样的。这时候面试官会开始说一堆,不知不觉得把这些优点往你身上靠,成功率增加+20%。 在面试完之后可以问面试官,请问我的下一次面试时间在什么时候。这也很有用,因为如果你问我的面试结果,通常面试官是不能告诉你的,因为公司规定,或者他要综合考量。 平时多积累,比如看书或者学习过的知识,面试过程当中也可以讲出来,面试官还会觉得你好学,更欣赏你。 5.现在日常工作是做什么? 因为是实习生,我现在的日常是维护数据埋点,现在很多公司数据埋点的规范化刚刚起步。 产出报表。一些大厂会有自己的数据中台,很多取数据的工作都已经让数据开发的同学做了,数据分析的同学拿到的数据经常都是比较规范的。因为自己比较年轻所以目前也在不停地总结实习的经验。 最后想说一句很多同学在应聘的时候会在过度自信和过度自卑两边徘徊,这是很正常的情况,这也是一种难得的经历。 但是要懂得的是自己要勇敢的去尝试大厂,不要给自己设限,觉得自己大学不好,没什么经历就不敢去尝试巨头公司。 又或者觉得自己太厉害不想去尝试小公司,每一次的面试就是一次照镜子的机会,你会对自己越来越了解。 上面内容来自猴子社群会员的求职经验分享,来源:⠀ https://www.zhihu.com/question/19755921/answer/1133057760 推荐:你有一份求职秘籍待领取
数据分析,机器学习,深度学习,人工智能的关系我画了这张图 我来解释下这张图。 一切技术的出现都是为了解决现实问题,而现实问题分为简单问题和复杂问题。简单问题,需要简单分析,我们使用数据分析。复杂问题,需要复杂分析,我们使用机器学习。 1、什么是简单问题?比如公司领导想知道每周的销售情况,这种就是简单问题。简单问题可以用数据分析来处理,通过分析数据来分析出有用的信息。 最简单的,你用excel分析一家淘宝店铺的销售数据,每周公司会让你出一份周报一份发现了最近几个月销量下降,然后根据分析产生销量下降的原因是什么,找到原因后制定对应的策略来提高销量。 我们来看一个真实的案例。全球最大的旅行房屋租赁社区Airbnb曾在2011年纠结于新用户增长的缓慢,有一天,他们的数据分析团队发现房源照片的精美程度,跟房源的预定人数成很大的正相关。 于是,他们提出一种假设,即“附有专业摄影照片的房源要更抢手,因此房主肯定会愿意申请Airbnb提供的此项服务”。 他们迅速上线了一个提供专业摄影照片服务的版本,然后跟原版本做A/B Test,发现同一个房源,使用专业摄影服务的比不使用的多了2-3倍的订单量。 2011年后期,Airbnb雇用了20名专业摄影师,以帮助平台上的房主拍摄房屋照片,几乎在同一时间段,Airbnb的订单量曲线有了一个陡峭的增长。 2、什么是复杂问题?比如我们天天使用的淘宝,它会根据你的历史购物习惯(数据),来给推荐你可能感兴趣的商品。淘宝是如何做到的呢?对于这种复杂问题,淘宝背后使用的就是机器学习。 我再举个例子,今日头条是如何靠机器学习逆袭成为新闻客户端老大的。 2010年前后,门户时代崛起的网易、搜狐、腾讯三巨头向移动端转型,几乎垄断了当时的新闻客户端市场。而仅仅2年后,今日头条,使用“机器学习”这把屠龙刀向用户个人性化推荐用户感兴趣的新闻,一举打破巨头垄断,成为新闻客户端老大。虽然,后来腾讯和网易为了对抗头条,推出了类似的产品的天天快报和网易号,但因起步晚和算法不成熟,都失败了。 下面图片是我在知乎一个问题下回答的传播分析报告 在这份报告中,像点赞数、评论数、收藏数、总阅读量这样的分析就是简单分析。像“你可能感兴趣的人”这样的分析,就是复杂分析,需要通过机器学习算法来找到,类似于豆瓣上给你推荐感兴趣的电影、淘宝上给你推荐感兴趣的商品。 3、什么是深度学习?机器学习分很多方法(算法),不同的方法解决不同的问题。深度学习是机器学习中的一个分支方法。 深度学习在图像,语音等富媒体的分类和识别上取得了非常好的效果,所以各大研究机构和公司都投入了大量的人力做相关的研究和开发。我说个例子,你肯定听说过。那就是2016年谷歌旗下DeepMind公司开发的阿尔法围棋(AlphaGo)战胜人类顶尖围棋选手。阿尔法围棋的主要工作原理就是“深度学习”。 4、什么是人工智能?人工智能,它的范围很广,广义上的人工智能泛指通过计算机(机器)实现人的头脑思维,使机器像人一样去决策。 机器学习是实现人工智能的一种技术。所以我把人工智,机器学习,深度学习放到不同的圆圈里,他们三者是包含的关系: 现在,你已经清楚了数据分析>机器学习>深度学习>机器学习这些概念的关系了。当我们从解决现实问题的角度来看,很多概念会清楚。处理不同的问题,使用不同的方法。 5、数据分析与人工智能的关系?你可能会问了:“上图中没看出数据分析和人工智能有什么关系呀,是不是学习数据分析没什么用?那我是不是一开始就学习机器学习了,这样可以直接进人工智能时代,享受时代红利了?” 这么想是不对的。 机器学习是很多学科的知识融合,而数据分析是机器学习的基础。只有学会了数据分析处理数据的方法,你才能看懂机器学习方面的知识。这就好比,你想上初中(机器学习),必须先读完小学(数据分析)才可以。 所以,我在下面图片中画了两条黄色的线,表示数据分析的两个方向,如果你喜欢深入技术,学会了数据分析,你才能打好基础,去学习机器学习。如果你喜欢商业方面的内容,可以往人工智能业务方向发展。 职业社交网站领英在《2018新兴工作岗位报告》中说,2018年,15个新兴职位里有6个与人工智能相关,这说明,与人工智能相关的技能开始渗透到各个行业,而不仅仅是技术行业。 领英把人工智能技能定义为:开发和有效使用人工智能工具和技术的技能。这是领英上增长最快的一个技能,从全球来看,2015年到2017年这个技能增长了190%。 之前很多人本来就是零基础,却买来一堆机器学习的课程和书来学习,最后看的是晕头转向,觉得自己不适合。 其实,这是走错了路。如果你是零基础,想进入人工智能这个相关的职业,要先从数据分析开始学起。 6、总结1)人工智能是指使机器像人一样去决策2)机器学习是实现人工智能的一种技术3)机器学习分很多方法(算法),不同的方法解决不同的问题。深度学习是机器学习中的一个分支方法。4)数据分析可以帮助你从零进入人工智能时代。如果你喜欢深入技术,学会了数据分析,你才能打好基础,去学习机器学习。如果你喜欢商业方面的内容,可以往人工智能业务方向发展。5)下面这张图是它们之间的关系 猴子聊数据分析zhuanlan.zhihu.com图标
人在江湖,生不由己。人在职场,Excel必备。 为了帮助更多人快速掌握职场必备技能Excel,我写了一个免费的教程《职场Excel》,能帮助你解决99%职场中遇到的问题。 对,你没看错,是完全免费的。点击下面章节的名称就可以学习了。 《职场Excel》 第1章:快速处理数据 1.如何快速选中数据 2.如何查找和替换数据? 3.Excel的数据类型 4.如何进行数据验证?5.如何删除重复数据? 第2章:数据可视化入门 1.如何制作图表? 2.如何设置图表属性? 3.设计图表的原则是什么? 4.如何看懂图表? 第3章:数据可视化进阶 1.管理项目工具甘特图如何制作? 2.如何制作组合图? 3.如何制作创意图表? 4.数据条:让表格一目了然 5.突出显示重点数据?6.如何让数据高亮显示? 第4章:用函数让工作高效 1.字符串截取函数 2.多表查询:vlookup函数 3.查找函数:index+match组合 4.求和函数 第5章:Excel函数进阶 1.如何实现排名? 2.自动判断:if函数 3.摆脱手工计数:countif函数 4.日期问题:dateif函数来搞定 推荐:人工智能时代,你必须要学会这个通用技能
写文章草稿已保存邀请预览更新 一文看懂5w2h分析方法 一文看懂5w2h分析方法在面试和工作中,经常会遇到这样的问题:为什么这个月销售量下降了?有的人就会拿出5w2h分析方法来比划下,听起来头头是道,但是就是解决不了实际问题。这是为什么呢? 今天我从下面几部分详细聊聊:1)什么是5w2h分析方法?2)5w2h分析方法能解决哪些问题?3)5w2h分析方法解决不了什么问题? 1.什么是5w2h分析方法?这个方法里面的5w、2h是英文单词的缩写。5w是多所有的现象都追问5个“为什么”:what(做什么)when(何时)where(何地)why(为什么)who(是谁) 2h是指:how (怎么做)how much(多少钱) 当遇到要解决的问题,从5w、2h这7个问题出发来解决。 5w2h分析方法能解决哪些问题?对于简单的问题,5w2h分析方法可以帮助到我们。下面举几个例子。 案例1:如何设计一款产品?这时候可以用5w2h分析方法来明确问题:what(做什么):这是什么产品?when(何时):什么时候需要上线?where(何地):在哪里发布这些产品?why(为什么):用户为什么需要它?who(是谁):这是给谁设计的?how (怎么做):这个产品需要怎么运作?how much(多少钱):这个产品里有付费功能吗?价格是多少? 案例2:设计一款app的调查问卷,你会如何设计调查问卷上的问题?what(做什么):你用这款app做什么事情?when(何时):你通常在什么时间使用这款app?where(何地):你会在什么场景使用它?why(为什么):你为什么选择这款app?who(是谁):如果你觉得你喜欢这个产品,你会推荐给谁?how (怎么做):你觉得我们需要什么功能才是比较新颖的?how much(多少钱):如果你认为这是个对你有帮助的APP,你会花什么价格去购买app里的服务? 案例3:为什么墙上有裂纹?1940年代,杰弗逊纪念堂墙比周围其他建筑有更多的裂纹,这就需要每年花大量资金来修补墙。 负责的人就找来专家分析原因。一开始认为,问题出在清洗墙体用的清洁剂上,所以解决办法就是减少冲洗次数,或者更换清洁剂。后来专家又追问了5个为什么(5w):1)为什么要冲洗墙?因为墙上有很多的鸟粪。2)为什么有很多鸟粪?因为有很多燕子在大厦周围筑巢。3)为什么有很多燕子?因为墙上有很多燕子爱吃的蜘蛛。4)为什么有很多蜘蛛?因为大厦四周有蜘蛛喜欢吃的飞虫。5)为什么有很多飞虫?因为大厦窗户大,阳光充足,飞虫聚在大厦里,繁殖很快 所以,问题的根源找到了,是因为大厦窗户光照太充足导致的。最后的解决办法也变得简单了:加个窗帘。就这样,本来需要几百万美元解决的问题,靠一个“窗帘”就解决了。 5w2h分析方法解决不了什么问题?5w2h分析方法很好理解,但是在复杂的商业问题面前不起作用。 这是因为复杂的商业问题不会像前面“为什么墙上有裂纹”案例里那样只有一个原因,而是由多个原因引起的。比如“销量为什么下降”,可能是由多个原因导致的。这时候就需要你在工作里掌握下面这些常用的分析方法: 分析方法:如何将复杂问题变简单www.zhihu.com图标 分析方法:如何多角度思考问题?www.zhihu.com图标分析方法:如何进行对比分析?www.zhihu.com图标分析方法:如何找问题发生的原因www.zhihu.com图标分析方法:如何进行相关分析?www.zhihu.com图标分析方法:如何分析用户流失?www.zhihu.com图标 选择语言https://www.zhihu.com/lives/1178751277500084224切换为链接
我是喵小姐: 本人大四应届生,7、8月份也有网申和内推,但是都没有回音,也知道自己水平肯定进不了大厂,所以后面我都是通过学校的宣讲会来投递简历。 其实来我们城市宣讲的招聘数据分析的公司不多,只有十来家,我的机会很少。有几家公司在我终面后都没有任何回音,尽管我在群面和复试的时候都还表现得挺好的,有几家公司因为宣讲或复试时间错不开或其他原因,权衡之后没有去。 有一家公司进了终面没去,有一家公司因为专业不符被拒。总结就是我只面试了8家,最后只拿到了2个offer。 这里插一句,我总共面试的有11家,前面3家都是为了锻炼群面而去的,事实证明对于参加校招的应届生来说,群面锻炼很重要。 因为很多公司都要求先群面,群面通过才能进入复试,群面没通过,跟hr讲话的机会都没有,所以多参加几次群面,积累了经验,后面基本不会群面被刷了。 简历和群面是敲门砖。简历要做好,群面要多锻炼。校招对应届生还是很宽容的,我的简历没有被刷的,一般笔试好好做,简历基本不会被刷。 群面的话网上有很多经典题目和经验总结,但是最重要的还是实践,然后不断总结。 刚开始前3场群面我都被刷了,后面才没被刷,有些群面其实挺残酷的,10个人里只进了3-4人甚至更少,不过群面也没有那么可怕啦,多锻炼几次就好了。 再说一遍,校招对应届生还是很宽容的,我遇到的面试官都很好,没有任何为难,面试的问题都比较简单,大概整理如下。 1.自我介绍2.讲一下两个项目中,我发现了什么问题,得出的结论3.我自己的职业规划,一年后,三年后的自己是什么样的4.同学对我的评价5.什么专业,为什么选择数据分析6.怎么预测某城市有多少家xx店7.对比那些成绩好的同学,在学习上我有什么优势8.解决问题用到的工具都有哪些,对目前所掌握的工具的掌握程度 最后再说一遍,校招对应届生还是很宽容的。应届生一定要珍惜好校招,尤其是秋招的机会。 就我自身经历和周围已经签了公司同学的经历来说,校招公司更看重你在群面和面试时表现的综合素质,潜力和相关岗位的匹配度,相比社招来说应该是轻松很多吧。 上面内容来自猴子社群会员的求职经验分享,来源:⠀ https://zhuanlan.zhihu.com/p/89445760 推荐:你有一份求职秘籍待领取
【题目】我们公司的数据量非常大,需要的不仅仅是提取数据,要了解SQL方案优化的。一般在写SQL时需要注意哪些问题,可以提高查询的效率?【解题思路】数据量大的情况下,不同的SQL语句,消耗的时间相差很大。按下面方法可以提高查询的效果。 select子句中尽量避免使用*select子句中,是选择全部数据的意思。比如语句:“select from 成绩表”,意思是选择成绩表中所有列的数据。 在我们平时的练习中,往往没有那么多数据,所以很多同学会图方便使用。而在处理公司事务时,动辄十万、百万,甚至上千万的数据,这个时候再用,那么接下来的几分钟就只能看着电脑屏幕发呆了。所以,在我们平常的练习中,就要养成好的习惯,最后需要哪些列的数据,就提取哪些列的数据。尽量少用*来获取数据。另外,如果select * 用于多表联结,会造成更大的成本开销。 where子句比较符号左侧避免函数尽量避免在where条件子句中,比较符号的左侧出现表达式、函数等操作。因为这会导致数据库引擎进行全表扫描,从而增加运行时间。 举个例子,下图是10名学生的成绩表,老师突然发现因为参考答案出错,给所有人都少加了5分,现在需要查询:给每人加5分后,成绩依然在90分以上的同学的学号。 按照题目的思路直接书写,“给每人加5分后,成绩90分以上”的条件很多人会这样写:where 成绩 + 5 > 90 (表达式在比较符号的左侧)优化方法:where 成绩 > 90 – 5(表达式在比较符号的右侧)所以,为了提高效率,where子句中遇到函数或加减乘除的运算,应当将其移到比较符号的右侧。 尽量避免使用in和not inin和not in也会导致数据库进行全表搜索,增加运行时间。 比如,我想看看第8、9个人的学号和成绩,大多数同学会用这个语句:select 学号, 成绩 from 成绩表 where 学号 in (8, 9)这一类语句,优化方法如下:select 学号, 成绩 from 成绩表 where 学号 between 8 and 9 尽量避免使用oror同样会导致数据库进项全表搜索。在工作中,如果你只想用or从几十万语句中取几条出来,是非常划不来的,怎么办呢?下面的方法可替代or。 从成绩表中选出成绩是是88分或89分学生的学号:select 学号 from 成绩表 where 成绩 = 88 or 成绩 = 89优化后:select 学号 from 成绩表 where 成绩 = 88unionselect 学号 from 成绩表 where 成绩 = 89语句虽然变长了一点,但处理大量数据时,可以省下很多时间,是非常值得的。5.使用limit子句限制返回的数据行数如果前台只需要显示15行数据,而你的查询结果集返回了1万行,那么这适合最好使用limt子句来限制查询返回的数据行数。【本题考点】在面试中,当面试官提出这一类问题,按照上述的方法进行回答都是没有问题的,但不仅在面试中,平时练习就养成习惯是最好的。大多数同学都会觉得“麻烦”、“不做也没有什么影响”,但是习惯总是慢慢养成的。拥有好习惯,未来在工作中,面对不同的数据量,就可以游刃有余地选择不同的方法来降低完成时间,从而提升工作效率。推荐:如何提升你的分析技能,实现升职加薪?
【题目】 “学生表”里记录了学生的学号、入学时间等信息。“成绩表”里是学生选课成绩的信息。两个表中的学号一一对应。(滴滴2020年面试题) 现在需要: 筛选出2017年入学的“计算机”专业年龄最小的3位同学名单(姓名、年龄) 统计每个班同学各科成绩平均分大于80分的人数和人数占比 【解题思路】 问题1:筛选出2017年入学的“计算机”专业年龄最小的3位同学名单(姓名、年龄) 一看是不是有点懵? 别着急,我们用逻辑树分析方法,把这个复杂问题拆解为一个一个可以解决的简单问题: 1)筛选条件:入学时间是2017,专业是计算机 2)最小的3位同学名单(姓名、年龄) 1.先找出符合要求的同学 筛选条件:入学时间是2017,专业是计算机。year(日期)函数用来获取日期的年份 select 姓名,年龄from 学生表where 专业='计算机' and year(入学时间)=2017; 2.最小的3位同学名单(姓名、年龄) 先使用order by对年龄排序(从小到大,也就是升序asc),然后使用limit输出前3行数据,就是年龄最小的3位。 select 姓名,年龄from 学生表where 专业='计算机' and year(入学时间)=2017order by 年龄 asclimit 3; 问题2:统计每个班同学各科成绩平均分大于80分的人数和人数占比 一看是不是有点懵? 别着急,我们用逻辑树分析方法,把这个复杂问题拆解为一个一个可以解决的简单问题: (1)每位同学的平均成绩 (2)平均分大于80分的人数 (3)平均分大于80分的人数占比 (4)输出结果是班级,平均分大于80分的人数,平均分大于80分的人数占比 每位同学的平均成绩 涉及到“每个”的时候,就要想到《猴子 从零学会sql》里的分组汇总了。按学号分组(group by),然后求平均成绩(avg函数),把所得结果看做临时表。 select 学号,avg(分数) as 平均成绩from 成绩表group by 学号; 2.平均成绩>80的人数 可以使用使用sum函数和case表达式来统计平均成绩大于80的人数 select sum(case when 平均成绩>80 then 1 else 0 end) as 人数from 临时表; 下图是case和sum结合起来统计人数的sql过程: 3.平均成绩大于80分的人数占比 平均成绩>80的人数占比 =(平均成绩>80的人数)/ 总人数 总人数是表行数:count(学号)。所以平均成绩>80的人数占比就是: select sum(case when 平均成绩>80 then 1 else 0 end)/count(学号) as 人数占比from 临时表; 输出结果是班级、人数、人数占比 班级在“学生表”中,这涉及到需要将“学生表”和“临时表”2张表,需要用到多表联结。联结两表的是“学号”,如下: 因为要保留“学生表”班级的全部数据,所以使用左联结。select a.班级from 学生表 as a left join 临时表 as bon a.学号=b.学号group by 班级; 题目要求是输出班级、人数、人数占比,所以在上面sql中加入输出的列名: select a.班级,人数,人数占比from 学生表 as a left join 临时表 as bon a.学号=b.学号group by 班级; select子句中的人数、人数占比在前面第1步、第2步中已经得到,套入这个sql语句中就是: 最终sql如下: select a.班级,sum(case when b.平均成绩>80 then 1else 0 end) as 人数,sum(case when b.平均成绩>80 then 1else 0 end)/count(a.学号) as 人数占比from 学生表 as a left join(select 学号,avg(分数) as 平均成绩from 成绩表group by 学号) as bon a.学号=b.学号group by 班级 【本题考点】 1.使用逻辑树分析方法将复杂问题变成简单问题的能力 2.当遇到“每个”问题的时候,要想到用分组汇总 3.查询最小n个数据的问题:先排序(order by),然后使用limit取出前n行数据 4.遇到有筛选条件的统计数量问题时,使用case表达式筛选出符合条件的行为1,否则为0。然后用汇总函数(sum)对case表达式输出列求和。 有筛选条件的统计数量问题的万能模板 select sum(case when <判断表达式> then 1 else 0 end) as 数量from 信息表; 【举一反三】 1.查询最小/最大的N个数据的问题 某网站有购买记录表,找出消费最大的2名顾客,输出顾客ID和消费金额 select 顾客ID,消费金额from 购买记录表order by 消费金额 desclimit 2; 分组汇总问题 某网站有顾客表和消费表,请统计每个城市的顾客平均消费在1000元以上的人数,输出城市,人数 select a.城市,sum(case when b.平均消费>1000 then 1else 0 end) as 人数from 顾客表 as a left join(select ID,avg(消费金额) as 平均消费from 消费表group by ID) as bon a.ID=b.IDgroup by 城市; 推荐:如何从零学会sql?
有些朋友给我留言说,兴致满满的开始自学编程,但是拿到一堆书,却不知道从哪开始,最后的结果就像下面这个图: 下面结合我之前的学习经历,如何从零基础慢慢提高。1.首先,给你的学习编程一个重要的意义做任何事情前,你都要首先明白为什么要做?这个理由不是学校开了某个编程课,你为了应付考试。或者看到其他人都在学,你没事干,也学下吧。这都是盲目的表现,就好比你追一个女孩,不是因为她家有钱,最重要你追她的原因是:你真的喜欢上了她。 所以从一开始,就给自己的学习定一个大的意义,这会让你不会中途放弃。而且能带给你前行的动力。我当年学习编程,是因为觉得未来很多互联网的行业都于编程有关,意识到这是个基本技能,而且技能在手,不会哪天饿死街头。同时,编程的世界很纯粹,不像其他行业需要很多关系去维护,要想往上爬,的整日琢磨如何混好。但是,在编程的世界里,全靠技术说话:你行就行,不行就不行。而且现在是人工智能时代,编程已经变成了像excel那样每个人都需要掌握的技能,你觉得学校编程意义大不大?更重要的是,学会编程你的收入概率会比其他人高。 2.如何选择你人生的第一个编程语言很多人一开始是对编程有兴趣的,但是之前很多大学一上来就教C,C++。里面复杂的内容,也让很多人从入门到放弃。到最后连兴趣都没有了。没有兴趣是最可怕的敌人。如果你是刚开始学编程,选一个比较人性化的编程语言,我建议从python开始。它足够简单,而且容易上手。而且现在连小学生都开始学python了。我们再看看各大兵器排行榜上的python排名,它已经是人工智能的第一编程语言。相信它的火热程度还会持续升温。 3.选择一本经典的书进行系统学习很多人一开始为了追求快速,会选择一些比如xx天学会Python,xx天学会机器学习的书。这些书看上去高大上,其实是在误导你。世界上哪有xx天就能学会的,记住一条原则:越是有价值的知识,越难学,不然很多人都能学会了。一般来说,一本书要比公众号的文章系统性强,一本某个领域的经典教材要比很多快销书系统性强。一个系列课程要比一次1小时的分享系统性强。所以从一开始就摆正心态,不要急于速成,有时候慢就是快。有了这个心态,就老老实实选一本这个行业经典的书,最好是国外的书。既然在这个领域你是新手,就不要指望自己能把散落的信息整合成系统了,那是高手要做的事情。要想系统地学习,那就踏踏实实地拿出几个月的时间来,看几本这个领域的经典书,选一门系统课,或者跟着一个系统学习过的老师把这个领域的骨架摸清楚。你又不比别人聪明几倍,却想用几分之一的时间,就掌握人家花了好长时间下了硬功夫,系统掌握的知识,怎么可能呢?先接受一个已经存在的系统,再在上面修修改改,对于新手是最适合的方案。 3.选择一个有界面的编程环境很多编程的书,一开始安装后,都是教你在命令台下写代码。面对这么一个黑洞洞的东西,你的兴趣又降下来了。 一开始编程不要在这个不友好的命令行下做。而是找一个集成开发环境(IDE),在里面敲代码。人对有界面的东东天然有好感和兴趣。比如学习Python,一开始用notebook就很容易敲出代码,而且运行结果也能实时的反馈给你。当然最开始要做的事情就是先把环境搭起来,开始输出你人生的第一行代码:“Hello World”。这是简单的第一步,但是对于很多完全自学的同学都非常难了。好事情是,现在网上很多教程可以帮助到你。 4.重要的事情说三遍:多敲代码编程是门手艺活,什么意思?就是你的多练习。这就好比,一个懂得再多泡妞理论的单身狗,都没有一个谈过恋爱的人,更懂得如何追女孩。不要光看书,或者光听课。要多撸代码,在实践中成长。遇到不明白的地方,就多联系生活中的事情就类比想明白了。比如我在学习数据结构:队列,不明白的时候,就联想到了餐厅外婆家的排队叫号系统,就立马明白了。其实编程中很多东东,都是为了解决现实生活中的问题,所以很多知识都能与现实生活中的实际事情对应起来。 5.学会记笔记很多人刚开始学编程以往里面的很多东西都要记住,其实这是错误的做法。不用去记住这些代码,理解代码比记住代码更重要。这里我们能理解代码是干什么用的就可以了。如果后面用的时候忘记了,反过头来知道在哪查找答案就可以了。这是学习的重要思想之一:知道在哪查找答案比记住更重要。很多时候你感觉自己学会了,但是其实并没有掌握。我个人解决这个问题的办法就是记笔记。记笔记不是简单的罗列知识,而是将学到的知识,用自己的语言整理出来。同时,记笔记还能通过输出倒逼你的输入。下面是几个写实践笔记的讨论,对你应该会有帮助: 6.学会使用搜索引擎刚开始学习编程,看到代码报错,就会茫然失措,脑子中立马闪出一个'funck'。其实解决编程代码问题也是有套路的,这个套路就是:能不用百度就别用百度,你要学会在宇宙第一大搜索引擎,和全球最大的技术问答平方:stackoverflow上搜索问题的答案。 一切的学习都是学习能力的提高。对于编程,真正的高手,就是遇到问题能从搜索引擎中找到答案。 7.多看大牛的技术专栏平日多关注这个领域顶尖高手的技术专栏(博客),选择你认可的人成为你心目中的榜样和导师。因为导师可以降低你加入一个新行业的成本,帮助你熟悉环境和行业规则,也会鼓励你完成心理方面的转变。同时你也要 建立新的学习社交网络。如果你周围没有和你同样喜欢学习编程的人,会阻碍你的进步,更糟的是,有的人自己学不会,还会嘲笑你。过去的人脉关系会阻碍你的前进,因为他们是以过去对你的认知来评价你。感谢这个互联网时代吧,你可以在网上找到志同道合的朋友和你一起前进,新领域的人脉,会给你提供各种各样新的机会和情感支持,帮助你融入。 人都是都是“快感型”物种。再加上学编程是一个长期的过程。所有需要你自己列个长期计划,并把长期计划分成段目标,每个目标完成后给自己进行激励。 比知识更重要的是什么?如果你有机会去互联网工作,就会发现你不会一直用一种编程语言工作的。很多时候,新项目来了,需要用新的技术,这时候老大会让你快速学会这个知识,然后在项目中应用。我之前做过的不同项目用到的编程语言来就有5种,而且是边学边用的。 回过头来看,比知识本身更重要的是你的学习能力。那什么是学习能力呢?学习能力其实就是你能够做到“学什么会什么”。有学习能力和没有学习能力的人差别是很大的。这就好比,你玩《王者荣耀》花钱找人替你通关,和你自己拼个人能力通关,所习得的技能和体验是完全不一样的。 提高学习能力的至少关键知识是什么呢?其实就是两点:1)习惯使用搜索引擎的能力2)不做伸手党的能力 这两个能力看起来简单,但是长期养成却很难。 投机与投资的差别就是投机看重的是短期的股票涨跌,而投资看重的是一家公司长期的发展,希望你在学习编程的路上采用的是“投资”战略,并且培养了自己的学习能力。加油,你并孤独。 零基础掌握人工智能(AI)核心语言:Pythonwww.zhihu.com图标
我是拉拉: 我毕业之后在一家互联网教育公司做运营主管,工作内容涉猎很广,但从沿海返回内地重新找工作之后才痛心地发现,自己却是“广而不深”,竟然拿不出一门核心技能来应对职场。 痛定思痛之后,决心在“数据分析”这条赛道上定点突破,从年初3月份制定规划到9月份找到工作,花了近半年的时间初步达成了目标。 当然这只是第一步,但毕竟也是阶段性的胜利,值得自我激励一下,也值得把这个过程中的学习经验和面试经验跟大家分享一下,希望对有心人有所帮助有所激励吧。 1.学习遇到哪些坑? 一句话概括我的学习经验的话,就是“师傅领进门,修行在个人”。 我学数据分析是有贵人相助的,有个朋友在银行做数据分析师,他给我分享了一定的工作经验、学习资料和学习重点。 但是,但是,但是:他——很——忙。每次见面我都喜欢调侃他的发际线是“聪明绝顶”,所以大家务必保护好自己的头发哈。 结果实际上我们交流学习的时间很少,这对我旺盛的学习需求来说是远远不够的,怎么办呢? 很幸运地找到了自己人生的另外一位贵人:猴子老师。 猴子老师在数据分析学习方面,有系统的逻辑连贯的职业规划、课程安排、案例分享等,还有游戏闯关、社群答疑服务的学习方法。 接下来就好办了,不用太费脑子,跟着老师的课程安排一步一步走就OK了,就这么简单。 总之,要想学好一门技能,就不要自己去重新发明轮子,要学会站在巨人的肩膀上,找对人跟对人,然后一招一式细细地学就好了。 因为我是非计算机专业出身,大学只学过C语言,等到工作时早就都还给大学老师了!可以说我在编程方面真是“一穷二白”,所以我重点跟大家分享在Python学习过程中遇到的坑,希望你绕过坑,节省时间。 我在这方面的建议是:不要直接学习《利用Python进行数据分析》这本书的内容。因为这本书应该是为专业人士编写的技术类书籍,对于缺乏相关背景知识的人来说,不管是章节安排还是语言风格(英式中文),对于初学者都十分不友善。 我在读这本书的过程中,不断进入到这样的状态:我是谁?我从哪里来?我要到哪儿去?……可能也跟上了年纪学习能力下降有关,总之这本书给我带来的挫败感多于成就感。 2.面试经验有哪些? 一句话概括我的面试经验,可谓“天助自助者”。 经过一段学习,在得到了朋友的肯定之后,我投了一家为银行的数据分析公司,最终也成功拿到了这家公司的offer。 我总共经历了三轮面试:首先是笔试,要求限时完成;其次是技术领导的电话面试;最后是现场面试。 笔试题是取款机智能化监控及分析需求,要求当天晚上10点之前完成。 我自然想向朋友求助,然而他却因为加班而无法给我提供具体的指导。怎么办?在有限的时间里完成任务,只能靠自己的积累和过去一段时间的学习了,所谓“天助自助者”主要指的就是这里的应对。 冷静下来,用逻辑树分析方法来拆解问题。取款机智能化监控可以分解为两部分,加钞目标分析和优化目标分析。取款机运营效益评估体系,朋友之前多少提到过,利用自己的文献搜索和整合能力,把框架搭建起来充实起来。最后写了一份技术实现方案。 总之,感谢自己过去的积累和学习,笔试题顺利通过。 接下来为了应对技术电话面试,我整理了应聘公司的资料,并把社群里的“求职秘籍”里的每一道题都记下来如何作答。 结果很幸运,面试官问的题大部分我都押对了。总之,多数问题我都做到了对答如流,于是技术电话面试也顺利通过。 最后的现场面试,老实说现场面试个人认为表现得不理想。一旦面试官问到很细节的问题,我就无力应答,只能像考研英语面试那样“装糊涂”,用自己背过的熟悉的话术去“应付”,多少有点尴尬。 事后反省,常见的面试题一定要多复习,千万别懒省事复制粘贴。看这篇文章的朋友们要引以为戒!另外就是要及时复习,尤其是面试前,把你写过的SQL复习一遍。 最后结果还算幸运,最终收到了offer。感谢陪伴自己走在这条路的朋友、老师和同道。 上面内容来自猴子社群会员的求职经验分享,来源:⠀ https://zhuanlan.zhihu.com/p/85235354 推荐:你有一份求职秘籍待领取
当你在选择行业发展的时候,可以从下面的网站找到目标行业的分析报告,对于个人把握未来发展机会有帮助。艾瑞研究-艾瑞网:http://report.iresearch.cnTalkingdata:http://mi.talkingdata.com199IT互联网数据中心:http://www.199it.comDataEye(游戏行业):https://www.dataeye.com电影电视行业报告:http://www.entgroup.cn/report/f旅游行业报告:http://www.dotour.cn艾瑞指数(包括了移动App TOP 1000 月度活跃和日活跃等指数):http://data.iresearch.com.cn/iRIndex.shtml 不仅要能找到行业分析报告,还要能看懂才行,所以你还需要学习下面内容:1.什么时候需要做行业分析? 2.如何做行业分析? 3.案例学习 4.在工作中如何应用? 5.在生活中如何应用? 6.在哪能找到行业报告?分析方法:如何将复杂问题变简单www.zhihu.com图标
【题目】 用户访问次数表,列名包括用户编号、用户类型、访问量。要求在剔除访问次数前20%的用户后,每类用户的平均访问次数。(拼多多、网易面试题) 【解题思路】 使用逻辑树分析方法可以把这个复杂的问题拆解为3个子问题:1)找出访问次数前20%的用户2)剔除访问次数前20%的用户3)每类用户的平均访问次数 下面分别来解决每个子问题 1.访问次数前20%的用户 先按“访问次数”排名,然后就可以找到”前20%”的数据。排名问题在《猴子 从零学会sql》里讲过可以用窗口函数来解决。 首先对所有用户的访问量按从低到高的顺序用窗口函数排名: select *, row_number() over(order by 访问量 desc) as 排名 from 用户访问次数表; 排名后,如何找出前20%的数据呢? 排名<=最大的排名值 * 20%,就是前20%的数据。 把前面的排名结果表当作临时表a,加上筛选条件(where)对应的sql语句如下: select * from awhere 排名<= 最大的排名 * 0.2; 最大的排名值如何得到呢?可以用下面的sql语句: select max(排名)from a; 把前面的sql语句组合到一起就得到了筛选出排名前20%的数据了: select * from awhere 排名<= (select max(排名) from a) * 0.2; 2.剔除访问次数前20%的用户 题目要求是“剔除访问次数前20%的用户”,也就是把上面sql语句里的where条件中的 <= 变成 >就获取到相反的数据了。 select * from awhere 排名 > (select max(排名) from a) * 0.2; 把前面得到的临时表a的sql语句带入后就是: select * from (select *, row_number() over(order by 访问量 desc) as 排名 from 用户访问次数表) as awhere 排名 > (select max(排名) from a) * 0.2; 3.每类用户的平均访问次数 当“每个”出现的时候,就要想到《猴子 从零学会sql》里讲过的这时候就是要分组汇总了。 按“用户类型”分组(group by),然后汇总求平均访问次数avg(访问次数)。 select 用户类型,avg(访问量)from bgroup by 用户类型; 这里的表b就是前面第2步得到的临时表,带入sql里就是: select 用户类型,avg(访问量)from (select * from (select *, row_number() over(order by 访问量 desc) as 排名 from 用户访问次数表) as awhere 排名 > (select max(排名) from a) * 0.2) as bgroup by 用户类型; 【本题考点】 1.面对复杂问题的分析能力 要会使用逻辑树分析方法将复杂问题拆解成简单问题排名问题使用窗口函数来实现。 当有“每个”出现的时候,要想到用分组汇总,下图是常用的汇总函数 3.选出前百分之N的问题如何解决?下面是这类问题的解决模版 1)先使用窗口函数对数据排名得到临时表a select *, row_number() over(order by 排名的列 desc) as 排名 from 表名; 2)然后用表a筛选出前百分之N的数据 select * from awhere 排名 <= (select max(排名) from a) * 百分之N; 3)如果是剔除前前百分之N的数据,也就是选出后(1-百分之N)的数据。例如选出后80%的数据,就把上面的where子句里的 <= 修改成 > select * from awhere 排名 > (select max(排名) from a) * 百分之N; 推荐:如何从零学会sql? 猴子聊人物推荐搜索 数据分析分析方法图解面试题
我是荒漠农夫: 1.如何把学到的技能应用在工作中? 入职近两个月,也经历了不同的项目组,生活和工作基本稳定下来。审视现状,不断调整对未来的思考,对于5个月前的做出换工作的决定,内心基本是肯定的。 对这一次职业发展的转折接下来我做一个复盘,希望以后能够更加积极主动地拥抱变化。 缘起2018年初,老东家遭遇重大挫折。当时并没有跑路的想法,依然坚守岗位。 同时在那时在网上经常看到人工智能的概念。当时就在想,是否可以把这些工具和方法运用到当前的工作中来? 后来工作内容的一些新变化,证明我的想法还是有一些前瞻性。从那时起,在工作之余开始学习,提前为未来的职业道路做准备,并在工作中努力地将这些与工作结合起来。比如利用Python把之前的重复工作实现了自动化处理,这极大地提高了工作效率。 再后来发现公司自研网管有一个开发平台,经过向研发同事请教,结合现场项目的需求,独自开发了告警和参数采集工具。 这些经验和小成果我也主动在公司里进行了推广,在高效地完成日常任务的同时,还进一步学习、提高和输出,项目领导也给了我很大的支持和肯定。 2.遇到自己不喜欢的工作,怎么办? 但是我的内心依旧没有安定感,因为长期出差和熬夜,同时每次通宵重大操作依然是战战兢兢。因此,长期都在关注家乡的内部招聘。 一个偶然的晚上,在写完日报之后,惊喜地发现家乡有非常适合的内部招聘。于是立马写了一份简历,投递到HR邮箱。 此处需要深刻反省,投递简历正值半夜时分,每当这个时间,我总是喜欢浮想联翩,思维特别活跃,或许这就是长期通宵的后遗症。 其实,重大的决定应该在精力充沛,思维相对理性的时候进行分析,同时征求经验人士的意见,才能做出相对有利的决策。 事实证明,这次我的决策是错误的,起码是非常冲动、准备不够充分的。 后来的部门面试、和领导沟通得非常顺利,就拿到了offer。 来到新的单位,开始出差做项目。但很快发现,工作内容、方式完全不同,当时也在想,先熟悉环境,慢慢就能适应。 很可惜,连续发生一些我无法认同的事件,或者说是工作处理方式。总之其中一件大家都习以为常的事,成为我想直接离开的导火索。 当时很是纠结,因为包括家人在内,基本都不同意我辞职的想法。但是我不想在自己不喜欢但事情上浪费时间,所以也就开始了为新工作但学习准备。 但是由于事前调研不足,一心低头学习机器学习,比较搞笑的是后来还买了西瓜书、花书,现在基本吃灰。这实际上对于我所在的二线城市找工作没有多大帮助。算是走了弯路,但是也看到了不一样的风景。 了解了市场需求以后,我及时挑战战略,学习了招聘要求的刚需知识。后来面试以及现在工作证明,数据分析相关的大量基础岗位,主要需要是运用SQL和Excel的能力。而在一个联网企业较少的城市,机器学习岗位是极其稀少的。 值得一提的是,在学习过程中,我坚持在网上输出文章,后来面试中得到了面试官肯定。同时每天早晨,只要没有下雨,我都坚持出去跑几圈。那段时间心理很平稳,也源于每天良好的作息。 3.如何准备面试? 关于投简历,在Boss直聘上是聊得比较多的,主动自荐得到反馈也很快,前程无忧和猎聘网上也会接到面试电话,拉钩反而没有得到很好地回应。 面试前,基本都把自我介绍背诵得非常自然,同时根据自己的简历的情况,预想面试官的提问。 面试过程中,我还偷偷打开了手机录音。每次面试回来都会听一下,纠正自己语言组织不当的地方。 大概面试了七八家,期间有两家口头offer,但是待遇和岗位自我感觉不合适,直接拒绝了。 最后拿到现在公司的offer,工作内容数据仓库(ETL)。至于薪资,感觉自己对没有相关工作经验不够自信,月薪基本跟上一家持平。但是,有个好处,就是再也不需要长期出差了。 从上一份工作开始做了一个极其错误的决策,后面漏洞百出、不断补救,现在找到了新工作,算是稳定了局面。 最后非常感谢猴子老师,从课程中学到了成体系的知识架构。感谢社群里素不相识的前辈和同学,在我学习和面试过程中的帮助和鼓励,也感谢家人默默地支持。 现在的公司虽然感觉有一股草莽之气,但整体是向上成长的,对项目领导、团队leader,我还是很服气的。现在正如饥似渴地在学习,不论是技术还是管理。 下一个小小的工作目标,就是打造自己的知识和技能体系,争取能有自己独到的经验。同时,既要好好工作,也要好好生活。 上面内容来自猴子社群会员的求职经验分享,来源:⠀ https://zhuanlan.zhihu.com/p/85025919 推荐:你有一份求职秘籍待领取 猴子聊人物推荐搜索 数据分析面试职场分析方法
很多人喜欢一上来就推荐好几本书,但是这些书晦涩难懂,对于初学者入门非常不友好。入门只需要一本书就够了,而不是多本。入门要让初学者看懂才是最重要的,而不是整那些高大上的东西。为了帮助刚毕业找工作,或者想转行成为数据分析师工作的朋友,我会用下面内容教会你怎样用最快速、最容易理解的方式学会数据库和SQL,并使用SQL进行数据分析:1.入门2.简单查询3.汇总分析4.复杂查询5.多表查询6.求职面试题7.检验SQL的学习效果 第1部分:入门学习以下内容:1)了解数据库的基本概念 2)如何安装数据库?3)表的创建、删除和更新4)数据的插入、删除和更新数据从零学会SQL:入门www.zhihu.com图标 第2部分:简单查询学习以下内容:1)基本的查询语句2) 如何指定查询条件?3)注释和 SQL 语句注意事项4)学会运算符指定复杂的查询条件5)字符串模糊查询从零学会SQL:简单查询www.zhihu.com图标 第3部分:汇总分析学习以下内容:1)如何进行汇总分析?2)如何对数据分组?3)如何对分组结果指定条件?4)用 SQL 解决业务问题的套路是什么?5)如何对查询结果排序?6)如何看懂 SQL 报错信息?从零学会SQL:汇总分析www.zhihu.com图标 第4部分:复杂查询学习以下内容:1)视图(什么是视图,如何使用,有什么用,注意事项)2)子查询、标量子查询、关联子查询3)各种常用函数从零学会SQL:复杂查询www.zhihu.com图标 第5部分:多表查询在有多张表的情况下,表和表之间的运算和联系就变得很重要,这部分学习多个表如何查询:1)表的加法2)联结,包括交叉联结、内联结、左联结、右联结、全联结3)一张图记住各种联结4)联结应用案例5)case表达式从零学会SQL:多表查询www.zhihu.com图标 第6部分:求职面试题这里总结了常见的面试题,为以后找工作面试做准备:sql经典面试50题 第7部分:检验SQL的学习效果如何验证上面SQL的学习效果呢?在SQL练习平台sqlzoo中将习题做一遍,不仅是检验前面的学习效果,更是通过实践加强熟悉前面的知识。这里不能偷懒,一定要将每一道提做一遍,以后找工作面试都能用得上。如果现在偷懒,后面找不到工作的恶果可是要自己负责的。sqlzoo地址:http://sqlzoo.net/wiki/SELECT_basics/zh 第8部分:推荐书我推荐参考书看《SQL基础教程》(作者:Mick)。也有人推荐《sql必知必会》,但是对于零基础的朋友来说Mick的《sql基础教程》更容易看懂学会,非常适合入门者学习。如果只推荐一本书的话,我只推荐这本。
从下面6个问题系统回答下如何投递简历:什么时间投递简历比较好找工作?去哪个招聘网站投递简历更好?为什么不要海投简历?通过邮箱投递简历需要注意什么?如何找贵人帮忙内推?简历进入[待沟通]状态,为什么HR没有联系我?招聘要求上写3年经验,怎么办? 什么时间投简历比较好找工作?每年有两次旺季,在这两次旺季投简历比较好找工作。 第一次是春招,每年春节后,3-5月份,是换工作的高峰,这个时候,去年的年终奖拿到手了,满意的继续留下,对待遇、奖金不满意的,就要选择离开了。很多单位趁这个时期招兵买马。俗称“金三银四”,泛指每年的春季是求职跳槽高峰期。其实,从春节后2月开始上班开始到5月份的都是所谓的“金三银四”黄金跳槽季。 下面图片是TalkingData《2018年招聘类APP用户人群洞察报告》,我们可以看到,春节假期前,招聘类APP周活跃率保持在一个稳中有降的状态。春节假期后,随着“金三银四”人才招聘高峰期的临近,招聘类APP周活跃率进入了一个爆发增长期。 数据来源地址:http://mi.talkingdata.com/report-detail.html?id=724 第二次是秋招,在9、10月份左右,不少公司喜欢在这个时间段招聘。俗称“金九银十”。 去哪个招聘网站投递简历更好?现在招聘网站也挺多,不同的招聘网站用户人群也不一样,所以要选择适合你的招聘网站投递简历才能找到好工作。下面的的表格是排名前10的招聘类APP。 数据来源:TalkingData《2018年招聘类APP用户人群洞察报告》应用活跃指数:根据TalkingData样本数据通过预测算法预估出的全平台活跃终端数 从表格中我们可以看出,2018年2月,传统综合招聘平台代表-智联招聘、前程无忧51job的APP应用活跃指数以较大领先优势居于招聘类APP前两位。 虽然Boss直聘、猎聘同道、拉钩等平台主打高端人才招聘、互联网人才招聘等细分定位,但是在用户规模上仍然难以与传统综合平台竞争。 所以可以得出的结论是,传统综合招聘平台在用户规模上仍居于领先。 之前社群会员给我发求助问题,说自己在拉勾网上投简历,连个面试机会都没有。这其实就是忽略了传统综合招聘平台。我给他的建议是同时在综合招聘平台智联招聘、前程无忧51job上投简历,很快就收到了面试通知,这位社群会员现在已经成功拿到58同城的offer。 我们再来看看各个招聘平台的用户人群有什么不同。下面图片中对比了三个招聘类APP的用户,其中智联招聘、猎聘同道APP用户更多集中在三线及以下城市。而拉勾APP一线城市用户占比接近40% 这给我们的决策依据是,以后你找工作,就要根据自己的城市选择合适的招聘APP来投简历。例如下面这位社群会员分享的经验: @柯本在他的面试经验中是这么分享的:我投的都是苏州和上海的岗位,主要在拉勾网、Boss直聘、前程无忧、智联招聘、猎聘网上同步更新简历,投递简历。 收到的面试邀约主要来自于Boss直聘、前程无忧和智联招聘,拉勾网上被刷掉的概率很高。 这里主要说一下Boss直聘,这个偏向于及时聊天的功能。在工作日上午的时候,可以主动跟Boss们聊天,介绍一下自己的情况,表达自身意愿,获得面试机会。这个成功率还是比较高的。 总结几条经验:1)社会招聘渠道不要忽视传统招聘平台,也不要在一个招聘平台上死磕。同时在下面招聘渠道上投简历:智联招聘、前程无忧51job,Boss直聘、拉勾网、猎聘同道2)应届生招聘渠道应届生求职网、实习僧、大街网、高校人才招聘网、各个大学的贴吧,比如北邮论坛、水木清华等。有很多公司的部门会在各个大学的贴吧上直接招聘,我之前所在的公司部门领导就喜欢直接在大学的贴吧上招聘,部门直接招聘有个好处,就是省了很多招聘环节。3)高层人才招聘渠道猎头、脉脉、100offer4)国外招聘渠道LinkedIn,Indeed,SimplyHired,Monster,Handshake,Indeed和Glassdoor。5)各个招聘平台都有置顶简历的付费服务,可以提高简历的曝光率。 为什么不要海投简历?很多人会选择海投简历,这貌似看上去能获得更多机会,但是后续给你带来的麻烦会把你拖崩溃。因为投递的职位不聚集,后面收到多个面试以后,你会要花费很多精力为了应付不同的职位准备不同的内容。例如你投递了金融领域的风控职位,还投递了自媒体领域的产品经理职位,又投递了房产领域的数据分析职位,那么你要去为不同领域准备业务知识。但是你的找工作时间是有限的,这会让你无法聚焦于自己真正擅长的。 海投简历的人,往往没有想清楚自己想要什么。只有清楚的知道自己的职业规划,想明白从事哪个领域的工作,才能提高精确的定位,才能找到自己想要的工作。 还有一点要特别注意的是,不要一个简历打遍天下。也就是不要任何职位都使用同一份简历。简历只有匹配招聘要求才能更好的获得面试机会。 所以,你需要针对不同的招聘要求,个性化准备简历,这一点对转行的人尤其重要。比如你对3家公司有意向,你可以分别准备三份简历,在工作经历和项目经历描述的语句上尽量迎合目标公司的职位描述,这样得到面试机会的概率会大一点。 不海投简历不代表不要多投简历,针对目标职位还是要多投简历,才能提高概率。不少周杰伦的歌迷也会被方文山的歌词迷倒,觉得方文山是天才。可是,天才没出名之前也需要营销自己,要不然就只能叹气才会被埋没了。你知道方文山当年怎么做的吗?方文山在演讲中说起自己当年的投稿过程,“当时我投了 100 份。可是 100 份当中,总机可能就过滤了 50 份,制作人的宣传助理、艺人的宣传助理可能又过滤掉 25 份,最后剩下的 25 份,又要经过层层的关卡,即使最后老板拿到了,也有意愿地打开来看了,也不见得一定要马上处理。总之最后,有时间、有意愿、记得要答复我的,只有宪哥吴宗宪而已。” 看到没?有目的的多投简历,可以提高你成功的概率。 通过邮箱投递简历需要注意什么?1)如何写邮件标题?下面的邮件标题是千万要避免的:只写了几个字,比如「XXX简历」或者「应聘」。 最好的标题应当是:应聘岗位名称 + 自己的姓名 + 一个亮点。比如:数据分析师-猴子-中国科学院研究生,自媒体编辑-张思聪-5年工作经验。 把应聘岗位名称写到最前面,是为了让HR可以在邮箱里方便的通过搜索关键字来筛选简历。因为HR邮箱里的简历非常多,如果你的岗位没有写,她在邮箱里搜索关键字也找不到你。 邮件标题里写一个亮点,这是唤起HR对你的兴趣,如果学校牛的可以把学校全称作为亮点,如果经验丰富的可以写上几年工作经验,如果在哪些大的公司实习或者公司过也可以作为亮点写进入。 2)使用正确的邮箱投递简历时最好不要使用QQ邮箱。QQ邮箱很方便,但是使用QQ邮箱的缺点是会让HR的邮箱里显示的是你的QQ网名而先的尴尬。 为了保险起见,可以使用商务人事喜欢用的Hotmail邮箱。 我见过有的人简历里的邮箱名特别长,还带上特殊字符,比如:wangsicong_126@hotmail.com。邮箱名太长不仅放在简历里感觉特别难看,而且太长的邮箱名会让HR给你发邮件容易发错。比如前面的邮箱HR如果不小心少输入一个下划线,写成了wangsicong126@hotmail.com,那么,你就收不到重要的邮件了。 申请邮箱的时候用自己姓名的简称,或者姓名全称来让对方方便输入和在邮箱里查找你的邮件。 3)邮件正文怎么去写?很多人投递邮箱时,正文没有内容、一片空白, 或者只写了“简历见附件”。这样的态度,HR为什么会要你呢? 邮件正文不要长篇大论,简单介绍自己的经历,以及你为什么适合这个职位。并在邮件末尾留下联系方式(电话,邮件),让HR可以方便的联系到你。 4)邮件附件需要注意哪些?一般邮件附件放一个简历就可以了,不要放自己的作品集,那样HR下载很多,或者下载大文件,因为网络慢,导致最后不去下载了。现在网络很发达,如果你有好的作品,可以放到互联网上,然后在简历里用超链接指到你的作品地址。 很多人的简历附件名字都起的很随意,比如:张思聪最新.pdf[王小红简历-第2版.doc]。简历附件的名称和邮件标题一样:应聘岗位名称 + 自己的姓名 + 一个亮点 最重要的是,一定记得加简历附件。很多人发邮件会忘记上传附件,导致HR收到的是一封空邮件,这种心情你想想有多凄凉。 内推为什么比你想象中还重要?1)为什么内推很重要?当你自信满满的将精心准备好的简历投递出去后,却石沉大海,杳无音信。但是看看周围与你水平能力差不多的王二狗,却收到了面试的通知。为什么水平差不多的王二狗可以找到工作,而你却不可以,这其中的差别是什么呢? 著名社会学家,现在是斯坦福大学教授 Mark Granovetter,曾经在 70 年代专门研究了在波士顿近郊居住的专业人士、技术人员和经理人员是怎么找到工作的,并把研究结果作为他在哈佛大学的博士论文。 教授找到 282 人,然后从中随机选取 100 人做面对面的访问。发现其中通过正式渠道申请,比如看广告投简历,拿到工作的不到一半。100 人中有 54 人是通过个人关系找到的工作。 这是一个相当可观的数字——当人们绞尽脑汁纠结于简历这么写好还是那么写好的时候,一半以上的工作已经让那些有关系的人先拿走了。 那么,这些找到工作的人到底是靠了什么关系? 教授发现,真正有用的关系不是亲朋好友这种经常见面的“强联系”,而是“弱联系”。 在这些靠关系找到工作的人中只有 16.7% 经常能见到他们的这个“关系”,也就是每周至少见两次面。而 55.6% 的人用到的关系人仅仅偶然能见到,意为每周见不到两次,但每年至少能见一次。另有 27.8% 的帮忙者则一年也见不到一次。 也就是说大多数你真正用到的关系,并不是你经常见面的人,因为这些整体和你混在一起工作和喝酒的人,很可能干的事跟你差不多,想法必然也很接近。 而“弱关系”中的这些人未必是什么大人物,他们可能是已经不怎么联系的老同学或同事,甚至可能是你在同一个社群,但是没有见过面的人。 “弱联系”的真正意义是把不同社交圈子连接起来,从圈外给你提供有用的信息。根据弱联系理论,一个人在社会上获得机会的多少,与他的社交网络结构很有关系。 为了更好的帮助到社群会员,如果你是学完社群“闯关游戏”课程的会员,我和前面已经转行成功的社群会员,会帮助你进行内推,让你更加高效的找到工作。我希望社群不只是让你获得某个技术,同时也是你找工作中的“关系”来源。 你可能会说,内推对于找工作的我,到底有什么用呢? 内推可以保证你的简历不被淹没在人海中,会被送到HR或者招聘主管的面前,大大增加面试的机会。很多招聘会有笔试环节,如果是通过内推渠道会省去很多环节。我当年去IBM找的师兄内推,直接部门主管一面就拿到offer了。要知道一般IBM的面试都要经过笔试、一面、二面、HR面等环节。 所以,不仅要直接提升自己,还要间接地提升自己的圈子。你就是你平常花最多时间相处的六个人的平均值。 2)如何找贵人帮忙内推?一般你的师兄师姐去哪工作,你去这里工作的概率也会很大。可以想办法联系到同一个学校的师兄师姐。你可能会问了,师兄师姐很忙,谁会抽出时间帮你内推呢? 一是很多公司如果内推成功,会给内推的人发一笔内推奖金。二是师兄师姐也很乐意帮助同一个学习毕业的人,他们希望自己的学校越来越好。这就好比,大学里的老乡会感情很好。 经常有人找我帮忙内推,但是发过来的邮件里面什么都不写,就直接附上了简历。这样我根本没法了解你的应聘需求,想帮忙内推也不知道投哪个职位。 在发内推邮件的时候,一定要说明自己的需求。在邮件正文一定要说明你要找什么类型的工作,并将有意向的相关职位链接也写上,同时说明你的薪水需求和愿意工作的城市。 内推后,也不要一直干等着消息,要同时在其他渠道投递简历。 这里有几个内推网站可以尝试:1)各个大学的贴吧里,已经工作的师兄师姐喜欢来这里发内推招聘信息。2)内推网http://www.neitui.me3)通过加入一些社群,结石大牛,或者关注大牛的博客、知乎,从而获得内推机会 简历进入[待沟通]状态,为什么HR没有联系我?在招聘网站投递简历后,会看到简历的状态变化,比如简历被HR浏览了,或者简历已进入[待沟通]状态。但是却迟迟没有接到邀约面试的电话,好心急,好烦躁啊! 其实这里的[待沟通]是HR在初步筛选时,对还可以的简历做了一个标记。比如公司在招聘某个职位,一天收到100多份简历,那么一周会,会收到1000多份简历。HR不可能一个个去看完,她会使用招聘网站的搜索功能,通过设置一些查找条件,比如本科以上,应届生,工作年限等条件,筛选出200份符合基本的简历标记为[待沟通],又让相关人员筛选一遍压缩到30位左右,最后预约10多个人过来面试。 其他没有邀约的人,HR也不会去更新招聘的状态,因为她很忙,所以你的简历一直处于[待沟通]状态。 所以这个简历状态,只是HR管理简历的一个分类工具,没有什么参考价值。你唯一要做的就是多投几个与自己求职目标匹配的职位,不要在一颗树上死磕。一路往前奔跑,如果奔跑途中接到邀约面试电话就去面试,如果没有接到邀约电话,继续往前奔跑。 招聘上写要求3年经验,怎么办?你可能遇到过这样的问题:招聘网站上写的要求很高,会各自工具不说,还要求3年经验?那你可能说自己没有工作经验,这样的职位就别投了吧。 其他很多招聘是hr从其他复制过去的,而且公司不一定招到很多年工作经验的。所以,即使招聘要求里这么写了,你只要觉得技能这块匹配,也可以照样投简历。 希望每个人都找到自己喜欢的工作,成为更优秀的自己。 猴子聊求职zhuanlan.zhihu.com图标
【题目】 下面是表名为cook的表 要求查询结果如下: 【解题思路】 电影《女男变错身》中是男女互换身份 这个题其实也是“互换身份”,叫做行列互换问题,就是将一维表转化为二维表。 1.输出行列互换的表结构 可以看出,需要输出的有5列,其中只有“年”这一列是表cook中原有的,其他4列(也就是2-5列:m1对应的是1月份、m2对应的是2月份、m3对应的是3月份、m4对应的是4月份)需要自己创建。 select 年,m1,m2,m3,m4from cook; 可以看出查询结果和目标表的列名结构一样,但是2-5列(m1、m2、m3、m4)的值不是题目要求的: 如何将2-5列的值替换成对应的值? 可以用case语句进行条件判断来替换。 年份和月份匹配,则为对应值,不匹配则为0。 select 年,(case 月 when '1' then 值 else 0 end) as m1,(case 月 when '2' then 值 else 0 end) as m2,(case 月 when '3' then 值 else 0 end) as m3,(case 月 when '4' then 值 else 0 end) as m4from cook; select 年,max(case 月 when '1' then 值 else 0 end) as 'm1',max(case 月 when '2' then 值 else 0 end) as 'm2',max(case 月 when '3' then 值 else 0 end) as 'm3',max(case 月 when '4' then 值 else 0 end) as 'm4'from cookgroup by 年; 这个sql的运行过程如下: 这样我们就得到了目标表(行列互换)。 【本题考点】 1.考查用case语句进行数据替换,和条件判断 2.遇到行列互换的问题,可以用下面的万能模版来解决。 select A,-- 第2步,在行列互换结果表中,其他列里的值分别使用case和max来获取max(case B when 'm' then C else 0 end) as 'm',max(case B when 'n' then C else 0 end) as 'n'from cook-- 第1步,在行列互换结果表中按第1列分组group by A; 【举一反三】 下面是学生的成绩表(表名:成绩表,列名:学号,课程,成绩) 使用sql语句实现将该表行转化为下面的表结构: 参考答案: select 学号,-- 第2步,在行列互换结果表中,其他列里的值分别使用case和max来获取max(case 课程 when '语文' then 成绩 else 0 end) as 语文成绩,max(case 课程 when '数学' then 成绩 else 0 end) as 数学成绩from 成绩表-- 第1步,在行列互换结果表中按第1列分组group by 学号; 输出结果: 推荐:如何从零学会sql?
我是泽国华都: 已入职一家电商公司做数据分析相关的工作,日常的工作内容是: (1)梳理来自产品经理、运营、财务等部门的数据需求,就分析维度达成共识再展开工作。 (2)Excel和SQL是日常工作经常用到的工具。要熟悉Excel的常用函数,会使用Excel绘制图表。要会使用SQL实现业务需求,SQL语句顺序或者逻辑不同结果会有不一样,所以一定要想好结果再去理顺先后。 (3)工作里不要急躁,一定要沉着细致。已经不想说自己冒冒失失撤回了几次数据了。首先数据要对,其次要好看(给别人想要的,而不是你想给的全部)。 下面再说下当初是如何求职的。 毕业两年,之前在当地一家上市公司做运营,主要是供应链相关的支持性工作。 当每天重复性的工作向我涌来,我还为自己的游刃有余和轻松沾沾自喜。感谢我的领导和同事,前者耳提面命让我保持学习的心态,并慷慨分享各种学习资源,后者深化了我的思考,让我不再沉迷综艺和撸猫,开始给自己造目标。 反思自己的性格优缺点,去寻找自己感兴趣的工作。选择的标准是,我喜欢的+我擅长的+有前景的。 现在是人工智能时代,寻找一种通用的能力,以便于适用于职场的很多场景。最终选择了数据分析,因为它是各行各一个通用的能力。 然后就开始准备学习,中间经历过颓废、打鸡血、发简历、面试,心情起伏不定。 当时觉得是累,精神却很振奋,因为这是我自己主动选择的,我想要去做的,并且愿意为之去奔波的,不是苦,是奔向理想目标的上坡路。 现在拿到offer入职了,但是这也只是一个开始,接下来还有两个挑战等着我: (1)从舒适的二线城市、准时上下班的规律生活猛然去到一个节奏快的公司,要慢慢适应。 (2)工作能力与岗位感觉还不够匹配,我要一边工作一边继续学习。 继续加油,你也是。 上面内容来自猴子社群会员的求职经验分享,来源:⠀ https://zhuanlan.zhihu.com/p/77447215 推荐:你有一份求职秘籍待领取 猴子聊人物推荐搜索 数据分析面试职场分析方法
【题目】 “订单信息表”里记录了巴西乘客使用打车软件的信息,包括订单呼叫、应答、取消、完单时间。(滴滴2020年笔试题) 注意:(1)表中的时间是北京时间,巴西比中国慢11小时。 (2)应答时间列的数据值如果是“1970”年,表示该订单没有司机应答,属于无效订单。 问题 订单的应答率,完单率分别是多少? 呼叫应答时间有多长? 从这一周的数据来看,呼叫量最高的是哪一个小时(当地时间)?呼叫量最少的是哪一个小时(当地时间)? 呼叫订单第二天继续呼叫的比例有多少? (选做)如果要对乘客进行分类,你认为需要参考哪一些因素? 【解题步骤】 我们首先对数据进行预处理,将北京时间转化为巴西时间。具体需要分两步来实现,首先为了确保表中的时间为标准的日期格式,我们统一对其进行日期格式处理。然后再将处理后的日期转换成巴西时间。 (1)日期格式化 由于在日期格式化中,我们会涉及到需要修改表中的日期数据,因此考虑用update语句。而修改表的具体操作会涉及到日期数据类型之间的转换,我们考虑用cast函数。 由于表中的时间应是datetime的格式,也就是精确到时分秒(YYYY-MM-DD HH:mm:ss)。转换后的效果如下图。 因此可以写出下列sql语句。 update 订单信息表 set call_time=cast(call_time as datetime);update 订单信息表 set grab_time=cast(grab_time as datetime);update 订单信息表 set cancel_time=cast(cancel_time as datetime);update 订单信息表 set finish_time=cast(finish_time as datetime); 日期格式化后的表如下图。 (2) 转换成巴西时间 由于数据中的时间为北京时间,而且已知巴西比中国慢11小时,因此我们这里使用 date_sub函数。 因此可以写出下列sql语句: update 订单信息表 set call_time= date_sub(call_time, interval 11 hour) ;update 订单信息表 set grab_time= date_sub(grab_time, interval 11 hour) ;update 订单信息表 set cancel_time= date_sub(cancel_time, interval 11 hour) ;update 订单信息表set finish_time= date_sub(finish_time, interval 11 hour) ; 时间转换结果如下图: 按照以上操作,数据日期预处理完成。 订单的应答率,完单率分别是多少? (1)应答率 应答率=应答订单数/呼叫订单数 呼叫订单: 呼叫订单数等于呼叫时间(call_time)这一列的数据总数,可以用count(call_time)汇总。 应答订单:应答订单数等于应答时间(grab_time)这一列的数据总数,可以用count(grab_time)汇总。需要注意,这一列里的值不等于‘1970’的数据的数量才是有效的应答订单数。如下图:红框的部分为应答订单。 根据题目的业务要求,需要对不同的条件进行统计,在《猴子 从零学会sql》里讲过条件判断要用case when表达式。所以应答订单数对应的sql是: sum(case when grab_time <> 1970 then 1 else 0 end) 现在可以计算出指标 应答率=应答订单数/呼叫订单数 : select sum(case when grab_time <> 1970 then 1 else 0 end)/count(call_time) as 应答率from 订单信息表; 查询结果如下: (2)完单率 完单率=完成订单数/呼叫订单数 完成订单: 完成时间(finish_time)这一列中,值不等于‘1970’的数据数量为有效的完成订单数。如下图:红框的部分为完成订单。 所以完成订单数为: sum(case when finish_time <> 1970 then 1 else 0 end) 现在可以计算出指标完单率=完成订单数/呼叫订单数 : select sum(case when finish_time <> 1970 then 1 else 0 end)/count(*) as 完单率from 订单信息表; 查询结果如下 呼叫应答时间有多长? 根据题目中指标定义:呼叫应答时间=被应答订单从呼叫到被应答时长总和/被应答订单数量 被应答订单从呼叫到被应答时长=被应答的时间(grab_time) - 呼叫的时间(call_time)。 这涉及到计算两个日期之间的差值,《猴子 从零学会sql》里讲到对应单函数是timestampdiff。下图是这个函数的用法。 我们回到题目,利用timestampdiff函数计算呼叫到被应答时长的总和。 综上,相应的sql语句分析如下 查询结果如下 从这一周的数据来看,呼叫量最高的是哪一个小时(当地时间)?呼叫量最少的是哪一个小时(当地时间)? (1)时间转换 由于题目中要求的是“哪一个小时”,因此我们首先将数据格式化转换成小时。新增一列来表示时间中的“小时”,列名设为call_time_hour。 -- 添加列alter table 订单信息表 add column call_time_hour varchar(255); 利用date_format 函数,用于以不同的格式显示日期数据,将将数据格式转换成小时。/** 给列添加数据%k表示显示的是24小时制中的小时*/update 订单信息表set call_time_hour=date_format(call_time,'%k'); 转化后的表如下图 (2)呼叫量最高的是哪一个小时? 呼叫订单是order_id列。按“每个小时”分组(group by call_time_hour),然后统计每个小时的呼叫订单量count(order_id),然后排序就可以知道哪个小时的订单量最高。 下图给出sql语句分析过程: 此时得到查询结果如下图 因为题目要求的是排序后的最大值(呼叫量最高的小时),可以用limit子句 来筛选出第一行数据。 sql语句如下: select call_time_hour,count(order_id) as 最大次数from 订单信息表group by call_time_hourorder by 最大次数 desc limit 1; (2)呼叫量最少的是哪一个小时? 接着上面的排序结果,我们看到有3个呼叫小时的数据都为最小次数,用limit 3都将它们筛选出来即可。 select call_time_hour,count(order_id) as 最小次数from 订单信息表group by call_time_hourorder by 最小次数 asc limit 3; 呼叫订单第二天继续呼叫的比例有多少? 呼叫订单第二天继续呼叫的比例=第二天继续呼叫的用户量/总的呼叫订单量。 计算第二天继续呼叫的用户量的思路如下图: 我们具体分析看每一部分。 (1)自关联查询,求得呼叫的时间间隔。由于我们需要时间的单位为天,因此我们使用date_format函数来提取出日期中的“年月日”部分。 sql语句如下:-- 添加一列来显示时间中的“年月日”部分alter table 订单信息表 add column call_time_day varchar(255);update 订单信息表set call_time_day=date_format(call_time,'%Y-%m-%d'); 此时变化后的表如下: 我们接下来利用表的联结来计算相隔天数。这里由于涉及到计算相隔的天数之差,我们使用上面讲过的timestampdiff函数。单位为天。 此时查询结果如下 筛选出时间差为1天的数据,也就是间隔=1的数据。 利用子查询嵌套,将上面的查询结果作为新表,在其中做出筛选,并求和。sql语句分析如下图。 此时查询结果如下图 最后我们计算出第二天继续呼叫比例 查询结果如下图 (选做)如果要对表中乘客进行分类,你认为需要参考哪一些因素? 我们可以从以下两个角度来考虑对用户分类。 用户行为分类 1) 根据完成时间和接单时间,可大致计算出乘客在乘车过程中所消耗的时间,对这个时间进行预判,属于长途、中途或者是短途,来分析乘客的乘车习惯。 2) 根据呼叫时间可以判断乘客是在时间点发单的,乘客需求是如何产生的,可分析用户在哪些场景有乘车需求,上班、下班、就餐、出游、临时等场景。 用户价值分类 使用之前学过的RFM分析方法,对用户按价值分类。 RFM具体到本题可以做以下定义: R:最近一次乘客的完单时间。F:乘客打车的频率。M:打车消费的金额。此处可以用乘车过程消耗的时长来代替等。 【本题考点】 1.对日期数据的处理,掌握题目里讲过对常用日期处理方法。2.考查分析思维能力。使用学过的如何使用数据分析解决问题的框架来解决。 推荐:如何从零学会sql?
说到排名,大家是再熟悉不过了。从还在学校读书时候的分数排名,到现在出来工作了,只要有考核的需要,也都会涉及到排名。 下面就来学习一下Excel里常见的排名方法吧。 1.如何排名? 排名函数(rank),返回指定数值在特定区域中的排名。其语法规则是: rank(要进行比较的数值,在哪个区域比较,降序还是升序) 第三个参数“降序还是升序”,降序是0,升序是1,如果省略这个参数,则默认为按照降序来进行排名。 案例:按分数从大到小对学生进行排名 在C2单元格输入公式: =rank(B2,$B$2:$B$11,0) 然后向下填充公式,即可求得所有学生的排名。 除了用rank函数来进行排名,我们还可以转换一下思维:以猴子为例,我们要求猴子的分数在所有学生中的排名情况。 2.如何选择排名方式? 从上面的案例中,我们看到,猴子和马云都是排第1的,有两个第1;而后就是苏火火,排在了第3,而不是第2。 那么如何实现,猴子和马云都是排第1,苏火火排在第2(而不是第3)呢? 在C2单元格,利用countif函数,写下如下公式: =sumproduct(($B$2:$B$11>$B2)/countif($B$2:$B$11,$B$2:$B$11))+1 下拉填充公式,完成排名。可以看到,两个并列排名第1之后,紧随的是第2,而不是从第3开始。 那么,这个公式怎么理解呢?我们拆解每一步来看下。 第一步:$B$2:$B$11>$B2 意思就是拿B2:B11这个区域的每个数值,都与B2一一进行比较,然后返回逻辑值。如果大于就返回真(true),小于等于就返回假(false)。 第二步:countif($B$2:$B$11,$B$2:$B$11) 这是条件计数,对满足条件的值进行计数,它的运算过程是: countif($B$2:$B$11,B2)countif($B$2:$B$11,B3)countif($B$2:$B$11,B4) …… 意思是,统计B2单元格的值在B2:B11区域中出现的次数;统计B3单元的值在B2:B11区域中出现的次数;统计B4单元格的值在B2:B11区域中出现的次数…… 第三步:($B$2:$B$11>$B2)/countif($B$2:$B$11,$B$2:$B$11) 第一步得到的是逻辑值,第二步得到的是每个数值出现的次数,逻辑值在参与运算的时候,true=1,false=0。也就是说条件$B$2:$B$11>$B2如果成立,则返回1,如果不成立,则返回0。0除以任何数,结果都为0;而1除以出现的次数,就使得重复出现的数值只计算一次,避免重复计数。 第四步: sumproduct(($B$2:$B$11>$B2)/countif($B$2:$B$11,$B$2:$B$11))+1 用sumproduct函数对结果进行加总求和,即对大于当前值的个数进行求和,如对大于B2的个数进行求和,共有N个,那么,B2的排名就 N+1。 如果你对上面的公式理解起来实在很费劲,其实对于这种排名还有一个更简单的方法,那就是借助数据透视表。 3.如何用数据透视表实现排名? 在数据区域任意一单元格单击,插入数据透视表 把“姓名”拖到行,把“分数”拖到值,连续拖两次。 然后对“分数2”进行“值”字段设置 在弹出的【值字段设置】窗口里,将值显示方式设置为“降序排列” 如图,就得到了中式排名的效果: 修改透视表的列名称,同时对排名进行降序排列,最终如下: 4.总结 排名可以使用rank函数来实现,默认的排名不符合使用习惯,可以使用sumproduct和countif函数的结合或者借助数据透视表来实现排名。 推荐:人工智能时代的必学技能
投递简历后,却石沉大海。这种心情就好像给喜欢的人写了一封情书,对方却没有任何回复。你说,扎不扎心? 看过很多人的简历以后,我发现这些简历根本不过关。要知道,简历是公司了解求职者的第一个途径,也是求职者获取工作的敲门砖。可是,有多少人明明很优秀,却败给了一份不合格的简历? 当我帮助很多人修改简历后,他们收到面试邀约的概率大大提高。 下面我从构成简历的6大必备要素聊聊如何制作一份合格的简历,助你“赢在简历”。1)个人信息 2)教育背景 3)项目经验 4)工作与实习经历 5)技能 6)获奖情况和学术著作 一、简历第1部分:个人信息在投递中文职位的简历中,我看到过个人信息中写了很多无用内容的,比如写上自己的英文名、饮食口味等。不会有任何一家正经公司,希望在简历里看到饮食口味、三围、罩杯之类的无用信息。 个人信息这部分只保留4个字段段就足够了:姓名、电话、邮箱、求职意向。1)姓名除非你是投递外企,姓名只用中文姓名,别后面为了显出高大上再加上自己的英文名字。2)电话要用本地号码很多刚毕业的同学,或者换工作的朋友,到了外地还没来得及换号,这个外地号码就会让你错失一些面试机会。为什么这么说呢? HR打电话邀约面试一般不会用手机打,而是用公司的座机。公司的座机大多可以直接拨打本地号码,但是当要拨打外地号码时,需要先按一个或多个建,比如0*,然后再输入外地手机号。这无疑增加了操作复杂度,而人都是一种习惯动物,HR一般打本地手机号多,所以他习惯了直接在座机上输入简历中的手机号。但是如果你留的是外地号码,座机里就会提示说:拨打外地号码请先拨0,有的座机还会提示:你所拨打的号码不存在。 这让每天忙的焦头烂额的HR很恼火,他只能打开下一份简历去邀约下一个面试者。所以,你没有接到电话,也没有来面试,更没有被录用,能去抱怨谁呢? 我们再来看看,万一遇到个有耐心的HR,给你打通了外地手机号,让你来面试。后面你有事给HR拨打电话,你猜HR手机上显示什么?在手机号下面显示:陌生号码来自河北。 HR可能第一时间会想,我最近有在淘宝买东西吗?没有吧!那可能是垃圾广告电话,然后不接,还有可能会拉黑。要知道,在北京很多快递和广告推销都用的外地号码。所以,为了提高成功的概率,建议在求职前换个当地的手机号。 3)邮箱关于简历里是否应该使用QQ邮箱,很多人会说使用QQ邮箱不专业,其实这些人关心错了问题的原因。QQ邮箱很方便,但是使用QQ邮箱的缺点是会让HR的邮箱里显示的是你的QQ网名而先的尴尬。 为了保险起见,简历里邮箱就不要用QQ邮箱了,商务人事喜欢用的邮箱有Hotmail,建议你申请一个该邮箱,放到简历里。我见过有的人简历里的邮箱名特别长,还带上特殊字符,比如:wangsicong_126@hotmail.com。邮箱名太长不仅放在简历里感觉特别难看,而且太长的邮箱名会让HR给你发邮件容易发错。比如前面的邮箱HR如果不小心少输入一个下划线,写成了wangsicong126@hotmail.com,那么,你就收不到重要的邮件了。 申请邮箱的时候用自己姓名的简称,或者姓名全称来让对方方便输入和在邮箱里查找你的邮件。 4)求职意向有的人怕自己找不到工作,在求职意向里写了多个职位,比如:数据运行,数据分析,产品经理。这让HR怎么想,她只能想:哥们,你连自己要找什么样的工作还没想清楚吧。果断不理睬这样的简历。因此,求职意向里只写一个职位名称也更能表现出你有明确的求职目标。 5)简历里要放照片吗?个人信息这块要放上自己的照片,这让HR看简历起码会感觉是在和一个活生生的人在对话,而不是一张纸。 不要随便找一张杀马特发型或者平日休闲的照片,不然会让对方觉得你很随意,没有重视这个职位。我之前见过一个人发过来的简历,一看就是p出来的。我建议她换一张正装照片,她说没有还的花钱照,所以就自己p了一张。我当时的第一想法就是,连正装照片的钱都舍不得花的人,HR为啥要给你面试机会。 6)简历一开始不要写XXX个人简历很多简历应该是网上找来的模板,最开始就写:XXX个人简历,这就是一句废话,完全没有必要。hr收到的肯定是简历,不然还会是什么,不可能是一封情书吧。比如,很多人的简历是这样的: 最开头的XX个人简历是没有必要的,删掉。HR打开一份正常简历,应该像直接看到的就是个人信息: 二、简历第2部分:教育背景很多HR是按学校来筛选简历的,所以好学校得到的面试概率确实比较大。你也别怪HR“势力”。假如你是HR,天天面对那么多简历,肯定不会一个一个看,而好学校从概率上来看能力确实更好,所以为了提高找到到合适应聘者的概率,她会优先根据学校去选择。 如果你是清华、北大等重点高校毕业的,教育背景当然要放到简历这部分,也就是通过把教育背景放到简历的前面来突显自己。 但是,我们知道,这世界上名校毕业的毕竟是少数,大多数还是普通学校毕业的。那么,如果把教育背景放到简历的前面,那无疑是告诉HR:这个学校不咋的,pass掉。 因此,建议非相关专业的,教育经历放到简历后面。如果学习过相关专业,列出大学里学过的相关课程。这样做的好处,就是HR可以先看到简历中前面的项目经验和技能,已经知道你具备了与找招聘要求符合的技能,对你好感大增。而不会一开始就带着“非名校的歧视”看你了。 刚毕业的学生可以列上gpa,或者班级排名。 如果你是专升本,或者普通大学考研读了研究生,那就教育背景里只写最高学历,不要把之前不是亮点的教育背景也写进去,那只会给你减分。人都是感性动物,第一印象很重要。这就好比你第一次相亲见面,穿着干净是第一位的。这让我想起当年毕业找工作的经历。我本科是二本毕业的,研究生是保送的中国科学院。所以在制作简历时,我采用了一个技巧,只写研究生毕业院校,没有写本科。 这保证了我可以有更高概率的通过简历筛选环节,顺利进入面试。面试官那天问我本科学校时,因为前面我已经给他展示了自己的能力,这时候他问学校也是走个流程根本不放在心上,因为你的能力已经征服了他。 虽然,是金子在哪都能发光,但是在发光前,你的有机会进入面试环节。 实战案例: 三、简历第3部分:项目经验对于很多职位,技能本身不是你最大的敌人,没有项目经验才是。如何向HR或者面试官证明你会某些技能呢?最直接的就是项目经验部分的内容了,这部分主要通过你做过的项目来证明做过什么事情,有什么能力。没有哪个公司会招聘一个什么都没做过的人过来,所以这部分非常重要。 1)没有项目经验怎么办?应届毕业生,没有在公司实习过的经验,没有接触过项目,简历怎么写呢?www.zhihu.com图标 2) 如何有技巧地描述你做过的项目?在简历中描述项目的时候,要能回答清楚下面3个问题:采用了什么技术? 解决了什么问题? 达到了怎样的效果?(提供量化效果的数值,例如处理的数据量、APP发布的功能、提升了30%的用户增长量等。) 面试官也经常会纠结于问你什么问题好,所以你在项目描述中写的内容要用数据体现达到了怎样的效果。这样他才好对着这个效果展开提问, 比如你是怎么做到的,有什么经验...项目描述不要写太多,要学会适当的给面试你的人挖坑。简历的核心作用是“争取到面试机会”,不要把自己的底牌都放在简历里,适当的挖坑,引导面试官问你擅长的问题。比如可以展示项目的成果数据,但是具体是如何做的,等到面试时再去详细说。 3)要不要写项目时间?大家看看下面的项目经验有什么问题? 这个项目描述的问题在于项目时间,一个项目不可能一个月就搞完,时间也太短了。如果是自己为了找工作做的项目,就不要写项目时间。不然HR看到会有疑问:这是不是假项目,怎么项目开始时间到截止时间这么短? 四、简历第4部分:工作与实习经历如果你有丰富的实习经历,切记一定要把实习经历和工作经历分开写,否则HR第一眼看上去好像你在频繁跳槽。 如果是应届生,有实习经历比较好找工作,因为这块你可以有的写。如果没有的也不要乱写,不然到后面面试环节就会露馅的,反而会减分。 1)职位名称可以提高成功概率其实很多工作要求的技能一样,但是职位名称不一样,所以这部分的职位名称要尽可能用比较大众的职位名称,这样方便HR在招聘系统中搜索关键词的时候可以搜到你的简历。 社群会员Insight转行成功后是这么总结他在找工作中遇到的坑:我在前程无忧上投简历时遇到了一个很大的坑:我猜想招聘HR在前程无忧筛选简历时,把目前在职岗位非数据方向的求职者都筛选出去了。 这对转行的同学来说非常的不利,我当时就是在前程无忧上投的简历,开始投了大概十来天发现一个面试邀请都没收到。 后来把简历中的职位名称修改为什么数据库管理员,效果立竿见影,很快就收到很多公司的面试邀请,基本每天都有,一天1到3个都有。拿到面试机会是进入该领域最重要的一步。 2)与招聘无关的工作和实习经历不要放在简历里下面这个简历是想要找数据分析师工作,你能发现哪里有问题吗? 虽然这位朋友有工作经历,但是写的工作经历完全与应聘职位(数据分析)无关。上面的工作经历不仅没有起到任何加分项,还会让HR认为这位朋友就是小白。这简直是作死的节奏,那该怎么办呢? 所以,你是可以把之前的工作经历优化成跟数据分析有关系的样子。拍电影还用特效呢,写个简历包装下自己也是可以的,只要不要太离谱。谁还没有个过去呢,只要你写的技能是自己真正会的就可以了。 任何事情都可以是数据,尽量让你的岗位职责往数据分析上靠。这里并不是鼓励你弄虚作假,而是要求你学会在工作中挖掘属于数据分析的部分。 比如上面的这位朋友做过质量检验员,那工作中肯定也是在于数据打交道的,不然怎么确定哪些产品质量是过关的呢?下面是用他学过的统计概率知识重新写成下面这样就立马不一样了: 这里的优化是让你基于事实的去优化,不是脱离实际的去胡侃。例如,A唱歌很好有实力,那么好好优化下就可以把自己推广出去。B不会唱歌,你再怎么优化到了舞台上也是露馅。 毕竟,一个人既要有能力,又要有展示自己能力的能力。 3)工作时间工作时间能反映出你之前多长时间跳槽一次。现在很多大厂现在都是5-2原则。什么是5-3原则呢? 5-3原则是5年内换过3份工作。有的大厂是不愿意要5年内换过3份以上工作的,这样的简历也不会通过初步筛选。公司不愿意要频繁跳槽的人,想想如果刚好培养好一个人,然后换没干活就跑了,痛心呀。 建议在家公司至少呆够2年以上,如果遇到特殊情况从公司离职了,那在这块写的时候要注意下工作时间。 五、简历第5部分:技能这部分只需要列出与招聘职位相关的技能,无关的技能统统不要。技能描述千万不要用“精通”XXX,因为“精通”这两个字代表着这个技能你是这方面的专家级别的人了,这样写的几乎都会被刷。一般写“熟悉”XXX就可以了。 这部分可以简单放上拿过的资质证书。比如,语言类:主要是外语等级证书;认证类:PMP(项目管理专业人士资格认证)、CPA(注册会计师) 六、简历第6部分:获奖情况和学术著作获奖情况:奖学金,荣誉学术著作:学术期刊 会议论文 专利发明 著作 发表的其他文章等 七、总结1)简历要压缩在一页内容。2)构成简历的6大必备要素:个人信息、教育背景、项目经验、工作与实习经历、技能、获奖情况和学术著作。3)记得每半年更新一次简历,出去面试,了解最新薪资行情,和自己的技能是否符合市场需求4)按上面写简历的人都找到了工作。 猴子聊求职zhuanlan.zhihu.com图标
我是老佛爷: 现在已经距离拿到offer,已经入职有2个多月了。本人是从10月份开始准备的,耗时4周掌握了EXCEL+业务知识+分析方法+如何解决问题的框架。 能力快速提升以后,就要开始着手找工作。找工作前简历准备和面试准备也是必不可少的重要环节。 简历如果没信心的话真的有必要花些钱找专业的人士给指点最直接有效的修改意见,一阵见血总比了无音讯来的高效。 面试准备除了主观问题和能力测试外,心态也是最重要的。反过来说,其实准备充分了也就不会再有不自信的心理了。 在智联、前程无忧、猎聘、拉勾网、boss直聘等招聘平台上我都有投简历。当天下午就开始不断收到面试电话,总共历时3周收到至少3个offer。最终综合考虑后选择了一家电商行业的offer。 面试就是帮助更清楚地认识自己,扬长避短。我入职的这家公司面试时,只有一轮,但历时有三个小时,包括一小时hr面谈、一小时经理面谈、一小时能力测试。 面谈的问题都是之前学过的内容。能力测试有两张表考察sql语句,用到了之前学过的常见的sql面试题。还有一个是让看数据概述总结问题,用到了之前学过的常用分析方法,以及如何用数据分析解决问题的框架。 现在工作的日常就是解决领导提出的问题,出分析报表,形成分析报告上报给领导。 体操作就是用sql从数据库提取数据,在excel里用数据透视表处理数据。报表的表现形式也是多样性的有excel形式的,有ppt形式,也有用微软专业报表工具制作的。 分析问题真的是要用多维度拆解分析方法来切入,而且不能眼光仅局限于某个最低值或最高值,数据之间的连贯性或者交叉性更能有助于立体性的分析问题。 我对这份工作还是相当认可的,也很看好,即使入职不久但是也真真切切学到了很多知识。 很感谢当初自己的选择和一路走来所有帮助过我的人。未来的模样,都会藏在你日复一日的努力里。 上面内容来自猴子社群会员的求职经验分享,来源:⠀ https://www.zhihu.com/question/47760443/answer/738459699 推荐:你有一份求职秘籍待领取
电影《看不见的客人》是一部高分悬疑片,今天我们通过这部电影看下如何用假设检验分析方法来破案的。 艾德里安 经营着一家科技公司,事业蒸蒸日上,家中有美丽贤惠的妻子和活泼可爱的女儿,事业家庭双丰收的他是旁人羡慕的对象。 但是,这货放着好好日子不过,居然还有个情妇。有一天他和情妇开车路上发生了车祸,为了掩盖事件的真相,他决定将在车祸中死去的青年 丹尼尔 连同他的车一起沉入湖底。 让我们先用1秒钟记住这些人物关系 现在回到剧情。之后,情妇在酒店被杀害,警方把艾德里安 定为犯罪嫌疑人。为了洗脱罪名,他请了从未输过官司的金牌律师为自己做无罪辩护。 律师提出3个假设: 假设1:凶手是车祸现场目击者 艾德里安 起先为了开脱自己,声称将车祸死亡的 丹尼尔 推入湖底的是自己的情妇唆使,认为自己的情妇可能是被勒索他们的目击者杀害。 那么要让这个假设成立需要回答三个问题: 1)为什么勒索他钱财的目击证人要把准备告诉丹尼尔父母实情的信息发到艾德手机上,这对目击证人并不利 2)目击者为什么没有把钱带走。 3)目击者是如何在没有留下任何踪迹的情况下出入那个房间的。 但是,这些中的任何一个问题都无法回答,显然假设1是不成立的。 假设2:凶手是丹尼尔父母 假设情妇是被 丹尼尔 的父母杀害的,前面的3个问题可以顺利解决,是因为: 1)信息是丹尼尔的父亲发的,为了嫁祸给艾德里安。2)钱未带走也是为了迷惑警方,让警方误以为艾德里安是因为和情妇的矛盾而杀了她3)丹尼尔的母亲就在这家酒店工作,他父亲杀害了情妇后他们里应外合顺利的躲过了大家的视线。 最后,只需要确认丹尼尔 的死和情妇有直接关系就可以,这样警方在找到丹尼尔 尸体后这一切就顺理成章了。 但是,就在这时艾德 向律师透露了实情,说自己在将事故车辆和丹尼尔推入湖中的时候,发现后备箱的丹尼尔并没有死。警察如果找到丹尼尔的尸体就能发现他不是车祸死亡而是溺水身亡。 如果将丹尼尔推入湖底是情妇主使,那么艾德里安在推丹尼尔和车入湖前发现丹尼尔还活着就应该停止这一切救下丹尼尔,但事实上他并没有这么做。 其次,如果是丹尼尔父母所为,她母亲在那天向工作的酒店请假了,也不符合逻辑。 所以,假设2不成立。 假设3:凶手是艾德里安 那么前面的三个问题可以这样来看: 1)信息是情妇发的,因为自从事情发生后情妇就患了间歇性焦虑,为了赎罪她决定用经济来补偿丹尼尔父母,并假借目击者的名义让艾德里安认为是目击者勒索,要求艾德里安带着现金来酒店,又定时发送了这条约丹尼尔父母来酒店的信息给艾德里安,打算和艾德里安一起说出事实真相。 2)艾德里安在看到短信后明白这一切是情妇设计的骗局,知道她要说出实情后自首,一怒之下杀害了情妇,为了让警方以为是杀害了情妇的丹尼尔父母故意嫁祸给他所以将钱散落在现场。 3)因为凶手就是艾德里安所以他没法从房间逃脱。 最终,在律师的诱导下,艾德里安 承认了是自己杀的情妇,而这名律师实际上是 丹尼尔 母亲假扮的。假设3成立,至此,真相也就浮出了水面。 总结 在分析问题原因的时候,最常用的分析方法就是假设检验分析方法。使用该方法你只需要记住两张图就可以了。 第1张图是假设检验分析方法的步骤这个图: 假设检验分析方法有3个步骤: 1)提出假设2)收集证据3)得出结论 得出结论以后,分析还没有停止。要多问几个为什么?可能的原因是什么?然后用数据去验证可能的原因。不断重复假设分析的这个过程,直到找到问题的根源。 第2张图是下面这张分析思路图,可以帮助你快速的将问题、假设、数据从上至下连起来。 推荐:如何系统掌握常用的分析方法? 本文案例来自猴子社群会员: https://zhuanlan.zhihu.com/p/113245328
我是林一: 1.如何拿到offer的? 大学学习的经管专业,操作性不强,业余时间充裕,于是在课余的时间里计划学习,顺便也培养一下自己分析问题,解决问题的能力。 虽然网上有很多课程,但是非常杂乱,也不知道该具体学习哪一个,眼高手低,走了非常多的弯路。非常希望能有个人能给我规划一下学习路径。 这时我遇到了猴子,非常适合小白入门的规划,遂跟之学习。做完了课程里的项目,算是对数据分析这门学科的大框架有了一个大致的了解。而不是像过去那样学了一大堆理论知识最后派不上用场,最终磨损了自己学习的动力和激情。 之后的一年时间里开始准备考研,之前的学习也就暂时放下了。考完研后,我和很多焦虑的同学们一样处于一个不上不下的状态,考了一个擦线的成绩(还在等复试线….)。 找工作也没有太多的时间去准备,所幸的是通过之前学习所写的两个项目成为了在面试时相比其他同学的一个亮点,还是比较顺利的就拿到了三只松鼠的offer。 下面先说说我总结出来的10条学习经验,可以让你的努力更加有效。最后也简单复盘一下我在找工作过程中的有些求职经验。 2.学习经验有哪些? 1)学习的开始找人给你规划一下,积极向有经验的人请教问题。针对自己的目标,制定出学习方向,站在巨人的肩膀上成长的才最快。 2)学习的过程做好笔记,记录好难点,外放自己大脑,之后在做项目时方便随时回来复习查看,建立自己学习知识库。 3)快速反馈是学习驱动力的来源。边学习边操作,可以学的更快更好,同时有更好的驱动力和满足感。 4)学习的过程是枯燥的,有学不懂的知识很正常,如果不是特别重要的内容可以跳过,空白一段时间后再回来看,人脑会在潜意识里对所学知识进行关联,这时再回来看会更容易。 5)不要只盯着一个目标,去焦虑,而是要建立一个可积累的系统去帮助自己实现推进目标。比如你将学习的过程作为你生活系统中的一个部分,每天晚上的时间抽出两个小时学习一个块,每个周末的时间尝试做一个项目。 6)正确的目标决定方向,系统负责推荐方向前进。 7)人类的大脑构造决定了实践更容易让你学会一个知识,不要只看书或者视频,而不去做练习。掌握了最小的实践技能模型,就立刻去做项目来验证知识吧。 8)留下作品,在面试的时候发现很多应届的同学,没有任何的项目经历可言。如果学习完一项内容你没有任何能够体现你学习成果的内容,别人又怎么会相信。在面试时如果你能够介绍你的作品,无疑是一个加分项,这次找工作的经历也验证了这一点。 9)所有的执行力不够,都是因为你对为什么要做这件事认识的不够深刻,如果真的非常刻骨铭心的明白你为什么要这么做了,你去执行这个学习项目的阻力会小很多,你不会在问很多无谓的问题。学习一个项目之前一定深深反问自己学习的目的,将你所有的疑惑和目标写写下来,减少未来的阻力。 10)独学无友,则孤陋而寡闻,建立自己学习的生态。如果你真的想学习一个技能,就加入相应的圈子,关注领域内的前辈。在环境的驱动下,你会获得持久学习的动力。 总结一下学习经验就是:确立目标、创造环境、系统执行、实践反馈、减少阻力、分享交流、和他人一起进步。 3.求职经验有哪些? 1)HR更加注重的是你的经历、性格、能力和职位的匹配度,而不是你具体的执行某件事的能力。一般部门主管会更加注重你的实践能力,对待不同的部门的面试官,回答问题的偏重不同。 2)自我介绍的时候,可以在介绍完自己的背景之后,重复一下公司的招聘需求,最后凸显一下自己为什么适合这份工作,自己的经历为什么是匹配这份工作的,自己的的能力也是足够胜任这份工作的。 3)如果你的面试官全程冷漠脸,也不要害怕,听说这也是一种压力的测试,保持自信大方就好。 4)对面试中的每个常规问题,都要进行准备,最好写成草稿存在手机里,确保面试时能对答如流,不用觉得这样的回答过于死板,不够自然等问题,我去面试时,所有问题准备的特别全面的同学都过了,而现场思考回答的同学,最后的结果都不太理想。 5)面试官问你的每一个问题,你的回答都要紧扣着你和工作的匹配,而不是随着个人思绪随便发散,比如问到你觉得你的性格缺点,就可以说我比较胆小谨慎,我对待工作反复检查,但是这份工作需要一个严谨的性格,所以我是适合的。 6)去面试之前,一定要对公司要做一定的调查,了解它的企业文化,和未来的发展方向,如果HR问你对公司看法,要表现出你对公司的了解,以及对公司文化、发展强烈的认同度,公司也希望能够招到长期稳定的工作人员,如果你对公司不认同、不了解,那么HR又如何会相信你会稳定在这份工作上呢。 7)准备好面试作品,准备好对自己过去经历的一些复盘,对其中的几个亮点进行包装,当然还是要紧扣这个经历、这个能力对工作有什么用。 8)如何选一个工作:行业>城市>职位>公司>岗位。但是也不绝对,但是大的趋势是这样,待在人们需求大的行业、待在快速发展的公司、待在资源不断聚集的城市、待在能够创造公司核心价值的岗位,你只要安心做事,发展绝对不会差的。 总结一下找工作就是:凸显你的匹配度、你的稳定性、你的能力胜任。 最后分享在《数据科学家访谈录》中的一段话:对于初入这个行业的新手,您有什么想法或者过来人的经验想要与他们分享吗? 勇往直前! 大胆地向前走并且去学那些你必须要学的东西。很多人都被数据科学那虚高的门槛吓坏了。他们看着招聘启事上那一串长长的“需求列表”,想想自己不是出众的工程师或者统计学家、可视化专家,然后就天真地觉得自己不够格。 我觉得他们不应该妄自菲薄。你可以将自己培养成T型人才,也就是说,广泛地培养自己的技能,但是专注于其中一项技术。 所以说要有自信,并且不断学习,你将会惊讶于自己竟然那么快就能学会那么多东西。 上面内容来自猴子社群会员的求职经验分享,来源:⠀ https://zhuanlan.zhihu.com/p/123385534 推荐:你有一份求职秘籍待领取
面试中有时候会问:存储过程有什么用?看了今天的知识,你就知道如何回答了。 1.存储过程是什么? 假如你每天要开车完成一些列重复的操作:车钥匙启动车,倒车。现在出现了一款新车,可以自动的完成这些重复的工作。每次你上车以后,车就自动帮助你倒出来了。 同样的,在工作里也会经常遇到重复性的工作,这时候就可以把常用的SQL写好存储起来,这就是存储过程。 这样下次遇到同样的问题,直接使用存储过程就可以了,就不需要再重新写一遍SQL了,这就极大的提高了工作效率。 2.如何使用存储过程? 使用存储过程需要:1)先定义存储过程 2)使用已经定义好的存储过程。 (1)无参数的存储过程 定义存储过程的语法形式: create procedure 存储过程名称()begin ;end; 语法里的begin...end用于表示sql语句的开始和结束。语法里面的就是重复使用的sql语句。下面通过一个例子看下如何使用。例如查出“学生表”里的学生姓名。 sql语句是: select 姓名 from 学生表; 把这个sql语句放入存储过程的语法里,并给这个存储过程起个名字叫做就a_stuent1: create procedure a_stuent1()begin select 姓名 from 学生表;end; 在navicat里允许以后,建立的存储过程就会在下图的地方: 下次使用存储过程的用下面sql语句就可以,就不需要重新写一遍sql了。 call 存储过程名称(); (2)有参数的存储过程 前面的存储过程名称后面是(),括号里面没有参数。当括号里面有参数时,就是下面的语法:create procedure 存储过程名称(参数1,参数2,...)begin ;end; 通过一个案例看下,现在要在“学生表”里查找出指定学号的学生姓名。如果指定学号是0001,那么sql语句是: select 姓名 from 学生表where 学号='0001'; 现在问题来了,一开始不知道指定学号是哪一个,只有使用的时候才知道业务需求。比如今天要查找学号0001,明天要查找学号002。这时候就需要用到参数,来灵活应对这种情况。把sql语句放入存储过程语法里就是: create procedure getNum(num varchar(100))begin select 姓名 from 学生表where 学号=num;end; 其中getNum是存储过程的名称,后面括号里面的num varchar(100)是参数,参数由2部分组成:参数名称是num;参数类型是是varchar(100),这里表示是字符串类型。 存储过程里面的sql语句(where 学号=num)使用了这个参数num。这样在使用存储过程的时候,给定参数的值就可以灵活的按业务需求来查询了。 比如现在要查询学号=0001的学生姓名,那么就在使用存储过程的参数中给出学号的值,也就是下面括号里的0001: call getNum(0001); 3)默认参数的存储过程 前面的存储过程名称后面是(参数1,参数2),括号里面只包含参数的类型和名字,方便调用。 存储过程还一种情况是有默认参数,是下面的语法。 in 输入参数:参数初始值在存储过程前被指定为默认值,在存储过程中修改该参数的值不能被返回。 out输出参数:参数初始值为空,该值可在存储过程内部被改变,并可返回 inout输入输出参数:参数初始值在存储过程前被指定为默认值,并且可在存储过程中被改变和在调用完毕后可被返回 3.有哪些注意事项 1)定义存储过程语法里的SQL语句代码块必须是完整的sql语句,必须用“;”结尾 create procedure 存储过程名称(参数1,参数2,...)begin ;end; 2)定义不同的存储过程,要使用不同的存储过程名称,相同的存储过程的名字会引起系统报错。 4.存储过程有什么用? 如果业务比较复杂、重复性工作比较多,存储过程会比较实用。 把重复要做的事情整理成一步一步的业务步骤,然后把业务步骤写成sql语句,然后再把sql语句写到存储过程的语法里。就像自动驾驶一样,把可能遇到的状况提前规划好,就不需要自己操纵方向盘,车子就按照我们写的步骤向前开了。 推荐:如何从零学会sql?
说到excel函数,很多人第一时间想到的就是求和函数sum。作为excel入门级函数,sum的确是小白级的,以至于很多人对求和函数有点“误解”,觉得求和函数太简单了。 但是,你可能不知道,sum只是excel求和家族里的一个小成员而已,它的家人们可都是厉害着呢。 今天我们就一起来认识一下这个求和家族吧。 1.sum基础求和 sum语法规则是: =sum(数据区域) 案例:对下表的“销售”列求和,计算出总销量 在销售总量单元格(G2)中输入公式: =sum ( 1* (E2:E11)) 公式说明:销售列是在E列,所以公式里的数据区域是E2:E11,那为什么这里不直接用公式=sum(E2:E11)进行求和呢?而是前面多了“1*”。 因为在 “销量”列里存在文本形式的数字,当这种数据作为sum函数的参数时,会被当作为文本来运算,所以如果直接用公式=sum(E2:E11)求和,文本型数字就没有被包括在求和中,从而使得求出来的结果与真实结果并不相符。 如何把文本型数字转换为数值型数字呢? 可以用“分列”的方法,直接把文本型数字转换为数值,然后在求和。还有一种办法是像案例中的1*(E2:E11)的形式强制转换为数值格式。 2.sum跨表求和 案例:汇总各销售部的销售总量 如上图所示,我们要将销售1部、销售2部、销售3部,销售4部,销售5部的销量进行汇总,其中销售1、2、3、4、5部门的销售数据是连续排列的5个工作表,每个表的A2:B6数据区域分别存放着各销售部门1至5月份的销量数据。 在目标单元格输入公式“=sum(”,然后鼠标单击“销售1部”工作表,按住shift键再单击“销售5部”工作表,然后选取B2单元格,按enter 键结束,将得到以下公式:=sum(销售1部:销售5部!B2) 公式说明: (1)要对不同的表的相同区域进行求和,可以用sum进行跨表求和 (2)当跨表引用多个相邻的工作表中相同的数据区域进行汇总时,无须逐个工作表对数据区域进行引用,可以按工作表的排列顺序,使用冒号将第一个工作表和最后一个工作表表名进行连接,作为跨表引用的工作表名。 注意:sum的跨表求和,是对多张工作表上的相同单元格区域进行引用求和。所以在案例演示中,我们也可以看到,销售1-5部的销售表,其表结构是完全一致的。 3.单条件求和:sumif =sumif(条件区域,条件,求和区域) sumif是对条件区域进行判断,只对满足条件的数据求和。 案例:按月份统计每个月的销量 在目标单元格H2中输入下面的公式 ,然后向下填充公式,求出其它月份的总销量。 =sumif($B$2:$B$11,G2,$E$2:$E$11) 公式说明:sumif将数据区域B2:B11(月份列)中的每一个单元格都与条件值G2单元格(月份)进行比对,如果相等,就与B2:B11(月份列)中对应的“销量”列(E2:E11)的值进行求和。也就是按月份来求和。 4.多条件求和:sumifs sumifs函数,多条件求和,语法规则为: =sumifs(求和区域,条件1区域,条件1,条件2区域,条件2…条件N区域,条件N) 案例:按月份统计某产品的总销量。例如1月份A产品的总销量是多少?1月份B产品的总销量是多少? 在目标单元格输入公式: =sumifs(E2:E11,B2:B11,G2,C2:C11,H2) 公式说明:sumifs函数与sumif函数的参数位置是有区别的: 除了参数顺序不一致之外,sumifs实现原理其实与sumif函数完全相同,只不过,是在后面多添加了统计条件而已。 对于案例演示中的公式,如上,sumifs函数将条件区域B2:B11(月份列)中的每一个单元格都与条件值G2(月份)单元格进行比对;将条件区域C2:C11(产品列)中的每一个单元格都与条件值H2(产品)单元格进行比对;如果都相等,则将E2:E11(销量列)中对应的销量进行求和。 5.乘积求和:sumproduct sumproduct函数:product,在英文中是“相乘”的意思,和求和函数sum结合起来,就是相乘后再相加,统计的是对应区域的乘积之和。语法规则是: =sumproduct(乘积区域1,乘积区域2) 乘积区域1和乘积区域2中的数字会被一一对应相乘最后将这些乘积求和,也就是乘积和。 案例:统计总销售额,也就是每一行的单价*销量,然后再求和 在目标单元格输入公式: =sumproduct(D2:D11,E2:E11) 公式说明:单价列(D2:D11),销量列(E2:E11))。sumproduct是对D2与E2相乘,D3与E3相乘,D4与E4相乘…,然后再将它们的乘积进行相加,就是每一行的单价*销量,然后再求和得出总销售额。 6.数据库求和:dsum函数 作为求和家族中的一员,dsum函数相对于其它成员来说,存在感不强,这里了解下即可。 dsum函数,返回的是数据区域中满足指定条件的列中的数字之和。语法规则是: =dsum (数据区域, 求和字段的列数,条件区域) 案例:统计销售员猴子、苏火火、高小明的总销量 在目标单元格输入公式=dsum(A1:E11,5,G1:G4) 公式说明:特别注意,“数据区域”和“条件区域”,必须要包含列标题。所以案例中的公式=dsum(A1:E11,5,G1:G4)中,数据区域是(A1:E11)。 求和字段是“销量”,“销量”列在数据区域A1:E11中位于第5列,所以,第二个参数“求和字段的列数”是5。 “条件区域”也就是对哪些销售员进行销量求和,案例中是猴子、苏火火、高小明所在的数据区域,所以,条件区域是G1:G4。 6.总结 通过上面的介绍,想必小伙伴们对求和一家子也认识得差不多啦。求和除了sum函数的基础应用,还可以根据要解决的业务问题选择跨表求和、单条件求和、多条件求和、乘积求和、数据库等,你都get到了吗? 推荐:人工智能时代的必学技能
书不在多,而在于精。下面从数据分析招聘要求的必须技能:统计学,Excel,SQL,业务知识,Python这5个部分来详细聊聊每一步如何去学习和看哪些书 第1步:统计学1)统计学有什么用呢?请给我一个学习的理由如果你打开招聘的职位要求,都会要求具有统计学的知识,这是因为统计学是数据分析、机器学习的基础知识,是必须要学习的。然而很多人因为不明白学习统计学的意义是什么,统计学在生活中有什么用,而最终学的没有目的。下面的书会让你知道学习的意义是什么。 推荐理由:很多人感到统计学无聊,是因为从一开始就没有明白学习这门课的意义是什么,所以学下去的动力不足。《赤裸裸的统计学》可以让你了解学习统计学的意义什么?在日常生活中统计学有什么用?你也可以把它当作一本科普书来读。2)如何深入学习统计学?前面的书让你知道了学习的意义是什么,具备了统计学思维。接下来,就可以进一步学习统计学在数据分析中是如何使用的。 推荐理由:如果你是零基础,《深入浅出统计学》可以让你轻松愉快的学会,书里面有通俗易懂的案例,图文并茂,学习统计学不会那么枯燥。 推荐理由:适合有基础的人看。如果你之前学过些统计学,但是又还给了老师,那么,有一定基础的你,《商务与经济统计》可以深入了解统计学。但是,注意了,如果你是零基础,看这本书会有些困难。 第2步:Excel数据分析这部分可以看我之前讲过的这个live可以快速掌握:怎样用 Excel 做数据分析? 第3步:如何使用SQL进行数据分析 推荐理由:零基础入门,只推荐一本书那就是《SQL基础教程》。这本书写的也是通俗易懂,里面的案例也很贴合实际应用。有人会推荐《SQL必知必会》,其实这本书零基础的人看不懂,有基础的倒是可以把这本书当做一本字典来使用,遇到问题了,可以查找对应的内容。对应的入门课程:从零学会SQL:入门www.zhihu.com图标 第4步:业务知识和分析方法1)业务知识数据分析是一个行业特征很明显的能力。如果你说自己想进入“互联网行业',那就说明你还没想清楚到底要干什么。因为互联网的存在是为了解决某个行业的问题(互联网+行业),比如滴滴、高德地图解决的是出行交通行业的问题(互联网+交通出行),小学英语在线平台vipkid解决的是教育行业的问题(互联网+教育),蚂蚁金服解决的是金融行业的问题(互联网+金融),饿了么解决的是餐饮行业的问题(互联网+餐饮)。而这些行业都需要数据分析师,每个行业域的业务知识也不一样。你以后找的也是成为XXX行业的数据分析师。只有确定了行业,才能研究这个行业是什么,对症下药,这样成功转型的概率最大。这就要求你具备以下能力: 理解业务数据,能根据分析目标提取有用的数据。这就要求你能看懂数据。 会使用相关指标去分析数据,可以使用多个指标去分析一个问题。这就要求你知道常见的业务指标有哪些。从零学会数据分析:业务指标www.zhihu.com图标 2)常用的分析方法很多人也学了一堆工具(excel,sql,python等),谈起使用工具的技巧头头是道。但是面对问题,还是不知道如何去分析。 他们每天也按时上班,也用数据做了很多图表,但是只是统计了分析之前已经知道的现象,比如“这个月销售有所只下降”等实际情况。他们不会深入分析现象背后发生的原因,从而也得不出什么具有建设性的结论。 所以,你还需要学会如何解决这些问题: 面对问题,没有思路,怎么办? 面对一堆数据,该如何下手去分析? 面试中的业务问题如何去回答? 这就需要你掌握常用的分析方法,下面是我总结的常用分析方法: 逻辑树分析方法、多维度拆解分析方法、对比分析方法、假设检验分析方法、相关分析方法、群组分析方法,AARRR分析方法,RFM分析方法 下面推荐几个行业相关的书,选择自己将要从事的数据分析所在行业的学习即可。如何用分析方法解决实际问题:《如何用数据解决实际问题》 (ps:这本书介绍了分析方法如何应用到解决实际问题中,建议在看这本书之前先学习完前面我发的常见分析方法,然后才能看懂这本书)游戏行业:《游戏数据分析实战》 国外作者肖恩的《增长黑客》 推荐理由:里面案例细节很多,可执行性很强,有理论有实践。其中的AARRR漏斗分析是经典的数据分析方法:一文看懂产品运营的分析方法 第5步:如何使用Python进行数据分析Python毋庸置疑是人工智能时代排名第一的编程语言。学习Python分为两部分:1)掌握Python基础语法2)学会如何使用Python进行数据分析如果之前没有学过编程,那么看其他编程的书会让你无聊,最后导致放弃。可以学习下面这图文并茂,对于入门学习Python基础语法比较适合。零基础掌握人工智能(AI)核心语言:Pythonwww.zhihu.com图标 推荐理由:前面的《与孩子一起学编程》可以帮助你学会Python基础语法。学会以后,就可以看《利用Python进行数据分析》学习如何使用Python进行数据分析了。在知识的海洋里,一次小小的偶遇,可能就是你苦候良久的邂逅。 机器学习该怎么入门?www.zhihu.com图标
在excel里,对于“查找”的实现,vlookup绝对是使用得最为频繁的一个函数。 但是,遇到下面问题,vlookup就没用了。 下面的表格记录了员工的信息,现在想通过“姓名”查找对应的“工号”。如图所示,通过输入不同的姓名,就会返回对应的工号。 在原数据里,“工号”在A列,“姓名”在B列,如果是通过工号来查询对应的姓名,用vlookup函数就能秒杀。但现在是通过B列来查询对应的A列的内容,是发向查询。 vlookup函数在查询的时候只能从左往右查询,且查询对象所在的列,必须要在查询区域的第一列,也就是说,只能通过A列来查询B列或其它列,而不能通过B列来反向查询A列。 你可能会说了,把原数据里的A列和B列调换一下顺序不就轻易地避开了上面的问题吗?但是,这样做原始数据就发生了改变,在工作中很多时候我们拿到的表数据,标题中是会有合并单元格的,这就更限制了列的移动。 像这种反向查询问题,就必须祭出我们的“大杀器”了:index+match组合,你就可以更灵活地实现查询。 1.什么是index? index函数能根据指定的行号和列号来返回一个值。语法规则如下: index(单元格区域,第几行,第几列) 单元格区域:就是要查找的数据范围;第几行:在查找范围的第几行;第几列:在查找范围的第几列。(其中“第几列”是可以省略的。) 对index函数有了基本的认识后,下面通过案例来看下如何使用。 沿用上面案例中的员工信息表,现在想要查询员工“猴子大大”的工号。 要找的工号在A列,姓名“猴子大大”在第7行,所以输入公式=index($A$2:$A$11 , 7)。 也就是告诉index函数,我们要查找的是A2:A11这个区域的第7行的信息,于是返回了正确的工号(A2002)。 聪明的你肯定发现了端倪:我在这儿是用肉眼来看,然后用手指头戳着一个一个数,最后才知道猴子大大位于第7航。 那么,问题就来了。如果数据量非常大,或者要查找的员工非常多,难道我还要靠肉眼来看靠手指来数数吗? 所以,这时候就得要有一个函数来告诉index,让它去取第几个。下面隆重请出index的最佳搭档:match函数。 2.什么是match? match在英文中是匹配的意思,所以大家应该很自然就能想到它的作用就是进行数据匹配。 匹配什么呢? 就是拿你要查找的值,去指定的区域进行匹配。匹配上了,就会返回目标值所在的单元格位置。它的语法规则是:match(要查找的值,在哪里找,是否精确匹配) 要查找的值:就是我们想匹配的值。在这个案例中是姓名“猴子大大”; 在哪里找:去哪个区域找想匹配的值。在这个案例中就是去哪里找姓名“猴子大大”,就是要去“姓名”列中找; 是否精确匹配:它有三个选项,-1,0,1。其中,0代表的是精确匹配。在这个案例中是要在“姓名”列精确匹配“猴子大大”,所以选择的值是0。-1表示查找大于等于“要查找的值”。1表示查找小于等于“要查找的值”。 这个案例中,我们愉快地就写下了这样的公式=match("猴子大大",$B$2:$B$11,0) 返回结果是7,表示匹配到“猴子大大”在姓名列的第7行。 在案例演示中,我们把要查找的猴子大大,放在了单元格H2,所以上面的公式也可以改为:=match(H2,$B$2:$B$11,0) 返回的结果同样也是7。 3.index+mathch搭档 在最开始的时候,我们靠肉眼来查找来数数。但是现在有了match函数,我们就把这个查找的任务丢给它,让它来传递。因此原本的公式=index($A$2:$A$11 , 7) 就可以把公式中的7修改成math函数=index($A$2:$A$11 , match(H2,$B$2:$B$11,0) ) 也就是说,使用mathch函数来为index函数的第二个参数提供值,告诉index要返回的是第几个值。 所以,通过index+match函数的组合,我们就可以打造一个下面这样的查询系统啦。 无论你要查找的范围有多大,要查找的量有多少,都是秒秒间就能有结果啦。 (动图中所示的下拉菜单是用“数据验证”来实现的,有关这个功能的用法,可戳链接详细了解) 4.如何实现多条件查找? 上面小试牛刀之后,我们再来进阶一下。index+match的最强大的之处是,它们能实现多条件查找。 上面案例演示中,我们先match出猴子大大在B列的位置,然后再用index返回A列对应的值,得出了对应的工号。但是,如果我还想查询出猴子大大的其它信息呢?如下图: 除了工号,我还想查其对应的“基本工资”“部门”“籍贯”信息。而且,这些信息与数据源的顺序是不一致的。 怎么写公式呢? 有人说,那我就用案例一查询其工号的方法呗,依葫芦画瓢分别再写三个公式,一一来查“基本工资”“部门”“籍贯”信息。 这是一个方法,却是一个很笨的方法。实际工作中,我们面对的可能是很庞大的数据,要查询的列会很多,手动地一个列对应一个公式的写下来,不仅效率低下,还容易出错。 那有没有办法可以只写一次公式,就能返回所有列的结果吗?办法当然是有的。 首先,我们来理清一下:要用index函数来返回值,我们就得告诉它,我们要在指定区域的哪里去找。如要查询“工号”,就得告诉它,要去第1列查找;要查找“基本工资”,就得告诉它,要去第6列查找;要查“部门”,就得告诉它,要去第5列查找。那谁来告诉它呢?用match来告诉它。 match不是最擅长匹配吗?好,就用它来定位位置信息。我们要查询“工号”,我们就用match来匹配,定位到“工号”在数据源里,它是位于第1列;要查询“基本工资”,我们就用match来匹配,定位到“基本工资”在数据源里,它是位于第6列。 把match得到的位置信息就存储起来,然后传给index,index收到定位信息后,就去指定区域对应的位置查询,于是返回对应值,查询结束。 好了,思路清楚后,我们在I2单元格写下公式吧: =index($A$2:$F$11, match($H2,$B$2:$B$11,0), match(I1,$A$1:$F$1,0)) 公式解读:我们要在A2:F11这个区域查找,区域这么大,在哪里找呢?给个定位信息吧。好,让match来告诉你横坐标、纵坐标。 根据单元格H2的引用值,用match来匹配“猴子大大”,定位到他所在的行,为第7行,作为横坐标。 那纵坐标呢?因为要查他的工号,所以,再用match对“工号”进行匹配,“工号”在数据源A1:A11里,位于第1列,作为纵坐标。 好了,在A2:F11的这个区域里第7行第1列交叉处的单元格的值,就为猴子大大的工号信息。对于 “基本工资”的查找,同理,在指定区域的第7行第6列查找;其它信息,依次类推。 因为公式还要往右填充,所以,要把单元格H2进行列的锁定,防止公式在填充过程中发生了列的变化。因此,得出了上面的公式。 再通过“数据验证”使得H2的单元格内容自由选择,就能打造一个查询系统了: 想查询哪个员工的哪些信息,也就只是眨眼的功夫。 5.总结 通过index+match这对搭档,我们可以灵活自如地解决90%的查询问题。match用来定位,index根据定位来返回指定位置的值,你学会了吗? 推荐:人工智能时代的必学技能
在求职面试中,经常会考察这种问题: 1)设计一个聊天软件2)设计一个订餐软件3)设计一个打车软件4)设计一个语音机器人5)如何设计一份调查问卷 这问题叫作“产品设计问题”。无论你面试的职位是运营、产品经理、数据分析师、工程师,还是设计师等其他职位,都会遇到这类问题。 为什么面试会问这种问题呢? 这类问题可以全面考察一名应试者的逻辑能力、分析能力。 如何回答“产品设计问题”? 用圆圈方法(circles),这个方法最早是由前微软产品总监、谷歌产品经理 LEWIS C.LIN 在他的畅销书《Decode and Conquer》中提出的。 circles其实是7个步骤的首字母缩写,这几个步骤其实就是我之前说过的数据分析步骤:明确问题、分析问题和解决问题。 1)明确问题(Comprehend the situation)2)分析问题指明受众(Identify customers)汇报需求(Report customer needs)优化次序(Cut,through prioritization)3)决策(解决问题)罗列方案(List solutions)平衡优劣(Evaluate tradeoffs)总结建议(Summarize recommendations) 下面我们看下如何用这个方法回答“产品设计类问题”。 一、明确问题 记得上学的时候,我经常会做错题。通过分析这些错题,我发现大部分是因为没看清楚题目要求。 所以,在回答问题前,不要急着说如何去设计产品。而是向面试官问清楚所有细节,避免你和心里想的不一样。 这时候可以用5w2h分析方法来明确问题:what(做什么):这是什么产品?when(何时):什么时候需要上线?where(何地):在哪里发布这些产品?why(为什么):用户为什么需要它?who(是谁):这是给谁设计的?how (怎么做):这个产品需要怎么运作?how much(多少钱):这个产品里有付费功能吗?价格是多少? 二、分析问题 圆圈方法建议通过以下3步来逐步拆解和分析问题:指明受众、汇报需求以及优化次序。 1.指明受众,汇报需求 “指明受众”是说要明确这个产品是设给谁设计的?理解了是谁在使用产品,才能根据用户需求去设计。 汇报需求是指对不同的用户分别总结需求。 比如,设计一个聊天软件,用户可以分为:年轻人、老年人等。他们的需求不一样,这就会影响后面的设计方案。 年轻人正常的字体就可以,而老年人的需求可能需要较大的字体聊天才能看清楚。 2.优化次序 在实际工作中,由于资源有限(时间、人力、资金等),不是不是所以需求都能同时去开展。 所以,在前面分析了受众和需求以后,我们需要对任务评定优先级。这可以考察面试者的统筹规划能力。 如何评定优先级呢? 我们可以用“时间管理四象限方法”,如果把时间从不紧急到紧急画出横轴,,把事情从不重要到重要画成纵轴。这样就把整个空间划分成四个象限了。 第一象限包含的是一些紧急而重要的事情,必须首先处理优先解决,先去做这一象限里的需求。 比如,设计聊天软件,有上百个需求要完成。那么,最重要的是去完成最基本的聊天需求,并且满足用户量最大的那个群体的使用需求。 三、决策(解决问题) 到这一步,圆圈方法建议通过以下3步来解决问题:罗列方案、平衡优劣、总结建议。 在实际工作中,只有一种解决方案的情况很少见,通常会有多个方案可以选择。这时候就需要把不同的设计方案罗列出来,说出每个方案的优劣(平衡优劣),最后给出建议(总结建议)。 比如,对应一个app,如何做用户增长呢? 可以有下面几种方案:1)邀请头部大v入住,通过大v带来新用户2)在app里给新用户发红包来推广 这些方案都可以,但是各有优劣。需要你能够平衡优劣,总结提出建议。 四、总结 如何回答“产品设计类问题”? 用圆圈方法(circles),这个方法其实是7个步骤的首字母缩写,这几个步骤其实就是我之前说过的数据分析步骤:明确问题、分析问题和解决问题。 1)明确问题2)分析问题指明受众、汇报需求、优化次序3)决策(解决问题)罗列方案、平衡优劣、总结建议 留一个思考题:如何设计一个打车软件?可以在下面留言区写出你的回答。 推荐:人工智能时代,你必须要学会这个通用技能
在《分析方法》中,我们讲到逻辑树分析方法,这种分解问题的思考方法是由科学家费米提出来的。这种分析问题的方法在面试中会经常用到,比如北京有多少量特斯拉汽车?某胡同口的煎饼摊一年能卖出多少个煎饼?深圳有多少个产品经理?一辆公交车里能装下多少个乒乓球?一个正常成年人有多少根头发? 这类估算问题,被称为费米问题。为什么面试会问这种问题呢? 这类问题能把两类人清楚地区分出来。一类是具有文科思维的人,擅长赞叹和模糊想象,它主要依靠的是人的第一反应和直觉,比如小孩天生就会看到的东西进行赞叹。 另一种就是具有理科思维的人,擅长通过逻辑推理、分析的能力解决具体问题。这种思维不是人天生的,需要经过长期的训练。 公司招聘人需要的是经过长期训练,能把事情做成,具有严密逻辑推理、分析能力的人,所以费米问题可以考察出一个人有什么样的思维方式。 【案例】某胡同口的煎饼摊一年能卖出多少个煎饼? 【参考答案】 一年卖的煎饼数量=1天卖出的煎饼数量 * 365天 1天卖出的煎饼数量是多少呢?我们可以进一步拆解:1天卖出的煎饼数量=1天的工作时间 / 做一个煎饼的平均时间 现在我们将这个问题拆解为两个子问题了:1)做一个煎饼的平均时间是多少?2)1天的工作时间是多少? 1)做一个煎饼的平均时间是多少?大家都吃过煎饼,我们猜测是1分钟做一个煎饼 2)1天的工作时间是多少?煎饼是一种季节性商品,通常用户仅在早餐、中午、晚上时间购买。每天的早高峰6:00-9:00。中午12:00-1:00。晚高峰6:00-:900。这样一天大概工作时间是7个小时。 我们带入前面的拆解公式:1天卖出的煎饼数量=1天的工作时间(7小时) / 做一个煎饼的平均时间(1分钟)=420个煎饼 一年卖的煎饼数量=1天卖出的煎饼数量(420) * 365天=15万张煎饼 【案例】估算学校门口大妈卖煎饼的年收入? 每日收入=1年卖出的煎饼个数*煎饼单价 前面的案例我们已经计算出了1年卖出的煎饼个数,现在带入煎饼的单价就可以了。 你看,遇到“费米问题”,先用逻辑树分析方法,把一个复杂的问题拆解成一个一个能解决的子问题。 【案例】请问用多少个乒乓球能装满这间屋子? 【参考答案】 房间体积=1个乒乓球的体积 * 乒乓球个数 所以,乒乓球个数=房间体积 / 1个乒乓球的体积,从而将一个复杂问题拆解为两个子问题:1)房间体积2)1个乒乓球的体积 1)房间体积这间房子大概长是x米,宽x米,高x米,能得出这个屋子的体积 2)1个乒乓球的体积 但是这里需要注意,乒乓球的体积是按照球形体积来算,但是乒乓球堆积起来的时候,每个乒乓球应该是占用一个立方体的体积,而不是占用一个球体的体积。一个乒乓球的半径R大概是x厘米所有每个乒乓球的大概体积(也就是立方体)是a×a×a(其中a是一个乒乓球的直径)。 乒乓球的体积确实是按照球形体积来算,但是乒乓球堆积起来的时候,每个乒乓球应该是占用一个立方体的体积,而不是占用一个球体的体积 然后用估算的1)房间的体积 除以 2)1个乒乓球的体积,就能算出这间屋子大概能装下多少乒乓球。 【案例】深圳有多少产品经理? 【参考答案】 深圳有多少家互联网公司(可以按人员总数进行分层,招聘网站就有公司数量和公司规模),在公司人员总数中有多少比例是产品经理。 【案例】北京有多少量特斯拉汽车? 【答】在《逻辑树分析方法》里说过特斯拉CEO马斯克是如何利用这个分析方法拆解问题,以及本题的答案。下面是马斯克在2017年TED演讲中谈到了他未来的设想,你可以回顾看看。 马斯克的创业故事 推荐:如何系统学习分析方法,提高分析能力?
如果你是因为我的标题党而点开了文章,那下面的介绍,绝对不会让你失望。只要你会复制粘贴,令人眼前一亮的创意图表你也能制作出来! 这些创意的图表是怎么制作的呢?其实背后的原理总结起来就三大步: 第一步:准备素材;第二步:复制素材;第三步:粘贴素材。下面我们就逐一破解吧。 案例一: 涉及知识点:复制粘贴/层叠 选定目标数据后,插入普通的柱形图。 接下来就是制作创意图表的三大步。 第一步:准备素材 图表表达的是不同职位的平均薪水差异,所以,很自然地就想到用金币来表示薪水。于是我找了一个金币的图标,作为素材备用。 第二步:复制素材 Ctrl+C,复制金币图标; 第三步:粘贴素材 单击任一柱形图,然后Ctrl+V粘贴。得到下图: 如上图所示,图标被拉伸变形了。怎么办?单击任一图标,在【设置数据系列格式】窗口里,将填充方式勾选为【层叠】。效果如下图: 接下来就是对图表进行简单美化,如删除网格线,调整间隙宽度等。最终如下图所示: 通过上面案例一的预热,想必大家都跃跃欲试。所以,像下面这样的创意图表,相信聪明的你应该都能信手粘来了吧。 那么问题来了:图标素材要去哪儿找呢?其实Excel中自带的图标就足够多了。Excel 2019版本在【插入】选项卡下会有【图标】这个功能。这里面可是宝藏哦。你可以慢慢挖掘。 如果不是2019版本的小伙伴也不要泄气,在iconfont-阿里巴巴矢量图标库(https://www.iconfont.cn/)也有成吨的素材,就怕你挑到眼花。 案例二: 涉及知识点:系列重叠/层叠与缩放 上面案例一是对单系列柱形图改造。那多系列柱形图又可以玩出什么样的创意呢?复制粘贴大法当然是少不了的,但是,除了复制粘贴,多系列柱形图里【系列重叠】设置以及【层叠并缩放】的填充方式才是关键。 首先,我们增加一辅助列“整体”,为原数据添加多一个系列,然后选中所有数据,插入柱形图: 单击任一柱形图,然后在【设置数据系统格式】窗口里,将【系列重叠】调为100%,那么,两个系列的柱形就会完全重叠在一起,形成百分比重叠型柱形图。 接下来又是复制粘贴大法的运用啦。 第一步:准备素材 我准备了一个男性人物图标(怎么找图标?上面案例一有说到哦),然后复制了一份,分别填充不同的颜色以备用。 调整柱形图的宽度与高度,使得柱形图的宽度、高度与素材的一致。(可以把素材放在柱形图上面,对照着来微调)为什么要这样调整呢?因为后面要把素材粘贴进柱形图里,为了使素材不变形,这步工作可不能偷懒哦。 就这样,准备工作做好了。 第二步:复制/粘贴素材 Ctrl+C复制灰色图标素材,然后Ctrl+V粘贴到蓝色柱形图,如下: 同样的步骤,Ctrl+C复制青色图标素材,Ctrl+V粘贴到黄色柱形图,如下: 然后分别对两个图标的填充方式调整为【层叠并缩放】 就这样,图表成形了! 添加数据标签。怎么让数据标签都跑到头上去呢?不可能一个一个拖上去吧。 利用【单元格的值】就可实现。我们先显示出灰色部分的数据标签: 选中数据标签,在【设置数据标签格式】窗格,把【值】前的勾勾去掉,勾选【单元格的值】 这时会弹出一个excel对话框。在弹出的对话框中,选择占比的数据即可。 然后数据标签就设置好了。 对图表的网格线、纵坐标轴等进行删除简化,最后效果如下图: 案例三: 知识点:逆序坐标 案例一、二我们介绍了单系列、多系列类型柱形图的玩法,而接下来继续进阶对比柱形图。 工作中,我们要对比一组数据的时候,常会把它做成柱形图或者条形图,下面所要讲到的蝴蝶图其实就是条形图的变身,是两组数据的横向对比。因为其展示效果像蝴蝶的翅膀一样,所以,又称为蝴蝶图或旋风图。 首先,选中数据源,插入簇状条形图: 纵坐标轴的顺序倒过来了,设置为【逆序类别】倒过来即可。 接下来的工作,就是要把男性的数据给掰到右边。 选中男性的数据(蓝色柱形图),把它设置为【次坐标轴】。 这时候会看到下方多出一个横坐标轴。 选中下方的横坐标轴,将其设置为【逆序刻度值】。男性的数据就这样被掰过来了。 注意看坐标轴的变化。上面的横坐标轴是控制女性数据的;下面的横坐标轴是控制男性数据的。 分别设置上下两个横坐标轴的边界,使它们相等。 最大值=两个横坐标轴的最大值(如本案例演示中为10000) 最小值=-最大值(本案例演示中为-10000) 看,效果已经出来了。 但是主要纵坐标在中间,很难看得清楚。能不能把它移到左侧呢?选中主要纵坐标,把主要纵坐标轴前的勾勾取消,勾选【次要纵坐标轴】,坐标轴就出现在左侧了。 纵坐标轴的顺序倒过来了,设置为【逆序类别】倒过来即可。然后添加数据标签,删除网格线等。最终效果如下图,是不是像个翩翩起舞的蝴蝶? 总结: 只要掌握了复制粘贴大法,你就可以充分利用丰富的图标或图片素材来填充图表,使图表观点表达更生功形象,同时填充方式的设置是实现创意图表的关键,【层叠】【层叠并缩放】,都要掌握哦。 推荐:人工智能时代的必学技能
1.什么是A/B 测试?有什么用? 做过App功能设计的读者朋友可能经常会面临多个设计方案的选择,例如某个按钮是用蓝色还是黄色,是放左边还是放右边。 传统的解决方法通常是集体讨论表决,或者由某位专家或领导来拍板,实在决定不了时也有随机选一个上线的。虽然传统解决办法多数情况下也是有效的,但A/B测试可能是解决这类问题的一个更好的方法。 简单来说,A/B测试就是为同一个目标制定两个版本,这两个版本只有某个方面不一样,其他方面保持一致,例如两个版本只有按钮的颜色不一样。让一部分用户使用A版本(实验组),另一部分用户使用 B版本(对照组)。 试运行一段时间后,分别统计两组用户的表现, 然后对两组数据进行对比分析,最后选择效果更好的版本正式发布给全部用户。 其实A/B 测试的底层方法是对比分析方法。 2.A/B测试是怎么来的呢? 2007年,参议员的巴拉克•奥巴马在芝加哥参加了总统竞选。谷歌的产品经理丹•西罗克是奥巴马竞选团队“新媒体分析”部门的负责人。他用A/B测试优化了竞选网站的“捐款”按钮,使得捐款金额增加了5700万美元。 他对这个“捐款”按钮做了什么呢? 西罗克在奥巴马捐赠页面上进行了A/B测试,发现:1)对于第一次访问竞选网站的用户,按钮文字是“捐赠并领取礼物”效果最好。2)对于长期访问竞选网站,但是从来没有捐款的用户,按钮文字是“捐款”效果最好。3)对于过去曾经捐过款的用户,按钮文字是“捐助” 效果最好。 在奥巴马就任总统后,西罗克创办了一家网站优化公司(Optimizely。)。在下一轮的总统选举中,这家公司的客户名单里是各个总统竞选团队。 现在A/B测试已经广泛应用于互联网公司,帮助优化产品。 吴恩达在主题为“AI是新的电力”的演讲中说到,能够定义互联网公司的并不是你是否有网站,而是你是否进行A/B测试,是否有很短的周期迭代,是否把决策权由CEO交给工程师和产品经理。 3.A/B测试案例 爱彼迎(Airbnb)是一家提供民宿服务的平台,创建于2007年,现在已经估值约300亿美元。 在2011年初,爱彼迎团队通过查阅数据寻找房源预订量比较低的地区。他们发现纽约市的房源预订量竟然不达标。要知道,纽约可是热门的旅行地区,为什么房源预定量低呢? 在观察这个地区的房源照片时发现,这些照片都是手机拍的,拍的即不清晰也不美观。如果房东发布的房源信息里有拍摄效果更加专业的照片,房东是不是会更容易租出自己的房子呢? 为了验证这个假设,爱彼迎团队先挑选了一部分房东作为实验组,免费为他们提供专业的摄影服务。 然后,将实验组的平均住宅预定量和纽约其他公寓的平均预订量进行对比。数据显示,如果房源信息里有专业拍摄的住宅照片,房源预订量高于爱彼迎平均房源预定量的2- 3倍。也就是说,照片质量会影响预定量,说明前面的假设是成立的。 根据这个A/B测试结论,爱彼迎推出一个摄影计划,聘请了20名摄影师,专门为房东提供专业的拍照服务,这使得爱彼迎的房源预定量实现了快速增长。爱彼迎团队进一步决定向所有房东推广这一业务,这极大的提升了房源预定量。 同样,Google 用A/B测试来调整和测试它的算法和网站的设计;Facebook 通过A/B测试上线新功能、新版本,优化广告营收。电商巨头亚马逊通过A/B测试来不断完善网站,优化用户体验。 如果你对你的网站或者 App 感到十分不满,但又担心改头换面的重新设计会带来风险,那么可以尝试使用A/B测试,最终在得到一个全新的网站的同时,也会带来转化率的提升。 推荐:如何系统学习分析方法,提升分析能力?
从下面两部分详细聊聊经典面试题-费米问题:1.如何回答费米问题?2.经典的费米问题案例 一、如何回答经典面试题-费米问题?在求职面试中,经常会考察这种问题:北京有多少量特斯拉汽车? 某胡同口的煎饼摊一年能卖出多少个煎饼? 深圳有多少个产品经理? 一辆公交车里能装下多少个乒乓球? 一个正常成年人有多少根头发? 这类估算问题,被称为费米问题,是以科学家费米命名的。为什么面试会问这种问题呢? 这类问题能把两类人清楚地区分出来。一类是具有文科思维的人,擅长赞叹和模糊想象,它主要依靠的是人的第一反应和直觉,比如小孩天生就会看到的东西进行赞叹。 另一种就是具有理科思维的人,擅长通过逻辑推理、分析的能力解决具体问题。这种思维不是人天生的,需要经过长期的训练, 公司招聘人需要的是经过长期训练,能把事情做成,具有严密逻辑推理、分析能力的人,所以费米问题可以考察出一个人有什么样的思维方式。因此,我们日常生活中可以有意识的通过“费米问题”来改善逻辑思维能力的不足。一般人拿到费米问题这样的题目就会感觉摸不着头脑,不知道怎么解决,干脆凭感觉瞎猜一个数字。这其实忽视了面试官考察的目的,他不是要你一个确定的数字,而是想看到你面对问题的分析思路。所以,你需要把自己的思路说出来,来证明你的思维方式是理科思维,而不是一上来凭感觉胡说八道的人。回答费米问题,可以用到逻辑树分析方法。将一个复杂的问题拆解成子问题,然后逐一解决。1.什么是逻辑树分析方法?逻辑树分析方法是把复杂问题,拆解成若干个简单的子问题,然后像树枝那样逐步展开。 为了更符合人类的思考过程,我们把这棵树倒过来,或者横着放,就是上面图片里常用的逻辑树分析方法。 通过逻辑树分析方法,我们可以把一个复杂的问题变成容易处理的子问题,从而提高我们的逻辑思维能力。不管是际生活中还是工作中,我们经常会使用逻辑树分析方法来分析问题。现在通过一个案例来看下,如何应用逻辑树分析方法来解决问题 现在你想给自己做一个年度计划,但是要做的事情很多,思路很零散。为了理顺你的思路,可以用逻辑树分析方法,把年度计划这个复杂问题拆解成一个一个子问题。可以把年度计划拆分成技能学习、读书、健身、旅行这几个子问题。技能学习是为了储备技能,抓住人工智能时代的红利。零基础从数据分析开始学起,有可以进一步拆解为学习业务知识,分析方法,excel,sql,python等。这样一步一步把年度计划拆解成一个一个子问题,解决了子问题就定好了年度计划。 2.费米问题案例前面我们说到“费米问题”可以帮助提高一个人的逻辑思维能力,科学家费米就经常用这些问题来锻炼自己。下面我举一个“费米问题”的例子。有人曾经问科学家费米:“芝加哥有多少位钢琴调音师?” 什么是钢琴调音师呢?为了保持钢琴音的准确性,需要定期由专业人员检查,调整不准确的音。从事这类工作的人被称为钢琴调音师。有一部分非常好看的电影就叫《调音师》。这个问题我们使用逻辑树分析方法来拆解成子问题。钢琴调音师数量=全部钢琴调音师1年的总工作时间/ 一位调音师每年工作时间。所以,我们可以把这个问题拆解为2个子问题:1)全部钢琴调音师1年的总工作时间2)一位钢琴师每年工作时间 “全部钢琴调音师1年的总工作时间”又可以拆解成3个子问题解决:1)芝加哥有多少架钢琴?2)钢琴每年要调几次音?3)调一次得多长时间? 现在我们一个一个去解决这些子问题。1)第一个子问题:芝加哥有多少架钢琴?这个不知道。我们再把它拆分。首先需要知道芝加哥有多少人,其次需要知道拥有钢琴的人所占的一个比例。芝加哥的人口上网可以查出来大概有250万。有钢琴的人占的比例是多少?不知道,但是我们可以猜一下,钢琴对普通家庭来说比较贵,而且钢琴占地比较大不方便放在家里,所以我们猜家庭拥有钢琴的比例是1%。为什么是1%,不是5%呢?因为1%通常表示概率最低,有的机构拥有钢琴数量比个人多点,比如音乐学院,所以我们再猜个数字,大概是2%左右。有了这些数据,做个简单的计算,可以算出芝加哥大概有5万架钢琴。 2)第二个子问题:钢琴每年要调几次音?钢琴调音师属于稀缺行业,人肯定不多,钢琴它也不像吉他需要频繁地调音,估计是一年一次。 3)第三个子问题:调一次得多久?大概猜两小时吧。 4)第四个子问题:一位调音师每年工作多长时间呢?美国每年有四个星期是假期,一年大概有50个星期。一周工作5天,按每天8小时的工作时间来算。这三个数相乘,就可以算出一位调音师每年工作时间是2000个小时。但是钢琴调音师要四处跑呀,肯定要在路上花时间的,所以减去大概20%的时间,所以调音师每年大概工作1600个小时(2000小时-2000小时*20%)。 现在我们把4个子问题汇总一下。全部钢琴调音师1年的总工作时间是3个子问题的数字相乘,也就是5万架钢琴每年需要调一次音,每次调音需要两小时,一共就是10万小时,调音师每年工作1600小时。我们再用全部钢琴调音师1年的总工作时间 除以 一位调音师每年工作时间,就得到了62.5。再四舍五入,费米预测芝加哥大概有63位调音师。 这个答案准不准呢?后来费米找到了一张芝加哥调音师的名单,上面一共有83人,有不少的人名还是重复的。要知道,费米是估算出来的,已经相当准了。3.总结公司通过“费米问题”来判断一个人是不是有逻辑思维能力,日常我们也可以通过有意识的做“费米问题”来改善逻辑思维能力。解决“费米问题”的办法是使用逻辑树分析方法,将一个复杂的问题拆分成一个一个小问题。从而将没有思路的问题变成条理清晰的思路。 二、经典费米问题案例公司招聘人需要的是经过长期训练,能把事情做成,具有严密逻辑推理、分析能力的人,所以费米问题可以考察出一个人有什么样的思维方式。 【案例】某胡同口的煎饼摊一年能卖出多少个煎饼?【参考答案】一年卖的煎饼数量=1天卖出的煎饼数量 * 365天1天卖出的煎饼数量是多少呢?我们可以进一步拆解:1天卖出的煎饼数量=1天的工作时间 / 做一个煎饼的平均时间 现在我们将这个问题拆解为两个子问题了:1)做一个煎饼的平均时间是多少?2)1天的工作时间是多少? 1)做一个煎饼的平均时间是多少?大家都吃过煎饼,我们猜测是1分钟做一个煎饼2)1天的工作时间是多少?煎饼是一种季节性商品,通常用户仅在早餐、中午、晚上时间购买。每天的早高峰6:00-9:00。中午12:00-1:00。晚高峰6:00-:900。这样一天大概工作时间是7个小时。 我们带入前面的拆解公式:1天卖出的煎饼数量=1天的工作时间(7小时) / 做一个煎饼的平均时间(1分钟)=420个煎饼 一年卖的煎饼数量=1天卖出的煎饼数量(420) * 365天=15万张煎饼 【案例】估算学校门口大妈卖煎饼的年收入?每日收入=1年卖出的煎饼个数*煎饼单价前面的案例我们已经计算出了1年卖出的煎饼个数,现在带入煎饼的单价就可以了。你看,遇到“费米问题”,先用逻辑树分析方法,把一个复杂的问题拆解成一个一个能解决的子问题。【案例】请问用多少个乒乓球能装满这间屋子?【参考答案】房间体积=1个乒乓球的体积 * 乒乓球个数所以,乒乓球个数=房间体积 / 1个乒乓球的体积,从而将一个复杂问题拆解为两个子问题:1)房间体积2)1个乒乓球的体积 1)房间体积这间房子大概长是x米,宽x米,高x米,能得出这个屋子的体积2)1个乒乓球的体积一个乒乓球的直径大概是x厘米,就能得出一个乒乓球的大概体积=直径直径 直径。 然后用估算的1)房间的体积 除以 2)1个乒乓球的体积,就能算出这间屋子大概能装下多少乒乓球。 【案例】深圳有多少产品经理?【参考答案】深圳有多少家互联网公司(可以按人员总数进行分层,招聘网站就有公司数量和公司规模),在公司人员总数中有多少比例是产品经理。 补充学习:如果想系统的学习《分析方法》可以看下面几个资料分析方法:如何将复杂问题变简单www.zhihu.com图标分析方法:如何多角度思考问题?www.zhihu.com图标分析方法:如何进行对比分析?www.zhihu.com图标分析方法:如何找问题发生的原因www.zhihu.com图标
1.excel 不方便多人共享使用数据excel好比一个移动硬盘,你打开使用excel,你的同事就无法再使用了。数据库好比网盘,你和同事可以愉快的一起使用网盘或者数据库里的数据。2.excel无法存放大量数据excel可以存放十几万的数据,但是大数据时代,从来就不缺少数据,当数据量越来越大的时候,excel就无能为力了。而数据库却可以存放海量的数据。所以,你看到淘宝几亿人使用,背后存放商品的不是excel,而是数据库。3.excel无法处理复杂问题数据库可以应对突发事故,比如数据丢失、数据被盗。数据库可以处理复杂的业务,比如银行存取款业务。这些功能excel都不具备。因为公司的数据是放到数据库里的,所以现在的数据分析、机器学习、开发工程师等职位在招聘要求中都会要求:使用过数据库,熟悉SQL。具体的数据库和SQL关系我在《从零学会SQL:入门》课程里用“建筑施工人员”类比过,是下面图片里的关系: 从零学会SQL:入门www.zhihu.com图标
在日常工作中,有时候单一的图表类型无法满足多维度的数据展示,这时候就要考虑使用组合图表。 什么是组合图表呢? 就是将两种及两种以上的图表类型组合起来绘制在一个图表上。 下面我们通过经典的柱线组合图来手把手教会你如何制作组合图表。 1.经典柱线组合图 下面都柱形图表示公司里每个员工的工资情况,折线图表示平均薪水。 利用柱形图+折线图的组合,不仅可以看出各员工的薪水情况,还能看到每位员工薪水与公司平均薪水的差距。 这样的图是如何制作的呢? 这就要用到Excel的辅助列来绘制。 在Excel添加一列“公司平均工资”作为辅助列,用于后期绘制平均薪水,所以这一列的值都是平均值。 使用所有列的数据(包括辅助列)来绘制柱状图,得到下面的图形。你会发现,辅助列也成为了柱状图的一部分。 需要把这个辅助列变成我们想要的横线。选中“辅助列”的柱子,点击鼠标右键,选择“更改系列图表类型”。 在弹出的【更改图表类型】窗格中,将辅助列(也就是“公司平均工资”)的图表类型设置为“折线图”。 最后,就得到了我们想要的组合图。 2.更改折线标记 同样也是柱线组合图,但是通过改变折线图的标记,我们又可以演变出新的组合图表。 首先,选中要进行图表制作的数据,【插入】图表里,选择图表类型为“组合图”。系统会默认是柱形图+折线图类型。 选中图上的折线,鼠标右键,在下拉菜单中点击【设置数据系统格式】。在弹出的【设置数据系列格式】窗口里把“线条”设置为“无线条”。 在“标记”选项里把标记设置为“内置”,选择合适的内置标记样式,在这里我选择了横线状的标记,然后调节其大小,使其与柱形图宽度相当。 最后,结果如下图: 3.将数据分离为多个系列 以平均值为分界线,现在想把高于平均值与低于平均值的数据以不同的颜色来标示,如下图: 从图中可以看到,无论原数据怎么变化,高于平均值的始终显示为蓝色,低于平均值的始终显示为灰色。这是怎么制作的呢? 这时候,就需要将数据分离为多个系列,对每个系列的数据单独进行格式化。 首先,使用if函数,将B列的原始数据分离为高于平均的E列和低于平均的列。 E列公式为:=IF(B2>D2,B2,NA()),即判断B2的数值是否比平均值大,如果是,就返回B2本身,否则,返回NA()。 F列公式为:=IF(B2 知识小拓展: 肯定有人会疑惑这里为什么返回NA()。敲黑板了!在图表制作过程中,需要区分空单元格、零、#NA在折线图中不同显示形式。 当单元格中内容为文本、空格、零时,图表均以0显示数据点,在折线图中会形成断点;当单元格内容为“#N/A”或“=NA()”时,在折线图中会显示为用直线连接数据点。 在这个案例演示中,E列F列数据我都是以柱形图来制作而不是折线图,所以无论E列F列返回的是NA(),还是0,其实结果都是一样的。只是我习惯于用NA()。 将原数据分离为两个系列后,用E和F列数据作堆积柱形图,就实现了图表的自动条件格式化,高于平均值的与低于平均值的分别由不同的颜色标示。 然后把复制平均值D列数据到图表上,系统会默认是柱形图。点击鼠标右键选择“更改系列图表类型”。 在弹出的【更改图表类型】窗格中,在组合图表里,将平均值的数表类型设置为折线图。 最后达到了我们想要的效果: 4.总结 绘制组合图表的操作并不复杂,Excel的插入图表功能里默认已经有很多常用的组合图表,平日拿来直接用就可以啦。 如果Excel的插入图表功能里没有你想要的组合图表,可以参考本文的案例,先将数据全部绘制成同一种图表类型,再选择想要修改的数据系列,修改成另一种图表类型就可以了。 推荐:人工智能时代的必学技能
想要分析的时候,没有数据,就是巧妇难为无米之炊。以前想找一个数据需要费尽心思再往上去搜,最终还找不到自己想要的数据。通过编程爬虫数据学习成本太高,又不是想要成为爬虫工程师,只是想要拿到数据来分析。那有没有傻瓜式的获取数据方法呢?下面介绍4种获取数据的方法,选择一种适合你自己的方法就可以。方法一:从数据竞赛平台获取国内中文平台: 1)阿里云天池数据下载办法: 2)DF数据集 有的文件下载后会显示后缀是.zip, .zip是个压缩包,下载后需要减压后才能看到压缩包里的excel文件 3)科赛 国外英文平台:如何在Kaggle上查找数据 方法二:直接获取10大行业免费数据 1)如何选择行业?不知道如何选择行业的,可以在下面网站里看到各个行业的分析报告:如何选择入职行业 :https://www.zhihu.com/question/24995484/answer/516813008艾瑞研究-艾瑞网(行业报告):http://report.iresearch.cnTalkingdata报告(行业报告):http://mi.talkingdata.com199IT互联网数据中心(行业报告,内容多,支持搜索):http://www.199it.com 2)10大行业免费数据汇总【优点】直接拿来使用【缺点】数据有限,可能不是最新的数据。根据你确定的行业,选择一个自己感兴趣的数据集。比如你确定了电商行业,然后就找一个电商的数据集。10大行业公开数据集免费下载:电商零售行业10大行业公开数据集免费下载:金融行业10大行业公开数据集免费下载:游戏行业10大行业公开数据集免费下载:教育行业10大行业公开数据集免费下载:旅游行业10大行业公开数据集免费下载:文化娱乐行业(电影,音乐等)10大行业公开数据集免费下载:医疗行业10大行业公开数据集免费下载:汽车及出行10大行业公开数据集免费下载:房产行业10大行业公开数据集免费下载:自媒体等行业 方法三:谷歌数据搜索引擎谷歌推出了一个帮助数据分析、数据科学领域的人查找数据的搜索引擎Dataset Search (需要科学上网后打开,地址:https://toolbox.google.com/datasetsearch打开这个数据搜索引擎,如果我们想要搜索电商亚马逊的数据,搜出关键词「亚马逊」,就能看到亚马逊相关的数据,在搜索结果里有的数据是要收费的,有的数据是免费的。 【优点】可以直接获取想要的数据【缺点】国内打不开;需要自己慢慢去查找免费的数据,有的是英文数据 方法四:选择下面一个傻瓜式爬虫工具(不需要编程)在网站上爬取你感兴趣领域网站的数据1)工具: 后羿,同时有mac,windows版本网址:http://www.houyicaiji.com/打开官网后点击下图“教程”的地方有入门教程。点击“关于我们”有官网qq群,遇到问题可以在群里提问。 2)工具:集搜客,只有windows版本操作指南只需要看下面红框中的内容就可以,遇到问题在它的官网QQ群提问就可以解决。操作指南地址:https://www.gooseeker.com/tuto/tutorial.html 爬取多少数据?数据量少一般说明不了什么问题,起码的超过几万条数据。多尝试、思维逻辑要清晰,一定要知道自己做什么,爬取什么样的数据,提前规划好了,整个过程就不会走太多的弯路。 案例:https://zhuanlan.zhihu.com/p/39733403 【优点】可以获取到自己想要的领域数据【缺点】需要看官网教程来学习,学习过程中遇到问题咨询官网QQ群可以解决 欢迎留言补充更多行业数据。 上面提到3种获取数据的方法,选择一种适合你自己方法。获取数据后分析,可以使用这个里面的方法来研究:如何分析数据?
2021年10月