13招神技 让你在数据科学和数据分析工作中脱颖而出

简介:

然而,可悲的是,只有不到30%的数据科学项目最终实施了。我备受打击的意识到我的努力被浪费了。但是,我不是唯一的一个。几乎,每一个分析家都有同样失望的感觉。

即使在今天,数据科学行业面临的真正挑战是企业和分析人员之间缺乏协调。令我惊讶的是,我甚至注意到,这些人更喜欢坐在同一个办公室里坐在一起。

如果这两种技能的专业人士很普遍,我们就可以看到一个实施可能性更高的项目。在过去的四年里,我花了很多时间思考使一个项目成功的最佳实践。

我发现,如果有个对症的人坐在你的办公室,他能明确定义业务问题,并且诱导你突破思维定式,你将突破管窥限制。

因此,你在数据科学/分析工作中正在取得成功时,我建议你遵循下面提到的提示。这些都是尝试和测试的总结。为了获得最大的利益,我建议你遵守。我从他们身上已经受益。现在轮到你了!

36大数据

以下是优先顺序

在你开始解决问题之前请先掌握业务

我知道你是一个数据分析师,所有你关心的都是数字。但是,一个令人敬畏的业务分析师和一般数据分析师有哪些不同呢?那就是他们对业务理解的潜质。你应该在开始你的第一个项目之前试着去了解企业。下面是一些你应该需要探索的东西:

  • 客户信息:活动客户总数,月客户流失,业务上的业务组合定义。
  • 经营策略:我们如何获得新客户,渠道有哪些?我们如何留住有价值的客户?
  • 产品信息:你的客户如何被你的产品吸引?你如何通过你的产品赚钱?你的产品是直接盈利者还是媒介工具?

大数据

如果你能回答这些问题,你对开始你的第一个项目已入门。

想想你是正在解决一个潜在问题,还是只是一个结果

我观察到,分析师瞄准的甚至不是问题的主要目标。例如,让我们想象一下,我们发现,一个客户在拨打客户服务电话,谈话更多的是他在放弃服务。

现在,如果我们开始解决降低客户服务的呼叫数量的方法,我们可能不会降低流失率。相反,在你没有过失的情况下,我已经看到你客户较高的不满。这可能是一个简单的致命伤,你会拒绝进入这种简单的陷阱。但是,现实生活中的问题几乎难以发现。我想说,解决一个明确的问题要比找到解决问题的正确方法要容易的多。

花费更多的时间在找到正确的评估指标和完成工作需要的必备条件

这个可能是对分析师来说是非常容易解决的一个难题,但也是最容易导致失败的一个陷阱。让我用几个简单例子来做解释。

假设,你将要建一个营销活动的目标模型,你将选择哪个指标来评估你的模型:

  • KS正态分布统计
  • 等分提升指数
  • AUC-ROC曲线
  • Log-Likelihood 对数似然数

在这种模型中,我常会选择KS正态分布曲线。等分提升指数只能给你在某个特定等分的评估,因此,它可能不会帮助我们找到巨大的目标人群和突破点。AUC-ROC曲线可以对整体人群评估,不适合在这个模型中。对数似然数可能是最大的最不适合这个模型,因为所有的事情是顺序排名而不是实际概率。

大数据

使用发散-收敛的思维过程,以避免过早收敛

我已经看到这在许多行业是最大的问题。当今的商界领袖在他们所做的一切中寻求创新。

要真正的创新,您可以遵从发散-收敛的系统方法。在某种程度上,你需要对将要到来的进行发散思维,通过这种方法你得到更多的经验。我们的意思是想所有的可能方式,在可行性、时间发展、传统方式等各个方面破解难题。但是,你确信你已经发散到足够大了,你需要立即应用所有的约束条件来缩小方法。

大数据

打破行业壁垒想到替代解决方案

分析正在使用在每一个可能的行业中。但是,为什么我们不能超越传统的方法,在其他行业寻找解决方案?

例如,一个应用于电子商务行业的推荐视频解决方案可以像Analytics Vidhya公司在博客门户使用一样好。唯一的方法就是与其他行业的人进行互动,通过分析来学习他们奋斗的成果。

与业务伙伴共同前行

从你的分析事业的第一天起,你应该与业务伙伴进行互动。我常常会看到一件一般会出错的事,分析师和业务伙伴就解决方案交流很不频繁,业务合作伙伴想远离技术细节从业务角度进行分析,这确实对项目不利。在模型实施和模型建模中保持持续的互动是非常重要的。

思考最简单的让你的想法落地的方案

我知道你是一个数据分析师,喜欢用复杂的想法让业务人士迷惑。和业务人士使用如此复杂的讨论可以帮助你快速结束眼前的谈话,但会降低成功实施的可能性

以下是你需要做的:一旦你输出一个指标,尽量找出一个简单的方式,可以让企业更容易理解。让我给你这个方法的一个例子。我们试图找出那些一旦有机会,就可以做的非常好的代理商,我们想出不同层次的人群和他们预期的表现。然而,我们不得不选择一个可以区分人群组合的方式。我们所做的很简单:我们实施了差别收费策略,以改变申请人的组合和我们群体的组合。

当做一个业务组件的时候,确保你把它放到它们的语言场景中

目标指标永远不是你分析的最终产品。它只是一个业务组件!因此,你需要在使你的想法更清晰和更有效而投入大量的精力。尝试学习能与你的听众更好连接在一起的术语,思考你的商业伙伴想寻找什么,假象你是他们的鞋子。

给企业领导做讲演的时候学会使用业务语言

我最近开始为我的一个项目学习中文。整个项目都非常简单,但我发现,即使有一个强大的模型,在销售它的时候我犯了个错误。原因是我对他们内部讨论的理解一篇空白。使用你的听众的语言是非常重要的。我看到非常简单的模型被赞赏和最聪明的模型被拒绝。唯一的区别是分析师在介绍他们的模型时使用的业务语言。

积极跟进落实计划

最后来的但不是最不重要的,一旦每个人都相信你的模型的有效性,会发生什么。你的工作还没有完成。建立每月项目跟进计划,了解项目如何实施,是否在正常的进行。

积极参与数据类的比赛

随着时间的发展,你会意识到一件事情:分析行业的变化非常快。然而,如果你是喜欢待在自己舒适区的一个人,你很快就会发现你的技能都过时了。我发现一个非常有用的方法就是参与数据类的科学竞赛,并与同行竞争/学习。 Kaggle 和Analytics Vidhya就是一些非常好的比赛。


本文作者:佚名

来源:51CTO

相关文章
|
6月前
|
数据可视化 架构师 数据挖掘
数据分析案例-数据科学相关岗位薪资可视化分析
数据分析案例-数据科学相关岗位薪资可视化分析
143 0
|
6月前
|
数据采集 机器学习/深度学习 数据可视化
数据科学项目实战:完整的Python数据分析流程案例解析
【4月更文挑战第12天】本文以Python为例,展示了数据分析的完整流程:从CSV文件加载数据,执行预处理(处理缺失值和异常值),进行数据探索(可视化和统计分析),选择并训练线性回归模型,评估模型性能,以及结果解释与可视化。每个步骤都包含相关代码示例,强调了数据科学项目中理论与实践的结合。
596 2
|
1月前
|
机器学习/深度学习 数据采集 数据可视化
Python 数据分析:从零开始构建你的数据科学项目
【10月更文挑战第9天】Python 数据分析:从零开始构建你的数据科学项目
53 2
|
4月前
|
数据采集 机器学习/深度学习 数据可视化
了解数据科学面试中的Python数据分析重点,包括Pandas(DataFrame)、NumPy(ndarray)和Matplotlib(图表绘制)。
【7月更文挑战第5天】了解数据科学面试中的Python数据分析重点,包括Pandas(DataFrame)、NumPy(ndarray)和Matplotlib(图表绘制)。数据预处理涉及缺失值(dropna(), fillna())和异常值处理。使用describe()进行统计分析,通过Matplotlib和Seaborn绘图。回归和分类分析用到Scikit-learn,如LinearRegression和RandomForestClassifier。
98 3
|
4月前
|
数据采集 机器学习/深度学习 数据可视化
完整的Python数据分析流程案例解析-数据科学项目实战
【7月更文挑战第5天】这是一个Python数据分析项目的概览,涵盖了从CSV数据加载到模型评估的步骤:获取数据、预处理(处理缺失值和异常值、转换数据)、数据探索(可视化和统计分析)、模型选择(线性回归)、训练与评估、优化,以及结果的可视化和解释。此流程展示了理论与实践的结合在解决实际问题中的应用。
107 1
|
6月前
|
数据采集 机器学习/深度学习 数据可视化
数据科学面试准备:解决Python数据分析常见问答和挑战
【4月更文挑战第12天】本文介绍了Python数据分析面试中常见的问题和挑战,涉及Pandas、NumPy、Matplotlib等库的基础知识,以及数据预处理、探索性分析、可视化、回归分析和分类分析的方法。例如,使用Pandas处理缺失值和异常值,利用Matplotlib和Seaborn进行数据可视化,通过Scikit-learn进行回归和分类模型的构建。
201 2
|
数据采集 数据可视化 安全
台风灾害数据分析与可视化:利用Java和数据科学技术解读台风趋势
台风灾害数据分析与可视化:利用Java和数据科学技术解读台风趋势
|
机器学习/深度学习 数据采集 人工智能
数据科学实训案例研发:农业遥感图像数据分析上线阿里云
这是2020年阿里云计算有限公司-教育部产学合作协同育人项目的成果。 实训课程内容涵盖了主要内容涵盖了图像分割的基础知识,主要包括图像分割的概论、基础、分类、神经网络实现等经典的机器学习理论知识,也包括卷积神经网络、残差网络、U-Net算法、多模态等深度学习内容。此外,还介绍天池AI等平台的应用,在此基础上通过实验的方式,详细地介绍机器视觉在农业大数据分析领域的过程,以及遥感图像处理相关技术的原理与实践。结合阿里云的产品和技术资源,进行应用实验,让学生在充分理解掌握基础知识的同时,也能接触到业界最前沿的发展方向和成果。本课程通过实验大作业的方式,实现典型的机器视觉应用,训练学生模型设计与应用。
602 0
|
机器学习/深度学习 数据采集 存储
ML之DataScience:基于机器学习处理数据科学(DataScience)任务(数据分析、特征工程、科学预测等)的简介、流程、案例应用执行详细攻略
ML之DataScience:基于机器学习处理数据科学(DataScience)任务(数据分析、特征工程、科学预测等)的简介、流程、案例应用执行详细攻略
ML之DataScience:基于机器学习处理数据科学(DataScience)任务(数据分析、特征工程、科学预测等)的简介、流程、案例应用执行详细攻略
|
JSON JavaScript 前端开发
数据科学的原理与技巧 五、探索性数据分析
五、探索性数据分析 原文:DS-100/textbook/notebooks/ch05 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译 探索性数据分析是一种态度,一种灵活的状态,一种寻找那些我们认为不存在和存在的东西的心愿。
1082 0