数据分析

简介: 什么是数据分析?数据分析的本质是什么?

什么是数据分析?

其实很多做数据分析的人,包括正在做数据分析平台的企业和公司,都很难对数据分析有清晰的认知,经过了十几年的发展,数据分析这个领域已经掺杂糅合了太多的知识学科,因此造成了很大的谬误。


其实数据分析相当简单,我尝试着自己进行了一次定义:数据分析,是针对某个问题,将获取后的数据用分析手段加以处理,并发现业务价值的过程。

image.png

这句定义中包含了“问题”“获取”“数据”“分析手段”“业务价值”五个关键词,分别代表了数据分析流程当中的五个层次——“业务需求层”“数据采集层”“数据层”“数据处理层”“输出层”

问题

数据分析的起点就是问题与目标


目就是眼睛,标就是靶子,也就是用眼睛盯着靶子瞄准,这就是目标思维。也就是说我们一定要知道数据分析的目的是什么,是为了做什么事情而分析,是要分析产品功能、还是想要原因诊断。有了目标我们才能搭弓射箭,而不是把时间浪费在应该用什么弓箭、应该摆什么姿势、应该什么时候射箭这样的问题上。

image.png


获取

当我们明确了分析的目标之后,下一步工作就是去找数据。


数据采集就是将原始数据从数据库中取出来,数据分析师在这一步更为重要的工作是搞清楚数据放在哪里+怎么把数据取出来这两件事。

image.png


数据


image.png

第一种是数据库数据,包括公司中各个业务系统的数据、系统日志数据、行业数据等。


第二种是数据场景,什么叫作场景呢?最常见的例子就是数据分析指标体系,比如零售行业当中的“人货场”体系,其中的人、货、场三个要素都能组成一种数据场景。


第三种是清洗后的数据,这一步是数据分析当中最耗费时间的工作,几乎能占到整个过程 60% 的工作量,主要包括脏数据清洗(空数据值、空指标等)、重复数据排除、无效数据剔除等,主要的清洗数据工具有 Excel、FineBI 等。


分析

数据分析,根据实际场景需要可以分为四种:描述分析、统计分析、挖掘分析、建模分析

image.png

举个最简单的例子,学校门口卖烤地瓜的摊主告诉你他今天卖了 100 个地瓜,让你评价一下他的收入怎么样。


拥有数据思维的人这个时候应该会问一句“昨天卖了多少”或者“平时都卖多少”,假如他说平时只卖 50 个,那么评价就是今天比昨天卖得多,这时很多人就不会继续深挖数据了。这就是我们平时经常会犯的错,对比一下数据差异,然后就给个结果出来,抛给领导或者业务人员看,他们自己都能看出来的事情还要数据分析师干吗?那么我们应该怎么做呢?


首先遵守对比原则,可以分为横纵向对比、同比环比,横向对比竞争对手、纵向对比自身的差异,比如说与昨天相比今天是否出摊比较早?是否换了出摊的位置?是否隔壁摊位今天没有来抢生意等。


其次是趋势分析,大体可以分为周期趋势、行业趋势、外部环境趋势等,比如周期可以取一个星期 / 一个月的数据,最近的销售额是否一直在增长?是否是地摊的行业整体向好了?外部环境是否允许更多人来买地瓜了,例如学校门口?


然后细分分析,我们可以将烤地瓜的指标进行细分,细分成为销售个数、单个成本、工作时长或效率等。比如是否是今天的地瓜质量提高了,成本也提高了?是否是工作时长提高了,营业时间提高了?


这时候你就会发现数据中隐藏的很多信息,比如烤地瓜比昨天卖得多,很可能是因为今天老板出摊早,也有可能进了一些好吃的地瓜(成本上升带来销量的提升),也有可能是某些原因造成今天学生流量大(可能是食堂的饭菜不好吃或者其他原因),甚至有可能是因为今天比昨天冷,路人都想买个热地瓜吃。


价值

为什么总是有人抱怨数据分析没有价值、不能落地?原因很简单,他们在做分析的时候并没有关注业务与企业的价值点,所以做出的结果没有意义。


业务方为什么会找我们做数据分析?其实就是为了实现业务价值,价值体现在两点:如何将企业的盈利时间拉长?如何提高单位时间的盈利率?

image.png

第一点,盈利时间拉长需要提高用户的持续黏性,让用户和客户不断为企业创造价值,简而言之就是不断优化用户体验,拉长盈利时长;


第二点,需提高企业创造价值的效率,提高单位时间内的盈利率,比如利用数据分析及时监测员工单位产值,从而通过提高人效和产效的方式提高价值效率。

目录
相关文章
|
Linux Docker 容器
阿里云安装Docker 步骤
阿里云安装Docker 步骤: step 1: 安装必要的一些系统工具 sudo yum install -y yum-utils device-mapper-persistent-data lvm2 Step 2: 添加软件源信息 sudo yum-config-manager --add-repo http://mirrors.
4816 0
|
3月前
|
存储 数据库
RAG分块技术全景图:5大策略解剖与千万级生产环境验证
本文深入解析RAG系统中的五大文本分块策略,包括固定尺寸、语义、递归、结构和LLM分块,探讨其工程实现与优化方案,帮助提升知识检索精度与LLM生成效果。
532 1
|
安全 API 开发者
如何遵守孔夫子旧书网的使用规则?
使用孔夫子旧书网需先注册并认证,获得API权限后,须遵守API调用协议,包括正确使用公共参数及业务参数。平台强调版权保护、用户隐私权及免责声明,同时要求用户遵守法律法规,确保信息安全合规。遇技术问题可寻求官方支持。
|
6月前
|
人工智能 运维 搜索推荐
CodeBuddy助力数学教学:数学老师直呼内行!
本文探讨AI在数学教学中的应用,解决传统教学中公式编辑耗时、互动题型开发难、学情分析不精准等问题。通过智能生成教学资源、设计互动题型、精准学情分析和个性化资源定制四大功能,大幅提升教学效率与质量。实际案例展示AI生成交互式函数图像课件和立体几何动态模型工具的效果。对比显示,AI辅助教学显著优于传统模式,助力教育数字化转型,推动精准化教学与教研资源共享。
323 0
|
8月前
|
机器学习/深度学习 人工智能 机器人
一周AI大事件
一周AI大事件
|
机器学习/深度学习 人工智能 自然语言处理
【LLM】能够运行在移动端的轻量级大语言模型Gemma实践
【4月更文挑战第12天】可以运行在移动端的开源大语言模型Gemma模型介绍
745 0
|
应用服务中间件 nginx Windows
如何优雅的安装nginx并启动--windows
如何优雅的安装nginx并启动--windows
262 0
|
弹性计算 数据库
阿里云服务器流量怎么计算的?公网内网出入流量都收费吗?
阿里云服务器内网流量免费,公网入方向流量免费,只有云服务器公网出方向产生的流量才收费
8088 0
阿里云服务器流量怎么计算的?公网内网出入流量都收费吗?
|
机器学习/深度学习 数据采集 人工智能
从零开始构建自己的AI:一个初学者的机器学习教程
通过这个简单的机器学习教程,我们初步了解了从数据收集、选择模型到训练和预测的基本流程。机器学习是一个广阔的领域,有很多知识和技能需要深入学习。希望本教程能为初学者提供一个入门的指引,引导大家探索更多有关机器学习的知识。感谢您阅读本文,如果您有任何问题或想法,请在评论区与我分享!让我们一起踏上机器学习的旅程,构建属于自己的AI。
4106 1
从零开始构建自己的AI:一个初学者的机器学习教程
|
前端开发 Android开发 开发者