数据分析流程这么长,产品经理如何一人搞定?-阿里云开发者社区

开发者社区> 知与谁同> 正文

数据分析流程这么长,产品经理如何一人搞定?

简介:
+关注继续查看

我2002年入行,那个时候还没有“产品经理”这个词,我的主要工作是为业务部门跑数据并且制作报表,就是传说中“跑数据”、“做报表”的那个苦逼数据仓库工程师。

2007年之前我一直在为制造型企业建数据仓库,直到去了美国的之后,才开始进入到互联网,服务过两家公司,Linkedin 4年和 eBay 3年多。天天和产品经理、数据分析师在一起,帮助他们准备需要的数据、分析产品和用户,最后把分析的结果做到产品里面去。走上了数据采集 - 处理 - 清洗 - 展现 - 分析 - 数据产品的道路。

一个互联网公司要做好 Growth,就要做好产品体验。想要做好产品体验,产品经理第一需要的就是数据分析支持,有了数据才能开始Growth Hacker…此处省去10000字关于 Growth Hacker。

1.产品经理关注的是用户体验

对于产品经理而言,他们关心的是什么呢?产品经理对网站或者是 APP 的 UI 、UX 是最熟悉的,因为他们参与了其中的设计:用户应该怎么交互,有哪些交互上面不方便的地方,每一级菜单用户交互的流程,交互上的死角和边界;然后是设计,UI 是不是够简洁,美观,吸引人?哪些链接需要加强用户关注度,哪些链接需要减低用户的关注度。总而言之,都是为了用户体验,好的用户体验才能带来用户活跃,提高增长。

比如网页端( APP 端同理):


在GrowingIO圈选以查看相关数据

2.分析师的报表为产品经理提供数据支持

一个合格的数据分析师要能够制作可视化的报表,能够用不同的图形表达分析的结果。比如下面的可视化报表:


GrowingIO一目了然的数据看板

分析师构建报表的数据从哪里来呢?在数据库。

数据库里面有成百上千种表,一个合格的数据分析师首要的是知道数据在哪里?存在哪些表里面:

“哪里有页面浏览的表,哪里有搜索的表,哪里有广告的展现,点击的表,哪里有手机用户事件的表,哪里有用户属性的表,这些表每个字段对应了哪些维度和指标,哪里有宏观的已经计算好的指标,哪里有微观的详细的用户事件,还有很多过滤条件等等。”

对于一个刚入职的分析师,即使是有专人带的情况下,也是需要一定的时间才能成长的,不然很可能提供了错误的数据,导致了错误的决策。

如下图是数据分析师们熟悉的数据库结构,可以帮助他们迅速的找到表的定义和字段的定义:

数据工程师设计并构建了上面的数据库模型,同时他们也要负责源源不断的把数据插入到这些数据库的表中,这些数据可以存在数据库里面,也可以存在 Hadoop 的数据集群中。

3.依赖专职数据工程师的繁琐流程

可是数据库里面存了所有我们能够支持数据分析师的数据吗? 当分析师在数据库里面找不到数据的时候,就需要数据工程师需要从各种地方重新调取(此处省略关于实时数据流,Hadoop 集群,ETL,数据聚合等等关于技术的10000字)。

总之如果要得到没有事先收集的用户行为事件数据,就要在前端的代码里面埋事件代码,也就是在用户事件产生的源头埋点,才能在服务端得到相应的日志数据。

在技术上 Linkedin 为互联网日志做出了贡献,开源了 Kafka。什么是 kafka?就是可以非常实时的接受客户端发过来的实时事件数据并生成日志数据,然后发送到后端服务器上。比如腾讯,今日头条,新浪等等互联网公司都用 Kafka 收集日志的。

日志是这个样子的:

以上的这些都是数据,不同的人看到的角度是不同的。如下图:

从工程的角度出发,数据处理的顺序是这样的:

  • 第一步:先埋点
  • 第二步:收集日志
  • 第三步:建立数据库
  • 第四步:分析数据
  • 第五步:得出产品经理要的分析结果

4.产品经理借助数据分析工具可独立完成

看起来这个链条很长,但是GrowingIO可以把它缩短,如何缩短?在一开始就从产品经理的角度来看这个问题。

从产品经理的角度出发,数据处理的顺序是这样的:

第一步:产品经理直接圈选,看数据结果。

在保存了用户事件之后,还可以自由的创造看板。如下图

产品经理和数据分析师可以在很短的时间能创建出看板,从事件的定义到产生分析结果,只要短短几秒钟,而且还追溯了过去7天的历史数据。

不仅仅如此,GrowingIO 还提供用户分群、用户细查、事件留存和数据下载等高级功能。

我们现在通过云端软件服务形式,制作了一个简单容易上手的系统,可以让初创公司快速地,低成本地获得只有大公司才玩得起的实时大数据分析系统。


本文作者:吴继业

来源:51CTO

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
Glide 简单流程分析
转载请标明地址 QuincySx: http://www.jianshu.com/p/cf8f8f90f621 这篇文章是这个系列的第一篇文章,我第一次写这样连续系列的文章,我先一层一层的剥开 Glide ,如果谁有更好的想法欢迎提出。
833 0
数据分析实战 基于EXCEL和SPSS系列工具的实践》一1.4 数据分析的流程
数据分析一般有数据采集、数据整理、制表、数据分析、数据呈现等多个阶段。当然,不是说每一个数据分析的过程都需要这些阶段,有的企业数据质量非常好,自然就不需要数据采集过程了;也有些数据分析并不怎么需要呈现过程。不过,为了方便读者理解,下面将介绍一个完整的流程。
1380 0
带你读《Python金融大数据挖掘与分析全流程详解》之一:Python基础
本书以功能强大且较易上手的Python语言为编程环境,全面讲解了金融数据的获取、处理、分析及结果呈现。全书共16章,内容涉及Python基础知识、网络数据爬虫技术、数据库存取、数据清洗、数据可视化、数据相关性分析、IP代理、浏览器模拟操控、邮件发送、定时任务、文件读写、云端部署、机器学习等,可以实现舆情监控、智能投顾、量化金融、大数据风控、金融反欺诈模型等多种金融应用。
2925 0
带你读《SAS数据分析开发之道 软件质量的维度》第三章通信交流3.2系统数字返回码(五)
带你读《SAS数据分析开发之道 软件质量的维度》第三章通信交流3.2系统数字返回码
14 0
带你读《SAS数据分析开发之道 软件质量的维度》第三章通信交流3.3系统字母数字返回码(一)
带你读《SAS数据分析开发之道 软件质量的维度》第三章通信交流3.3系统字母数字返回码
23 0
带你读《SAS数据分析开发之道 软件质量的维度》第三章通信交流3.3系统字母数字返回码(二)
带你读《SAS数据分析开发之道 软件质量的维度》第三章通信交流3.3系统字母数字返回码
20 0
Glide 资源加载流程分析
转载请标明地址 QuincySx: http://www.jianshu.com/p/eed7054e3722 这是 Glide 的第二篇,在上一篇中讲的都是大概流程,直接阅读起来可能比较困难,推荐结合源码浏览,在这一篇中就讲资源加载,所以贴上来的源码就会多一些。
837 0
带你读《SAS数据分析开发之道 软件质量的维度》第三章通信交流3.4用户生成的返回码(一)
带你读《SAS数据分析开发之道 软件质量的维度》第三章通信交流3.4用户生成的返回码
24 0
+关注
10077
文章
2994
问答
文章排行榜
最热
最新
相关电子书
更多
《2021云上架构与运维峰会演讲合集》
立即下载
《零基础CSS入门教程》
立即下载
《零基础HTML入门教程》
立即下载