如何更好的使用大数据?

简介:

大数据(Big data)通常用来形容一个公司创造的大量非结构化和半结构化数据。大数据在互联网行业指的是这样一种现象:互联网公司在日常运营中生成、累积的用户网络行为数据。

大数据的特征:数据量大(Volume);类型繁多(Variety);价值密度低(Value);速度快时效高(Velocity)。

大家看过的例子:啤酒与尿布。沃尔玛的员工发现啤酒和尿布经常放在一个购物篮里面,调查发现爸爸经常在买尿布的时候顺带买啤酒,所以沃尔玛把啤酒和尿布放在同一区域。这个例子表明:两种商品之间是有相互联系的,利用关系可以提高产品销量从而增加收益。

比较贴身的例子是一次不小心在百度输入一个名字,然后发现京东的一系列购物订单。购物车,能够体现一个人的很多方面。so,大数据,如此之利害。(PS:这应该算是京东的某次数据泄露吧,后面就没有搜索到了)

那么,如何更好的使用大数据?

数据通常可以被分为两组:

第一组是交易数据。事务的数据是收集周围的事件,如网上购物,用户行程和物流。

第二组是互动的数据。互动数据是收集周围人之间的相互作用。想想社交媒体配置文件,视频和照片。社交媒体上面的例子是一个完美的例子互动数据。

案例研究表明,大数据可以用来增加市场份额,提高营业利润率,增加资本投资回报。它可以被用来改善产品或服务,以及公司可以分析一个产品如何被使用,谁使用它,他们认为他们会改变什么。同时,大数据可以用来了解你,你喜欢什么,不喜欢,你去过的地方更多:所有这一切都可以被用于目标广告和推销产品。

大数据让Amazon一直处于高收益(而国内京东、当当电商其实都是在亏损状态)

Amazon做了什么呢?

1 长尾理论的应用: 畅销书能够带来大收益,但是只有极少数的书能够成为畅销,大部分长尾被商家所舍弃,但是用户对这部分长尾的需求却没有减少。由于长尾书的印数及销量少,而出版、印刷、销售及库存成本又较高,因此,长期以来出版商和书店的经营模式多以畅销书为中心。网络书店和数字出版社的发展为长尾书销售提供了无限的空间市场。在这个市场里,长尾书的库存和销售成本几乎为零,于是,长尾图书开始有价值了。销售成千上万的小众图书,哪怕一次仅卖一两本,其利润累计起来可以相当甚至超过那些动辄销售几百万册的畅销书。

(所谓长尾理论是指,只要产品的存储和流通的渠道足够大,需求不旺或销量不佳的产品所共同占据的市场份额可以和那些少数热销产品所占据的市场份额相匹敌甚至更大,即众多小市场汇聚成可产生与主流相匹敌的市场能量。)

2 将收益投资在高新技术产品:Amazon的仓库机器人。机器人仓库的投入,使得Amazon的成本下降20%-40%,改进优化了整体业务运营流程。

3 Amazon总能够引领潮流,比如kindle的横空出世,至少在国内的市场还是很好的。产品也是很颠覆性。

亚马逊“用户导向”的发展战略,使得它利于高收益的状态:低价格能够提升销量从而吸引客户和商家,而高销量反过来又促进了价格的下跌。只要公司将客户的利益放在首位,那么这一良性循环就能够为公司带来增长。


本文作者:kisstherain

来源:51CTO

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
JavaScript
原生js实现复选框(全选/全不选/反选)效果【含完整代码】
原生js实现复选框(全选/全不选/反选)效果【含完整代码】
451 1
|
jenkins Devops 持续交付
【devops】七、集成Sonar Qube(下)
【devops】七、集成Sonar Qube(下)
343 0
|
11月前
|
存储 数据挖掘 计算机视觉
Pandas数据应用:图像处理
Pandas 是一个强大的 Python 数据分析库,主要用于处理结构化数据。尽管它不是专门为图像处理设计的,但可以利用其功能辅助图像处理任务。本文介绍如何使用 Pandas 进行图像处理,包括图像读取、显示、基本操作及常见问题解决方法。通过代码案例解释如何将图像转换为 DataFrame 格式,并探讨数据类型不匹配、内存溢出和颜色通道混淆等问题的解决方案。总结中指出,虽然 Pandas 可作为辅助工具,但在实际项目中建议结合专门的图像处理库如 OpenCV 等使用。
317 18
|
敏捷开发 Java 持续交付
阿里云云效产品使用合集之maven仓库是否可以代替自建的Nexus
云效作为一款全面覆盖研发全生命周期管理的云端效能平台,致力于帮助企业实现高效协同、敏捷研发和持续交付。本合集收集整理了用户在使用云效过程中遇到的常见问题,问题涉及项目创建与管理、需求规划与迭代、代码托管与版本控制、自动化测试、持续集成与发布等方面。
|
9月前
|
搜索推荐
课时10:sublime的基本设置
今天,我们来聊聊如何对SublimeText进行简单的个性化配置。在使用SublimeText的过程中,很多人都会遇到一些问题,比如Sublime自带的字体不太好看,或者字体大小不符合个人需求,不是偏大就是偏小。接下来,我们就详细看看如何调整这些设置。 1.字体大小与样式调整 2.主题安装与配置
1134 1
|
10月前
|
机器学习/深度学习 人工智能 监控
AI视频监控在大型商场的智能技术方案
该方案通过目标检测与姿态识别技术(如YOLO、OpenPose),实时监控顾客行为,识别异常动作如夹带物品、藏匿商品等,并结合AI模型分析行为模式,防止偷窃。出口处设置结算验证系统,比对结算记录与视频信息,确保商品全部支付。多角度摄像头和数据交叉验证减少误报,注重隐私保护,提升安保效率,降低损失率,增强顾客信任。
696 15
|
机器学习/深度学习 测试技术
大模型开发:描述交叉验证以及为什么在模型评估中使用它。
交叉验证是评估机器学习模型性能的方法,通过将数据集分成训练集和多份子集(折叠)进行多次训练验证。每次选择一份子集作为验证集,其余作训练,最后平均评估结果。这样能减少过拟合,提供可靠性能估计,用于参数调优,并减少小数据集或噪声带来的随机性影响。它是模型评估的关键技术,确保更准确的性能估计。
562 1
Byte 高位/低位简介绍(大端格式/小端格式)
Byte 高位/低位简介绍(大端格式/小端格式)
2009 1
|
数据采集 机器学习/深度学习 数据可视化
最大值归一化介绍
【10月更文挑战第2天】
966 0
|
监控 前端开发 机器人
RPA机器人
【8月更文挑战第4天】RPA机器人
1009 3