《数据挖掘:实用案例分析》——1.4 数据挖掘现状及应用前景

简介: 本节书摘来自华章计算机《数据挖掘:实用案例分析》一书中的第1章,第1.4节,作者 张良均 陈俊德 刘名军 陈荣,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

1.4 数据挖掘现状及应用前景

  “数据海量,信息缺乏”是大多数金融企业所面对的尴尬。目前,金融业实施的大多数数据库只能实现数据的录入、查询、统计等较低层次的功能,却无法发现数据中存在的各种有用信息,例如对这些数据进行分析,发现其数据模式及特征,然后可能发现某个客户、消费群体或组织的金融和商业需求,并观察金融市场的变化趋势。

  作为一门应用技术,数据挖掘可谓涵盖广泛,尤其在发达国家,数据挖掘技术的触角已经伸向了各行各业。只要企业拥有具分析价值的数据源,皆可利用数据挖掘工具进行有目的的挖掘分析。一般较常见的应用案例多发生在零售业、制造业、财务金融保险、通信业以及医疗服务等。数据挖掘的应用领域具体可以分为以下三类:

image

  可以说,未来若干年,数据挖掘将会成为极为重要的成长领域,数据挖掘的应用也会越来越广泛。研究结果显示,企业所处理的数据每五年就会呈现倍数增长。

  大部分的企业并没有数据不足的问题,而过度的数据重复与不一致才是大问题,这使得企业无论在使用、有效管理、以及将这些数据用于决策过程方面都遭遇到了问题。因此市场需要的是能够将数据转变成可靠与可用信息的系统。

  不同领域的专家对数据挖掘都表现出了极大的兴趣,例如在信息服务业中出现了一些应用,在Internet数据仓储和线上服务中也给企业增加了许多生机。同时在产学合作下,又发展出了许多实用的系统,例如MDT、Coverstory and Spotlight、NichWork Visualization System、LBS、FALCON、FAIS、NYNEX、TASA等。目前已被许多研究者视为结合数据库系统和机器学习技术的重要领域。对于研究者来说,数据挖掘是个充满潜力和机遇无限的研究领域。

  由于数据挖掘能分析出数据中的有用信息,给企业带来显著的经济效益,这使得数据挖掘技术越来越普及。IDC预测,2015年中国大数据市场规模或达169亿美元,数据挖掘市场规模大约为140亿美元,并对欧洲和北美62家采用了数据挖掘技术的企业进行调查分析,发现这些企业的3年平均投资回报率为401%,其中25%的企业的投资回报率超过600%。

  美国Palo Alto管理集团公司对欧洲、北美和日本375家大中型企业的数据挖掘技术的采用情况进行了调查。结果显示,在金融领域,数据挖掘技术的应用水平已经达到或接近70%,在营销领域也达到50%,并且在未来的数年中,各个应用领域对该技术的采纳水平都将提高约50%。

  近年来,甲骨文、IBM、微软和SAP耗费超过150亿美元收购专门从事数据挖掘的软件公司。这个产业预计有1000亿美元市场容量,并以每年10%的速度增长,是软件产业整体增速的两倍。英国电信要发布一种新的产品,通过直邮的方式向客户推荐这种产品,使用数据挖掘技术可以使直邮的回应率提高100%;GUS日用品零售商店需要准确预测未来的商品销售量,降低库存成本,使用数据挖掘技术使库存成本比原来减少了3.8%;汇丰银行需要对不断增长的客户群进行分类,针对每种产品找出最有价值的客户,使用数据挖掘技术营销费用减少了30%;美国国防财务部每年有上百万笔的军火交易,使用数据挖掘技术能够发现可能存在的欺诈交易,然后进行深入调查,这样节约了大量的调查成本。

相关文章
|
数据采集 存储 NoSQL
建筑业数据挖掘:Scala爬虫在大数据分析中的作用
建筑业数据挖掘:Scala爬虫在大数据分析中的作用
|
自然语言处理 算法 数据挖掘
【数据挖掘】十大算法之PageRank连接分析算法
文章介绍了PageRank算法的基本概念和数学模型,包括如何通过一阶马尔科夫链定义随机游走模型以及如何计算网页的重要性评分,并提供了PageRank迭代算法的具体步骤。
359 0
|
自然语言处理 数据可视化 安全
【第十届“泰迪杯”数据挖掘挑战赛】C题:疫情背景下的周边游需求图谱分析 问题一方案及Python实现
第十届“泰迪杯”数据挖掘挑战赛C题的解决方案,涉及疫情背景下周边游需求图谱分析,包括微信公众号文章分类、周边游产品热度分析、本地旅游图谱构建与分析,以及疫情前后旅游产品需求变化分析的Python实现方法。
281 1
【第十届“泰迪杯”数据挖掘挑战赛】C题:疫情背景下的周边游需求图谱分析 问题一方案及Python实现
|
11月前
|
搜索推荐 数据挖掘 UED
分享一些利用商品详情数据挖掘潜在需求的成功案例
本文介绍了四个成功利用商品详情数据挖掘潜在需求的案例:亚马逊通过个性化推荐系统提升销售额;小米通过精准挖掘用户需求优化智能硬件生态链;星巴克推出定制化饮品服务满足用户多样化口味;美妆品牌利用数据改进产品配方和设计,制定针对性营销策略。这些案例展示了数据挖掘在提升用户体验和商业价值方面的巨大潜力。
|
数据采集 自然语言处理 数据可视化
基于Python的社交媒体评论数据挖掘,使用LDA主题分析、文本聚类算法、情感分析实现
本文介绍了基于Python的社交媒体评论数据挖掘方法,使用LDA主题分析、文本聚类算法和情感分析技术,对数据进行深入分析和可视化,以揭示文本数据中的潜在主题、模式和情感倾向。
1538 0
|
数据挖掘 调度 Python
【第十届“泰迪杯”数据挖掘挑战赛】B题:电力系统负荷预测分析 Baseline
第十届“泰迪杯”数据挖掘挑战赛B题的基线解决方案,涉及电力系统负荷预测分析,包括数据读取、特征处理、模型训练和评估,以及使用了LightGBM进行回归预测。
336 3
|
机器学习/深度学习 安全 算法
【2023年第十一届泰迪杯数据挖掘挑战赛】A题:新冠疫情防控数据的分析 32页和40页论文及实现代码
本文总结了2023年第十一届泰迪杯数据挖掘挑战赛A题的新冠疫情防控数据分析,提供了32页和40页的论文以及实现代码,涉及密接者追踪、疫苗接种影响分析、重点场所管控以及疫情趋势研判等多个方面,运用了机器学习算法和SEIR传染病模型等方法。
260 0
【2023年第十一届泰迪杯数据挖掘挑战赛】A题:新冠疫情防控数据的分析 32页和40页论文及实现代码
|
机器学习/深度学习 安全 算法
【2023年第十一届泰迪杯数据挖掘挑战赛】A题:新冠疫情防控数据的分析 建模方案及python代码详解
本文介绍了2023年第十一届泰迪杯数据挖掘挑战赛A题的解题思路和Python代码实现,涵盖了新冠疫情防控数据的分析、建模方案以及数据治理的具体工作。
251 0
【2023年第十一届泰迪杯数据挖掘挑战赛】A题:新冠疫情防控数据的分析 建模方案及python代码详解
|
存储 数据可视化 数据挖掘
【第十届“泰迪杯”数据挖掘挑战赛】C题:疫情背景下的周边游需求图谱分析 问题三方案及Python实现
第十届“泰迪杯”数据挖掘挑战赛C题的解决方案,专注于问题三“本地旅游图谱构建与分析”,介绍了基于OTA和UGC数据的旅游产品关联分析方法,使用支持度、置信度、提升度来计算关联度得分,并进行了结果可视化,同时指出了方案的改进方向。
196 1
|
存储 自然语言处理 算法
【第十届“泰迪杯”数据挖掘挑战赛】C题:疫情背景下的周边游需求图谱分析 问题二方案及Python实现
第十届“泰迪杯”数据挖掘挑战赛C题的解决方案,专注于疫情背景下的周边游需求图谱分析,具体针对问题二“周边游产品热度分析”,介绍了从OTA和UGC数据中提取旅游产品、计算产品热度得分、判断产品类型的方法,并给出了Python实现步骤和代码。
195 1

热门文章

最新文章