开发者社区> 华章计算机> 正文

《数据挖掘:实用案例分析》——第1章 初识数据挖掘 1.1 什么是数据挖掘

简介: 本节书摘来自华章计算机《数据挖掘:实用案例分析》一书中的第1章,第1.1节,作者 张良均 陈俊德 刘名军 陈荣,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
+关注继续查看

第1章 初识数据挖掘

随着计算机技术、网络技术、通信技术和Internet技术的发展,以及各行各业业务操作流程的自动化,企业内积累了大量业务数据,这些数据动辄以TB计算。这些数据和由此产生的信息是企业的财富,它如实地记录着企业运作的状况。面对大量的数据,迫使人们不断寻找新的工具,来对企业的运营规律进行探索,为商业决策提供有价值的信息,使企业获得利润。能满足企业这一迫切需求的有力工具就是数据挖掘。对于企业而言,数据挖掘有助于发现业务的趋势,揭示已知的事实,预测未知的结果。从这个意义上讲,知识是力量,数据挖掘是财富。

1.1 什么是数据挖掘

数据挖掘(Data Mining,DM):就是从大量数据(包括文本)中挖掘出隐含的、未知的、对决策有潜在价值的关系、模式和趋势,并用这些知识和规则建立用于决策支持的模型,提供预测性决策支持的方法、工具和过程;是利用各种分析工具在海量数据中发现模型和数据之间关系的过程。这些模型和关系可以被企业用来分析风险、进行预测。

数据挖掘的目的就是从数据中“淘金”,就是从数据中获取智能的过程。

Gartner Group提出:“数据挖掘是通过仔细分析大量数据来揭示有意义的新的关系、模式和趋势的过程。它使用模式认知技术、统计技术和数学技术。”

The META Group的Aaron Zornes表示:“数据挖掘是一个从大型数据库中提取以前不知道的可操作性信息的知识挖掘过程。”

总之,由于企业内产生了大量的业务数据,这些数据和由此产生的信息是企业的财富,它如实记录了企业运作的状况。通过数据挖掘分析,能帮助企业发现业务的趋势,揭示已知的事实,预测未知的结果。数据挖掘已成为企业保持竞争力的必要方法。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
图解大数据 | 使用Spark分析挖掘音乐专辑数据@综合案例
文娱影音是目前大数据与AI应用最广泛的场景之一,本案例以音乐专辑发行数据为背景,讲解使用pyspark对HDFS存储的数据进行处理数据分析的过程,并且对分析结果做了可视化呈现。
1236 0
什么是数据湖分析?
数据湖分析(Data Lake Analytics,DLA)是无服务器(Serverless)化的云上交互式查询分析服务。无需ETL,就可通过DLA在云上通过标准JDBC直接对阿里云OSS,TableStore,RDS,MongoDB等不同数据源中存储的数据进行查询和分析。
732 0
图解大数据 | 使用Spark分析挖掘零售交易数据@综合案例
电商与新零售是目前大数据与AI应用最广泛的场景之一,本案例以跨国在线零售业务为背景,讲解使用pyspark对HDFS存储的数据进行交易数据分析的过程,并且对分析结果使用echarts做了可视化呈现。
1234 0
OLAP on TableStore:基于Data Lake Analytics的Serverless SQL大数据分析
TableStore(简称OTS)是阿里云的一款分布式表格系统,为用户提供schema-free的分布式表格服务。随着越来越多用户对OLAP有强烈的需求,我们提供在表格存储上接入Data Lake Analytics(简称DLA)服务的方式,提供一种快速的OLAP解决方案。
6713 0
图解大数据 | 使用Spark分析新冠肺炎疫情数据@综合案例
2020以来新冠疫情改变了全世界,影响着大家的生活,本案例结合大数据分析技术,使用pyspark对2020年美国新冠肺炎疫情进行数据分析,并结合可视化方法进行结果呈现。
1397 0
【理论+案例实战】Python数据分析之逻辑回归(logistic regression)
逻辑回归是分类当中极为常用的手段,它属于概率型非线性回归,分为二分类和多分类的回归模型。对于二分类的logistic回归,因变量y只有“是”和“否”两个取值,记为1和0。假设在自变量x1,x2,……,xp,作用下,y取“是”的概率是p,则取“否”的概率是1-p。
11644 0
什么是物联网数据分析?
物联网数据分析LA(Link Analytics)是阿里云为物联网开发者提供的设备智能分析服务,全链路覆盖了设备数据采集、管理(存储)、清洗、分析等环节,有效降低了数据分析门槛,实现了设备数据与业务数据的融合分析透视。
810 0
【阿里在线技术峰会】罗龙九:云数据库十大经典案例分析
在阿里巴巴在线峰会上的第二天,来自阿里云资深DBA专家罗龙九给大家带来了题为《云数据库十大经典案例分析》的分享。罗龙九以MySQL数据库为例,分析了自RDS成立至今,用户在使用RDS过程中最常见的问题,包括:索引、SQL优化、锁、延迟、参数优化、连接数、CPU、Iops、磁盘、内存等。
11053 0
一些有用的javascript实例分析(三)
原文:一些有用的javascript实例分析(三) 1 10 输入两个数字,比较大小 2 window.onload = function () 3 { 4 var aInput = document.
664 0
《数据挖掘:实用案例分析》——1.5 本章小结
本节书摘来自华章计算机《数据挖掘:实用案例分析》一书中的第1章,第1.5节,作者 张良均 陈俊德 刘名军 陈荣,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
924 0
10059
文章
0
问答
来源圈子
更多
+ 订阅
文章排行榜
最热
最新
相关电子书
更多
JS零基础入门教程(上册)
立即下载
性能优化方法论
立即下载
手把手学习日志服务SLS,云启实验室实战指南
立即下载