开发者社区> 华章计算机> 正文
阿里云
为了无法计算的价值
打开APP
阿里云APP内打开

《python 与数据挖掘 》一第1章 数据挖掘概述 1.1 数据挖掘简介

简介:
+关注继续查看

本节书摘来自华章出版社《python 与数据挖掘 》一书中的第1章,第1.1节,作者张良均 杨海宏 何子健 杨 征,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

第1章

数据挖掘概述

广义的数据挖掘是指针对收集的大规模数据,应用整套科学工具和挖掘技术(如数据、计算、可视化、分析、统计、实验、问题定义、建模与验证等),从数据之中发现隐含的、对决策有参考意义的信息、价值和趋势。因此,数据挖掘是一个横跨多学科的计算机科学分支。强调它隶属计算机科学范畴,是希望读者认识到这个领域的核心需求,尽早摆脱对编程实现的恐惧,避免陷入“数据挖掘只需将模型或算法套用于数据集之上”的误区。这也是本书的写作目的之一。

1.1 数据挖掘简介

随着计算机技术的全面发展,企业生产、收集、存储和处理数据的能力大大提高,数据量与日俱增。数据的积累实质上是企业的经验和业务的沉淀。越来越多的企业引入“数据思维”——不只是依赖于数据的统计分析,更强调对数据进行挖掘,期待从这一“未来世界的石油”中发现潜在的价值。这一迫切的“开采”需求在世界范围内酝酿了一次“大数据”变革。
数据挖掘的确是21世纪最具话题性的技术之一,包含数据预处理、算法应用、模型评价、结果检验等多个部分,并依靠其丰富的内涵向外延伸出数据分析、数据ETL、机器学习等多个领域。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
Python:设计模式之设计模式简介
Python:设计模式之设计模式简介
0 0
000 - Python 简介
000 - Python 简介
0 0
python接口自动化(二十一)--unittest简介(详解)
前边的随笔主要介绍的requests模块的有关知识个内容,接下来看一下python的单元测试框架unittest。熟悉 或者了解java 的小伙伴应该都清楚常见的单元测试框架 Junit 和 TestNG,这个招聘的需求上也是经常见到的。
0 0
Python模块化简介
Python模块化简介自制脑图 介绍了模块化定义和模块化优点。 模块化: 模块化指将一个完整的程序分解为一个一个小的模块。通过将模块组合,来搭建出一个完整的程序。 简单理解: 不采用模块化就是统一将所有代码编写到一个文件里 采用模块化就是将程序分别编写到多个文件中。
0 0
Python继承简介
Python继承简介自制脑图 继承的定义:有一个类,能够实现需要的大部分功能,但是不能实现全部功能 继承能让这个类来实现全部的功能。
0 0
Python封装简介
Python封装简介自制脑图, 封装是面向对象的三大特性之一,如何隐藏一个对象中的属性,如何获取(修改)对象中的属性。 简单说就是一些内部自己用的属性或方法不希望被外部所访问的,这时候就要封装起来。所以,封装就是隐藏不希望被外部所访问到的属性或方法。 使用封装,确实增加了类的定义的复杂程度,但也确保了数据的安全性。
0 0
Python类的简介
Python类的简介自制脑图 目前所学习的对象都是 Python 内置的对象。 但是内置对象并不能满足所有的需求,所以在开发中经常需要自定义一些对象类,简单理解它就相当于一个图纸。 在程序中需要根据类来创建对象。 类就是对象的图纸 也称对象是类的实例( instance) 如果多个对象是通过一个类创建的 。称这些对象是一类对象。像int() float() bool() str() list() dict() ....这些都是类。 自定义的类都需要使用大写字母开头,使用大驼峰命名法(帕嘶卡命名法)来对类命名。
0 0
「Python」爬虫-1.入门知识简介
> 本文主要介绍了爬虫相关的入门知识。 > 本文目录 > > - 爬取小猫的图片 > - 写入文件相关 > - 正则表达式简介 > - bs4解析
0 0
Python字典简介
Python字典简介自制脑图 字典的英文名字简写叫 dict,字典并不是一种序列,它属于一种新的数据结构,称为映射(mapping)。 字典的作用和列表类似,都是用来存储对象的容器,列表存储数据的性能很好,但是查询数据的性能很差。 如果说序列像一本书,那么它是没有目录的,可以翻到任意一页,但是却不知道每一页的内容。 列表和序列是通过索引来查询的,而字典就不一样了。在字典中,每一个元素都有一个唯一的名字,通过这个唯一的名字,可以快速的查找到指定的元素。字典的存储性能没有列表好,但是在查询元素时,字典的效率是非常快的。
0 0
文章
问答
来源圈子
更多
+ 订阅
文章排行榜
最热
最新
相关电子书
更多
给运维工程师的Python实战课
立即下载
Python 脚本速查手册
立即下载
ACE 区域技术发展峰会:Flink Python Table API入门及实践
立即下载