数据挖掘和机器学习的区别和联系,周志华有一篇很好的论述《机器学习和
数据挖掘》可以帮助大家理解。
数据挖掘受到很多学科领域的影响,其中数据库、机器学习、统计学无疑影响
最大。简言之,对数据挖掘而言,数据库提供数据管理技术,机器学习和统计学
提供数据分析技术。
由于统计学往往醉心于理论的优美而忽视实际的效用,因此,统计学界提供的
很多技术通常都要在机器学习界进一步研究,变成有效的机器学习算法之后才能
再进入数据挖掘领域。从这个意义上说,统计学主要是通过机器学习来对数据挖
掘发挥影响,而机器学习和数据库则是数据挖掘的两大支撑技术。
从数据分析的角度来看,绝大多数数据挖掘技术都来自机器学习领域,但机器
学习研究往往并不把海量数据作为处理对象,因此,数据挖掘要对算法进行改造,
使得算法性能和空间占用达到实用的地步。同时,数据挖掘还有自身独特的内容,
即关联分析。
而模式识别和机器学习的关系是什么呢,传统的模式识别的方法一般分为两种:
统计方法和句法方法。句法分析一般是不可学习的,而统计分析则是发展了不少机
器学习的方法。也就是说,机器学习同样是给模式识别提供了数据分析技术。
至于,数据挖掘和模式识别,那么从其概念上来区分吧,数据挖掘重在发现知识,
模式识别重在认识事物。
机器学习的目的是建模隐藏的数据结构,然后做识别、预测、分类等。因此,机器
学习是方法,模式识别是目的。
总结一下吧。只要跟决策有关系的都能叫 AI(人工智能),所以说 PR(模式识别)、
DM(数据挖掘)、IR(信息检索) 属于 AI 的具 体应用应该没有问题。 研究的东西则
不太一样, ML(机器学习) 强调自我完善的过程。 Anyway,这些学科都是相通的。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。