想象一下一个从来没有见过猫的人(比如一个小婴儿),他的词汇里面甚至没有猫这个词。有一天他看到了一个毛茸茸的动物,这时候他不知道这是什么东西,你告诉他这是 ”猫“。这时候可能小婴儿记住了,这个就是猫。又过了段时间他又看见了这样的动物,你又告诉他这也是猫。他记住了这也是猫。后来又过了段时间,他又看见了的动物,这时他直接告诉你他看见了一只“猫”。以上就是我们认识世界的基本方法,模式识别:人们通过大量的经验,得到结论,从而判断它就是猫。
在这个过程中我们通过接触样本(各种猫)学习到了猫的特征(人们通过阅读进行学习,观察它会叫、两只耳朵、四条腿、一条尾巴、有胡须,得到结论),从而知道什么是猫。 识别是否是猫或者识别一个模块是否是测试模块本质上是一样的,都是在找特征: 识别是否是猫或者识别一个模块是否是测试模块本质上是一样的,都是在找特征: 1) 猫的特征:会叫、两只耳朵、四条腿、一条尾巴、有胡须 2) 测试模块的特征:test、demo、测试
再进一步将特征程序化表述: 1) 猫的特征 叫:true、耳朵:2、腿:4、尾巴:1、胡须:10 2) 测试模块的特征:test:count>0、demo:count >0、测试:count > 0 有了这些特征无论是人还是机器都能正确的识别猫或者测试模块了。 简单的理解机器学习就是通过特征和特征的权重来实现数据的分类。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。