《Arduino家居安全系统构建实战》——1.8 更进一步

简介:

本节书摘来异步社区《机器学习项目开发实战》一书中的第1章,第1.1节,作者:【美】Mathias Brandewinder(马蒂亚斯·布兰德温德尔),更多章节内容可以访问云栖社区“异步社区”公众号查看

1.8 更进一步

人们第一次看到算法时,我常常看到的反应之一是“但是……这有点蠢。”他们真正的意思是,“但是……哪里有学习?”机器学习的正式定义是:“编写一个程序,在得到更多数据时,更好地执行某项任务。”我们的模型——1-最近邻算法完全符合这一定义:可以预期,越大的样本“工作得越好”(反过来,可以预期减少样本会使性能降级)。另一方面,它不太符合我们对“学习”的直观理解。我们的模型实际上记住了看到的所有情况,而人们倾向于将学习视为对高层抽象的辨别,这提供了经验的更紧凑表现形式。当你看到一个数字的图像时,不会重温一生中见过的所有图像以决定是否匹配——你知道用于过滤和识别的高层概念(“0就像一个圆圈”)。

可以在我们的问题上使用更高级的算法(如支持向量机或者神经网络,第8章中将这么做),它们的行为和“学习”的概念更符合:在训练阶段处理数据,并提取简化的表现形式。这样做的明显缺点是训练阶段实际上将变得更加复杂,好处是所得到的模型更小、更快。

那么,应该使用支持向量机、神经网络还是其他方法?和往常一样,答案是“看情况”。首先,这取决于你的终极目标。你的目标可能是更加精确;如果代码部署于生产环境,目标也可能是更快、使用更少内存或者其他。

正如前面所讨论的那样,实际上没有办法知道某种模型是否好于另一种——你必须尝试,这可能代价很高。所以,在追求更好的模型之前,要仔细考虑:当前模型是否足够好?工作是否集中于正确的问题?正如法国谚语所说“更好是好的敌人”。我们的简单算法已经达到大约95%的分类正确率,相当不错了。如果这已经足够,就不要浪费时间,转向感兴趣的下一个问题。机器学习问题有能力自己生存,除非你有一个快速、100%准确的完美模型,否则永远不能说“完成”了,回到工作中继续改善、挤出每一点精确度是很有诱惑的。因此,必须提前想好什么是“足够好”,否则可能需要很长时间来追求完美!

相关文章
|
JavaScript 测试技术 C#
【C#】【xUnit】【Moq】.NET单元测试Mock框架Moq初探!
在TDD开发模型中,经常是在编码的同时进行单元测试的编写,由于现代软件开发不可能是一个人完成的工作,所以在定义好接口的时候我们就可以进行自己功能的开发(接口不能经常变更),而我们调用他人的功能时只需要使用接口即可。
5472 0
|
机器学习/深度学习 大数据 关系型数据库
|
30天前
|
存储 人工智能 测试技术
AI 场景深度优化!K8s 集群 OSSFS 2.0 存储卷全面升级,高效访问 OSS 数据
OSSFS 2.0通过轻量化协议设计、协程化技术及FUSE3低级API重构,实现大文件顺序读写与小文件高并发加载的显著提升,在实际测试中表现出高达数十倍的吞吐量增长。适用于机器学习训练、推理等对高带宽低延迟要求严苛的场景,同时支持静态和动态挂载方式,方便用户在ACK集群中部署使用。
240 34
|
23天前
|
安全 Java 编译器
Java 校招面试题目合集及答案 120 道详解
这份资料汇总了120道Java校招面试题目及其详细答案,涵盖Java基础、JVM原理、多线程、数据类型、方法重载与覆盖等多个核心知识点。通过实例代码解析,帮助求职者深入理解Java编程精髓,为校招面试做好充分准备。无论是初学者还是进阶开发者,都能从中受益,提升技术实力和面试成功率。附带的资源链接提供了更多学习材料,助力高效备考。
53 3
|
4月前
|
机器学习/深度学习 人工智能 监控
AI监控智能化客户行为轨迹分析技术
本方案通过目标跟踪技术(如DeepSORT)和多摄像头协作,实时分析顾客在商场内的行为路径,识别高频活动区域,优化商场布局与商品陈列,提供个性化营销服务。基于深度学习与时序数据分析,精准捕捉顾客动线,提升购物体验与销售转化率。
181 2
|
4月前
|
机器学习/深度学习 人工智能 API
大模型推理服务全景图
大模型推理服务全景图
|
6月前
|
SQL 弹性计算 安全
阿里云服务器产品详情介绍:云服务器是什么、应用场景、租用流程、使用教程参考
对于很多新手用户来说,阿里云服务器是什么、阿里云服务器可以干嘛、阿里云服务器租用价格表、阿里云服务器新手教程是很多用户对于阿里云服务器最为关心的问题。同时,面对琳琅满目的服务器配置和优惠活动,如何选择最适合自己的服务器并充分利用其资源,成为许多用户面临的难题。本文将从阿里云服务器的定义、应用场景、价格、租用流程以及使用技巧等方面进行全面解析,帮助用户更好地了解和应用阿里云服务器。
521 14
|
7月前
|
算法 数据安全/隐私保护 索引
OFDM系统PAPR算法的MATLAB仿真,对比SLM,PTS以及CAF,对比不同傅里叶变换长度
本项目展示了在MATLAB 2022a环境下,通过选择映射(SLM)与相位截断星座图(PTS)技术有效降低OFDM系统中PAPR的算法实现。包括无水印的算法运行效果预览、核心程序及详尽的中文注释,附带操作步骤视频,适合研究与教学使用。
|
7月前
|
机器学习/深度学习 人工智能 测试技术
革命来临:AI如何彻底颠覆传统软件开发的每一个环节
【10月更文挑战第32天】本文探讨了AI技术如何重塑软件开发行业,从需求分析、设计、编码、测试到项目管理,AI的应用不仅提高了开发效率,还提升了软件质量和用户体验。通过对比传统方法与AI驱动的新方法,展示了AI在各个阶段的具体应用和优势。
338 3
|
机器学习/深度学习 传感器 算法
【无人机三维路径规划】基于强化学习实现复杂地形无人机三维路径规划附matlab代码
【无人机三维路径规划】基于强化学习实现复杂地形无人机三维路径规划附matlab代码