机器学习系列0 机器学习思想

简介: 机器学习”是当今最流行和最常用的术语之一。在大部分行业,如果你对技术足够熟悉,无论你在哪个领域工作,你至少听过这个术语。然而,机器学习的机制对大多数人来说都是一个谜。对于机器学习初学者来说,这个术语有时会让人感到不知所措。因此,重要的是要了解机器学习到底是什么,并通过实例逐步了解它。

 一、本课程入门必要条件:

 

0 配置您的计算机。在系统中安装 Python 并设置用于开发的文本编辑器如jupyter notebook 或者pycharm等开发环境。

1 学习 Python。建议对Python有个基本了解,Python是一种对我们在本课程中使用的数据科学家有用的编程语言。

2 学习 Node.js 和 JavaScript。在本课程中,在构建Web应用程序时,我们还使用JavaScript几次,因此您需要安装node和npm,以及可用于Python和JavaScript开发的Visual Studio代码。

3 创建一个 GitHub 帐户。由于您在 GitHub 上找到我们,您可能已经有一个帐户,但如果没有,请创建一个帐户,然后分叉此课程以供自己使用。(也请随时给他们一颗星)

4 探索 Scikit-learn。熟悉 Scikit-learn,这是我们在这些课程中引用的一组 ML 库。

二、什么是机器学习?

       “机器学习”是当今最流行和最常用的术语之一。在大部分行业,如果你对技术足够熟悉,无论你在哪个领域工作,你至少听过这个术语。然而,机器学习的机制对大多数人来说都是一个谜。对于机器学习初学者来说,这个术语有时会让人感到不知所措。因此,重要的是要了解机器学习到底是什么,并通过实例逐步了解它。

无限宇宙

       我们生活在一个充满迷人奥秘的宇宙中。伟大的科学家,如斯蒂芬·霍金(Stephen Hawking)、阿尔伯特·爱因斯坦(Albert Einstein)等等,毕生致力于寻找有意义的信息,揭开我们周围世界的奥秘。这就是人类学习的条件:一个人类的孩子在长大成人的过程中,年复一年地学习新事物,并揭示他们世界的结构。

孩子的大脑

       孩子通过大脑和感官感知周围环境的信息,并逐渐学习潜在的生活模式,这有助于孩子制定其逻辑规则来识别学习模式。人类大脑的学习过程使人类成为这个世界上最复杂的生物。通过发现隐藏的模式,然后在这些模式上进行创新来不断学习,使我们能够在一生中让自己变得越来越好。这种学习和不断发展的能力与一个被称为大脑可塑性的概念有关。从表面上看,我们可以从人脑的学习过程和机器学习的概念之间得出一些动机上的相同点。

人脑

       人类的大脑从现实世界中感知事物,处理感知到的信息,继而做出理性的决定,并根据结论执行某些操作。这就是我们所说的智能行为。当我们将智能行为过程数字化编程到机器上时,它被称为人工智能(AI),对人脑的研究也限制或促进着机器学习的发展。

       机器学习(ML)是人工智能的重要子集。ML关注的是使用专门的算法来发现有意义的信息,并从感知数据中找到隐藏的模式,以证实理性的决策过程。

ML、AI、DL关系图

image.gif编辑

三、课程涵盖内容及学习大纲

      在本课程中,我们将仅涵盖初学者必须了解的机器学习的核心概念。我们涵盖了我们所谓的“经典机器学习”,主要使用Scikit-learn,这是一个优秀的python库,许多学生用它来学习基础知识。为了理解人工智能或深度学习更广泛的概念,牢固的机器学习基础知识是必不可少的,因此本课程会提供必备的基础知识。

       下面是课程大纲:

0 机器学习的核心概念

1 机器学习的历史

2 机器学习和公平性

3 机器学习回归

4 机器学习分类

5 机器学习聚类

6 自然语言处理

7 时间序列预测

8 强化学习

9 机器学习的实际应用

四、课程不会涵盖的内容

0 深度学习

1 神经网络

2 人工智能

       为了获得更好的学习体验,我们将避免神经网络,“深度学习”(使用神经网络的多层模型构建)和AI的复杂性。、

五、为什么要学习机器学习?

       从决策的角度来看,机器学习被定义为创建自动化系统,这些系统可以从数据中学习隐藏的模式,以助于做出明智的决策。这种动机的灵感来源于人类大脑学习的过程。

       在此想想为什么企业会想要使用机器学习,而不是创建一个基于规则的硬编码机器。

       (我认为,硬编码机器是基于已有规则构建的,随着数据量的增长,人力构建的机器会越来越冗余,事倍功半,机器学习强大的运算逻辑构建的业务方案效率更高更加理性还能发现人类无法察觉的规律。求解答!)

六、机器学习应用案例

       机器学习的应用如今无处不在,就像在我们的社会中流动的数据一样,这些数据是由我们的智能手机、连接设备和其他系统产生的。考虑到最先进的机器学习算法的巨大潜力,研究人员一直在探索它们解决多维和多学科现实生活问题的能力,并取得巨大的积极成果。

       如下是机器学习在实际中的部分应用:

0 从患者的病史或报告中预测疾病的可能性。

1 利用天气数据预测天气事件。

2 理解文本的情感。

3 检测假新闻,阻止宣传的传播。

       金融、经济学、地球科学、太空探索、生物医学工程、认知科学,甚至人文学科领域都采用了机器学习来解决其领域内繁重的繁重数据处理问题。

       在学习者的专业学习中,机器学习最常见于遥感影像的分类,和误差数值的回归监测中。

随机森林

支持向量机

贝叶斯分类

最大似然分类器

聚类

K均值

七、结论

       机器学习通过从现实世界或虚拟世界生成的数据中查找有意义的规律来自动执行模式发现过程。它已经被证明在商业,健康和金融应用程序等方面具有很高的价值。

       在不久的将来,了解机器学习的基础知识对于任何领域的人来说都是必须的。

八、测验

       在纸上或使用Excalidraw(Excalidraw | Hand-drawn look & feel • Collaborative • Secure)等在线应用程序绘制草图,了解AI,ML,深度学习和数据科学之间的差异。添加一些这些技术都擅长解决的问题的想法。

       我的作业:

image.gif编辑

测验习题链接:https://white-water-09ec41f0f.azurestaticapps.net/quiz/2/

在云端使用 ML 算法:在云端使用机器学习

自学链接:简介 - Learn | Microsoft Docs

项目GitHub链接:0 机器学习简介

目录
相关文章
|
机器学习/深度学习 数据可视化 算法
机器学习系列7 基于Python的Scikit-learn库构建逻辑回归模型
🎄🎄本文中,你将学到逻辑回归的数学原理,使用Seaborn库可视化数据寻找数据间的相关性,并基于Scikit-learn库构建逻辑回归模型预测南瓜颜色。
797 0
|
4月前
|
安全 Linux 网络安全
Metasploit Pro 4.22.8-2025091701 (Linux, Windows) - 专业渗透测试框架
Metasploit Pro 4.22.8-2025091701 (Linux, Windows) - 专业渗透测试框架
356 2
Metasploit Pro 4.22.8-2025091701 (Linux, Windows) - 专业渗透测试框架
|
3月前
|
Java 项目管理 Maven
Maven项目管理与构建自动化完全指南
Maven彻底改变了Java项目管理方式,通过POM模型、依赖管理和标准化构建流程,大幅提升开发效率。本文深入解析其核心概念、多模块管理、私服搭建及与Spring Boot、Docker等现代技术栈的集成实践,助力开发者实现高效、规范的项目构建与团队协作。
Maven项目管理与构建自动化完全指南
|
4月前
|
运维 安全 Linux
企微应用推荐-ZeroNews安全网关,打破内外网壁垒,让工作触手可及!
企业微信作为强大的协同平台,其开放性和集成能力是其核心优势之一。选择像ZeroNews这样专业、安全、易用的第三方内网应用集成方案,是您打通内外网信息壁垒、赋能移动办公、提升企业整体运营效率的明智之选。
|
XML JSON 数据安全/隐私保护
PyMuPDF,Python处理PDF的宝藏库
PyMuPDF,Python处理PDF的宝藏库
644 2
|
存储 关系型数据库 Java
极速体验DolphinScheduler 3.2.1 Standalone 版[一]
极速体验DolphinScheduler 3.2.1 Standalone 版[一]
207 0
|
IDE Linux 开发工具
Python安装与配置
Python安装与配置
384 0
|
数据可视化
第七章:MATLAB基本运算符号解析及案例详解
第七章:MATLAB基本运算符号解析及案例详解
498 1
|
机器学习/深度学习 数据可视化 算法
机器学习系列6 使用Scikit-learn构建回归模型:简单线性回归、多项式回归与多元线性回归
在本文中,我们以美国南瓜数据为例,讲解了三种线性回归的原理与使用方法,探寻数据之间的相关性,并构建了6种线性回归模型。将准确率从一开始的0.04提升到0.96.
795 0
|
机器学习/深度学习 数据采集 存储
一文读懂机器学习分类全流程
🏆在本文中,作者将带你了解机器学习分类的全流程,从问题分析>数据预处理>分类器选择>模型构建>精度评价>模型发布为Web应用。从0带读者入门机器学习分类。
1515 0