大模型 - 机器学习

简介: 【8月更文挑战第1天】

机器学习相关信息:

image.png

关系/概念 描述
机器学习与AI AI的一个子集
机器学习与深度学习 深度学习是子领域
机器学习与神经网络 使用神经网络模型
机器学习与向量数据库 增强相似性搜索能力
监督式学习原理 从标签数据中学习
无监督学习原理 在无标签数据中找模式
强化学习原理 通过反馈优化行为
模型产生方式 数据驱动与算法设计
应用示例 如垃圾邮件识别、推荐系统

监督式学习

方面 描述
定义 通过标签数据学习
理解 算法从示例中学习
原理 归纳示例输入和输出,预测新数据
  • 定义:监督式学习涉及到一个算法,它被训练来识别数据集中的模式,这些数据集已经包含了输入数据和它们对应的正确输出(标签)。

  • 理解:这种学习方式可以被理解为一种模仿或学习过程,其中算法通过观察带有正确答案的例子来学习如何对新的、未见过的数据做出预测。

  • 原理:其核心原理是归纳学习,即算法分析训练数据集中的输入和输出之间的关系,然后归纳出一种模式或函数,这个函数可以用于预测新的输入数据的输出。例如,在监督学习中,算法可能会学习到如何根据房屋的大小、位置和其他特征来预测房价。

生活故事理解 监督学习

好的,让我们通过一个小学生在厨房学习烘焙蛋糕的故事来理解监督式学习。

故事:小明的蛋糕烘焙课

故事背景
小明是一名小学生,他对烘焙蛋糕非常感兴趣。他的妈妈是一位烘焙高手,决定教小明如何烘焙出美味的蛋糕。

第1步:观察例子(收集数据)
小明的妈妈首先给他展示了各种各样的蛋糕图片和配方(就像数据集中的标签数据)。每张图片都附有配方,说明了制作这种蛋糕需要哪些配料和步骤。

第2步:学习配方(训练模型)
小明开始尝试按照配方烘焙蛋糕。他一边学习,一边实践,逐渐理解了不同配料和烘焙时间对蛋糕味道和质地的影响。这个过程就像是监督式学习中的模型训练阶段。

第3步:不断尝试(模型调优)
有时候,小明会根据自己的口味调整配方,比如多加一些糖或者更换不同的面粉。每次调整后,他都会请家人品尝并给出反馈。这个过程就像是模型的调优,通过反馈来改进模型。

第4步:独立烘焙(模型预测)
经过一段时间的学习和实践,小明已经能够不看配方,自己决定配料和烘焙时间,烘焙出家人和朋友都喜欢的蛋糕。这就像是监督式学习中的模型预测阶段,模型已经学会了如何根据输入(配料和烘焙条件)来预测输出(蛋糕的味道和质地)。

第5步:创新蛋糕(模型应用)
小明不仅学会了烘焙妈妈教的蛋糕,还开始尝试创造自己的特色蛋糕,比如水果蛋糕、巧克力蛋糕等。这就像是监督式学习模型的应用,将学到的知识应用到新的、未见过的任务上。

参考

  1. https://klose911.github.io/html/ml/intro.html

  2. 40分钟
目录
相关文章
|
1月前
|
机器学习/深度学习 数据采集 自然语言处理
【机器学习】大模型驱动下的医疗诊断应用
摘要: 随着科技的不断发展,机器学习在医疗领域的应用日益广泛。特别是在大模型的驱动下,机器学习为医疗诊断带来了革命性的变化。本文详细探讨了机器学习在医疗诊断中的应用,包括疾病预测、图像识别、基因分析等方面,并结合实际案例进行分析。同时,还展示了部分相关的代码示例,以更好地理解其工作原理。
46 3
【机器学习】大模型驱动下的医疗诊断应用
|
1月前
|
机器学习/深度学习 算法 PyTorch
【机器学习】大模型环境下的应用:计算机视觉的探索与实践
【机器学习】大模型环境下的应用:计算机视觉的探索与实践
56 1
|
1月前
|
机器学习/深度学习 自然语言处理 前端开发
前端大模型入门:Transformer.js 和 Xenova-引领浏览器端的机器学习变革
除了调用API接口使用Transformer技术,你是否想过在浏览器中运行大模型?Xenova团队推出的Transformer.js,基于JavaScript,让开发者能在浏览器中本地加载和执行预训练模型,无需依赖服务器。该库利用WebAssembly和WebGPU技术,大幅提升性能,尤其适合隐私保护、离线应用和低延迟交互场景。无论是NLP任务还是实时文本生成,Transformer.js都提供了强大支持,成为构建浏览器AI应用的核心工具。
427 1
|
2月前
|
存储 人工智能 并行计算
Pai-Megatron-Patch:围绕Megatron-Core打造大模型训练加速生态
Pai-Megatron-Patch(https://github.com/alibaba/Pai-Megatron-Patch)是阿里云人工智能平台PAI研发的围绕Nvidia MegatronLM的大模型开发配套工具,旨在帮助开发者快速上手大模型,完成大模型(LLM)相关的高效分布式训练,有监督指令微调,下游任务评估等大模型开发链路。最近一年来,我们持续打磨Pai-Megatron-Patch的性能和扩展功能,围绕Megatron-Core(以下简称MCore)进一步打造大模型训练加速技术生态,推出更多的的训练加速、显存优化特性。
|
3月前
|
机器学习/深度学习 数据采集 人工智能
【机器学习】QLoRA:基于PEFT亲手量化微调Qwen2大模型
【机器学习】QLoRA:基于PEFT亲手量化微调Qwen2大模型
269 0
【机器学习】QLoRA:基于PEFT亲手量化微调Qwen2大模型
|
3月前
|
机器学习/深度学习 数据采集 物联网
【机器学习】Google开源大模型Gemma2:原理、微调训练及推理部署实战
【机器学习】Google开源大模型Gemma2:原理、微调训练及推理部署实战
124 0
|
3月前
|
机器学习/深度学习 编解码 API
【机器学习】FFmpeg+Whisper:二阶段法视频理解(video-to-text)大模型实战
【机器学习】FFmpeg+Whisper:二阶段法视频理解(video-to-text)大模型实战
54 0
|
3月前
|
机器学习/深度学习 人机交互 API
【机器学习】Whisper:开源语音转文本(speech-to-text)大模型实战
【机器学习】Whisper:开源语音转文本(speech-to-text)大模型实战
203 0
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
【机器学习】ChatTTS:开源文本转语音(text-to-speech)大模型天花板
【机器学习】ChatTTS:开源文本转语音(text-to-speech)大模型天花板
140 0
|
3月前
|
机器学习/深度学习 JSON API
【机器学习】GLM-4V:图片识别多模态大模型(MLLs)初探
【机器学习】GLM-4V:图片识别多模态大模型(MLLs)初探
151 0