机器学习/深度学习的搜索结果_文章_第15页-阿里云开发者社区

探索云世界动手实践

|

6天前

|

博文

随着深度学习模型和数据集规模的扩大，单机训练已无法满足需求，分布式训练技术应运而生。DeepSeek框架支持数据并行和模型并行两种模式，通过将计算任务分配到多个节点上并行执行，显著提高训练效率。本文介绍DeepSeek中的分布式训练技术，包括配置与启动方法，帮助用户轻松实现大规模模型训练。数据并行通过`MirroredStrategy`同步梯度，适用于大多数模型；模型并行则通过`ParameterServerStrategy`异步处理大模型。DeepSeek简化了分布式环境配置，支持单机多卡和多机多卡等场景。

# 机器学习/深度学习 # 存储

探索云世界动手实践

|

6天前

|

博文

从词袋到Transformer：自然语言处理的演进与实战

自然语言处理（NLP）是人工智能的重要分支，从早期的规则系统发展到如今的深度学习模型，经历了词袋模型、词嵌入、RNN/LSTM/GRU，再到革命性的Transformer架构。本文通过代码和案例详细介绍了这些技术的演进，并展示了如何从简单的词袋模型过渡到强大的Transformer，涵盖文本分类等实战应用，帮助读者深入理解NLP的核心技术和未来发展潜力。

# 自然语言处理 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # PyTorch # 算法框架/工具

探索云世界动手实践

|

6天前

|

博文

DeepSeek强化学习（Reinforcement Learning）基础与实践

强化学习（RL）是机器学习的重要分支，专注于训练智能体在环境中通过试错学习最优策略。DeepSeek提供了强大的工具和API，帮助高效构建和训练RL模型。本文将详细介绍使用DeepSeek进行强化学习的基础与实践，涵盖环境构建、智能体定义、Q学习及DQN训练等内容，并提供代码示例，助你掌握这些技巧。

# 机器学习/深度学习 # 存储 # API # 决策智能 # 异构计算

探索云世界动手实践

|

6天前

|

博文

DeepSeek生成模型（Generative Models）基础与实践

生成模型（Generative Models）是能够生成新数据的机器学习模型，广泛应用于图像和文本生成、数据增强等场景。通过学习数据分布，生成模型可创建与训练数据相似的新样本。DeepSeek提供了强大的工具和API，帮助高效构建和训练生成模型。本文将详细介绍使用DeepSeek进行生成模型的基础与实践，涵盖变分自编码器（VAE）和生成对抗网络（GAN）的实现，并通过代码示例帮助掌握这些技巧。

# 机器学习/深度学习 # 自然语言处理 # 数据可视化 # API # Python

探索云世界动手实践

|

6天前

|

博文

DeepSeek进阶开发与应用1：DeepSeek框架概述与基础应用

DeepSeek是一个高效、灵活的深度学习框架，旨在简化模型的构建、训练和评估。其核心特点包括模块化设计、自动微分、多后端支持及易于扩展。本文通过手写数字识别的CNN模型实例，展示了DeepSeek的安装、数据准备、模型构建、编译、训练与评估过程，最终模型在测试集上达到了98%以上的准确率。

# 机器学习/深度学习 # 人工智能 # PyTorch # TensorFlow # 算法框架/工具

探索云世界动手实践

|

6天前

|

博文

DeepSeek进阶开发与应用3：DeepSeek中的模型调优技术

本文深入探讨了DeepSeek框架中的模型调优技术，涵盖超参数优化、正则化方法及回调函数的应用。通过学习率调整、网格搜索、L1/L2正则化、Dropout、提前停止和模型检查点等具体示例，帮助读者掌握提升模型性能和防止过拟合的方法。文中还介绍了如何使用回调函数监控和调整训练过程，确保模型在大规模数据集上高效训练。

# 机器学习/深度学习 # 监控

探索云世界动手实践

|

6天前

|

博文

|

来自： PolarDB开源

从零开始构建基于DeepSeek的智能客服系统

在数字化时代，智能客服系统成为企业与客户沟通的重要桥梁。本文介绍如何使用PHP和DeepSeek技术构建智能客服系统，涵盖环境搭建、核心功能实现、多轮对话支持及电商客服案例。DeepSeek基于深度学习，能理解复杂意图并提供个性化服务，显著提升客户体验和运营效率。通过具体代码示例，帮助开发者从零开始构建强大智能客服系统。

# 机器学习/深度学习 # 存储 # 自然语言处理 # 搜索推荐 # PHP

探索云世界动手实践

|

6天前

|

博文

|

来自：大数据与机器学习

从零开始：如何训练自己的AI模型

### 从零开始：如何训练自己的AI模型训练AI模型如同培养新生儿，需耐心与技巧。首先明确目标（如图像识别、自然语言处理），选择框架（TensorFlow、PyTorch）。接着收集并预处理数据，确保多样性和准确性。然后设计模型结构，如卷积神经网络（CNN），并通过代码实现训练。训练后评估模型性能，调优以避免过拟合。最后部署模型至实际应用。通过猫狗分类器案例，掌握关键步骤和常见问题。训练AI模型是不断迭代优化的过程，实践才能真正掌握精髓。

# 机器学习/深度学习 # 人工智能 # PyTorch # TensorFlow # 算法框架/工具

蚝油菜花

|

6天前

|

博文

|

来自： ModelScope模型即服务

结合DeepSeek-R1强化学习方法的视觉模型！VLM-R1：输入描述就能精确定位图像目标

VLM-R1 是基于强化学习技术的视觉语言模型，通过自然语言指令精确定位图像目标，支持复杂场景推理与高效训练。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 决策智能 # 开发者

阿里云大数据Al技术

|

6天前

|

博文

|

来自：大数据与机器学习

云上玩转DeepSeek系列之五：实测优化16%, 体验FlashMLA加速DeepSeek-V2-Lite推理

DeepSeek-AI 开源的 FlashMLA 是一个优化多层注意力机制的解码内核，显著提升大语言模型的长序列处理和推理效率。本文介绍了如何在 PAI 平台上安装并使用 FlashMLA 部署 DeepSeek-V2-Lite-Chat 模型。通过优化后的 FlashMLA，实现了约 16% 的性能提升。

# 人工智能平台 PAI # 机器学习/深度学习 # 人工智能 # 缓存 # PyTorch # 异构计算

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

直播

下载

镜像站

技术资料

机器学习/深度学习