机器学习/深度学习的搜索结果_文章_第7页-阿里云开发者社区

AI未闻花名

|

4天前

|

博文

|

超参数是机器学习模型训练前需要人工设定的参数，它们控制着模型的学习过程而非直接通过学习获得。文章通过生动的类比（如自行车调整、烹饪配方）解释了超参数的概念，并详细介绍了其调优流程、常见类型（学习率、批量大小等）及对模型的影响。通过实际代码示例，展示了不同超参数设置如何影响模型训练效果，强调合理调优对提升模型性能、防止过拟合和优化资源使用的重要性。文章指出，超参数调优是模型成功的关键，初学者可从默认值开始逐步实验，借助网格搜索等工具实现高效调参。

# 大模型服务平台百炼 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # C++ # 异构计算

1355684033393168

|

5天前

|

博文

自变量机器人参与成立RoboChallenge组委会开源协作开启标准化新阶段

就在11月20日，智源研究院、智元机器人、Qwen、星海图、自变量、清华大学、西安交通大学，GOSIM 国际国内合作伙伴进一步携手，共同推动生态建设，并正式成立 RoboChallenge 组委会。这标志着具身智能真机测评的开源协作不仅迈入了标准化的新阶段，更以“开放共同体”的行业共创模式，为具身智能技术的落地与迭代注入新动能。

# 机器学习/深度学习 # 数据采集 # 传感器 # 人工智能 # 机器人

游客qbwohdg5vs6oq

|

5天前

|

博文

推荐引擎：没有搜索词，「头条」怎么找到你感兴趣的文章？

资讯类App通过“下拉刷新”精准推荐内容，背后依赖推荐引擎的检索技术。它基于用户行为数据构建用户画像与文章画像，结合协同过滤、内容召回等算法，实现个性化推荐，并通过多路召回与分层排序提升效率与准确性。

# 机器学习/深度学习 # 搜索推荐 # 算法 # 数据库 # 索引

游客hxb2wskd57xio

|

5天前

|

博文

RocketMQ总结

本课程系统讲解人工智能基础理论与应用实践，涵盖机器学习、深度学习、自然语言处理等核心内容，结合案例分析与项目实操，帮助学习者掌握AI关键技术，提升解决实际问题的能力，适用于初学者及进阶开发者。

# 消息中间件 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # RocketMQ

游客qbwohdg5vs6oq

|

5天前

|

博文

广告系统：广告引擎如何做到在 0.1s 内返回广告信息？

广告系统是互联网公司核心营收支柱，如Google、Facebook超80%收入来自广告。其背后依赖高性能广告引擎，实现高并发、低延迟的精准投放。本文深入解析广告引擎架构，涵盖标签检索、向量匹配、打分排序与索引优化四大关键技术，揭示如何在0.1秒内完成从请求到返回的全流程，支撑千人千面的智能广告体验。

# 机器学习/深度学习 # 搜索推荐 # 算法 # 数据挖掘 # 索引

游客wsxnwr5p22s5w

|

5天前

|

博文

🫗 知识蒸馏

知识蒸馏是一种模型压缩技术，通过让小模型（学生）模仿大模型（教师）的输出或中间特征，实现性能逼近甚至超越。核心方法包括软标签蒸馏、带温度的Softmax提升信息保留，以及特征层对齐。按信息访问程度分为黑盒与白盒蒸馏，广泛用于加速推理、降低资源消耗，同时提升泛化能力。

# 机器学习/深度学习 # 存储 # 知识图谱

游客wsxnwr5p22s5w

|

5天前

|

博文

🎮 强化学习

强化学习（RL）是一种通过智能体与环境交互，基于试错和延迟奖励学习最优策略的机器学习方法。核心要素包括状态、动作、奖励、策略与价值函数。常用算法有Q-learning、策略梯度、PPO、DPO等，广泛应用于游戏、机器人及大模型对齐人类偏好（如RLHF）。其关键挑战在于平衡探索与利用、偏差与方差，并提升样本效率与训练稳定性。

# 机器学习/深度学习 # 算法 # 关系型数据库 # 机器人 # API

游客wsxnwr5p22s5w

|

5天前

|

博文

🔥 高频面试题汇总

Transformer核心基于自注意力机制，通过QKV计算捕捉长距离依赖，结合多头机制增强表达能力。使用位置编码补充序列顺序信息，配合RoPE、绝对/相对编码等技术。采用RMSNorm、SwiGLU等优化架构，结合LoRA、ZeRO实现高效训练与推理。显存估算需综合参数、KV缓存、激活值等，广泛应用于生成、理解与安全对齐任务。

# 机器学习/深度学习 # 存储 # 数据采集 # 缓存 # 物联网

游客wsxnwr5p22s5w

|

5天前

|

博文

🚀 预训练技巧

预训练是大模型基石，涵盖混合精度、分布式训练等核心技术。混合精度提升效率与显存利用率；数据/模型/流水线并行支持超大模型训练；DeepSpeed的ZeRO优化显存，FlashAttention加速注意力计算，助力高效大规模训练。（239字）

# 存储 # 机器学习/深度学习 # 编解码 # 并行计算 # 异构计算

游客wsxnwr5p22s5w

|

5天前

|

博文

🔤 分词器详解

分词器将文本转为模型可处理的数字序列，主流算法如BPE、WordPiece和SentencePiece各有特点：BPE高效但中文支持弱；WordPiece用于BERT，适合英文；SentencePiece语言无关，支持多语言。选择时需权衡粒度、速度与模型需求，中文推荐SentencePiece。

# 机器学习/深度学习 # 自然语言处理 # 算法

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

机器学习/深度学习