机器学习/深度学习的搜索结果_文章_第15页-阿里云开发者社区

Deephub

|

9天前

|

博文

PyCausalSim 是一个基于模拟的 Python 因果推断框架，用于从数据中挖掘和验证因果关系。它支持因果结构发现、反事实模拟、A/B测试分析、营销归因与Uplift建模，帮助识别真实驱动因素，超越相关性分析，为业务决策提供可靠因果证据。

# 机器学习/深度学习 # 算法 # 数据可视化 # 测试技术 # Python

AI未闻花名

|

9天前

|

博文

|

来自：大数据与机器学习

构建AI智能体：五十九、特征工程：数据预处理到特征创造的系统性方法

摘要：特征工程是将原始数据转化为机器学习模型可理解格式的关键步骤，类比于食材烹饪过程。其核心包括数据清洗（处理缺失值、异常值）、特征转换（标准化、分箱）、特征创造和特征选择。通过员工离职预测案例，展示了如何通过单变量分析（满意度、工作时长分布）、多变量分析（满意度与绩效关系）和业务分析（部门薪资组合）构建有效特征。特征工程能提升模型性能（如使用简单模型获得好效果）、增强可解释性（明确风险因素）并减少数据需求。

# 机器学习/深度学习 # 数据采集 # 人工智能 # 安全 # C++

游客ya34xkpn34owu

|

9天前

|

博文

2025中国AI数字人技术类厂商评析与重点企业选择指南

数字人企业正乘科技浪潮崛起，资本与政策双轮驱动下迎来黄金发展期。像衍科技、阿里、百度等领军者依托技术革新与场景落地，推动数字人在金融、教育、医疗等领域规模化应用，实现从“虚拟形象”到“智能服务”的跨越，开启虚实融合的产业新纪元。

# 虚拟数字人 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 图形学 # 计算机视觉

bailiantest1

|

9天前

|

博文

|

来自：阿里云百炼

SAPO：让强化学习告别“硬剪切”

SAPO提出一种稳定高效的大语言模型强化学习方法，通过平滑门控替代硬剪切，解决GRPO/GSPO梯度丢失与不稳定问题。其连续信任域、序列级一致性及token级自适应设计，显著提升训练稳定性与样本效率，适用于dense/MoE模型，在数学、代码、逻辑等多任务上表现优越。

# 大模型服务平台百炼 # 机器学习/深度学习

游客vhylg5zno4ifs

|

9天前

|

博文

知识蒸馏

知识蒸馏是一种模型压缩技术，通过让小模型（学生）模仿大模型（教师）的输出或中间特征，实现性能逼近甚至超越。核心方法包括基于软标签的Hinton蒸馏、带温度的softmax平滑分布、以及利用隐藏层特征的特征蒸馏。分为黑盒（仅用输出）与白盒（访问内部）两种模式，广泛用于加速推理与提升小模型泛化能力。（238字）

# 机器学习/深度学习 # 存储 # 知识图谱

游客vhylg5zno4ifs

|

9天前

|

博文

预训练技巧

预训练是大模型的核心基础，涵盖混合精度、分布式训练、ZeRO优化、FlashAttention等关键技术，通过高效计算与显存优化，实现大规模模型的快速稳定训练。

# 存储 # 机器学习/深度学习 # 编解码 # 并行计算 # 异构计算

游客vhylg5zno4ifs

|

9天前

|

博文

强化学习

强化学习（RL）是一种通过智能体与环境交互，以最大化累积奖励为目标的学习方法。核心包括状态、动作、奖励、策略与价值函数，依赖试错和延迟奖励机制。常见算法如Q-learning、PPO、DPO等，广泛应用于游戏、机器人及大模型训练。结合人类反馈（RLHF），可实现对齐人类偏好的智能行为优化。（239字）

# 机器学习/深度学习 # 算法 # 关系型数据库 # 机器人 # API

游客vhylg5zno4ifs

|

9天前

|

博文

分词器详解

分词器将文本转为模型可处理的数字序列，主流算法有BPE、WordPiece和SentencePiece。BPE高效但中文支持弱；WordPiece用于BERT，适合英文；SentencePiece语言无关，支持中日文。实战中常用SentencePiece处理中文，Hugging Face工具处理英文。面试需掌握算法差异、中文分词策略、词汇表设计及OOV问题解决。

# 机器学习/深度学习 # 自然语言处理 # 算法

游客vhylg5zno4ifs

|

9天前

|

博文

注意力机制详解

注意力机制是Transformer核心，通过自注意力、交叉注意力等实现序列间动态关联。多头、分组、多查询等变体在效率与性能间权衡，广泛应用于大模型设计，助力高效长序列建模与推理优化。

# 机器学习/深度学习 # 存储 # 缓存 # 关系型数据库 # MySQL

游客vhylg5zno4ifs

|

9天前

|

博文

位置编码详解

位置编码为Transformer提供序列位置信息，弥补注意力机制无位置感知的缺陷。主要分绝对与相对两类：绝对编码如可学习和Sinusoidal，简单高效但外推性弱；相对编码如RoPE和ALiBi，通过旋转矩阵或线性偏置实现良好外推，支持长序列，广泛应用于LLaMA、BLOOM等大模型。

# 机器学习/深度学习

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

机器学习/深度学习