调度的搜索结果_第12页-阿里云开发者社区

aliyun9170107523-43660

|

1月前

|

博文

|

在大规模语言模型（LLM）的训练过程中，评估模型性能是一个至关重要但常被简化处理的环节。2025年的研究表明，仅依赖单一指标（如困惑度）来判断模型质量已经无法满足复杂应用场景的需求。困惑度作为语言模型训练中最核心的评估指标，其与下游任务表现之间的关系远比直觉更复杂。本文将深入剖析困惑度的数学原理、计算方法、优化策略，以及其与各类下游任务表现的相关性分析，为大规模语言模型的训练优化提供全面的技术指导。

# 数据采集 # 人工智能 # 自然语言处理 # 监控 # 调度

aliyun9170107523-43660

|

1月前

|

博文

|

来自： ModelScope模型即服务

122_集群管理：Slurm配置 - 优化大规模训练调度

在2025年，大规模语言模型（LLM）的训练已经进入到超大规模时代，模型参数量达到数千亿甚至万亿级别，训练过程需要动用数百甚至数千个GPU/TPU。在这种情况下，高效的集群管理系统成为训练成功的关键基础设施。Slurm（Simple Linux Utility for Resource Management）作为目前最流行的开源作业调度系统，广泛应用于科研机构和大型科技公司的超级计算集群中。

# 监控 # Cloud Native # 网络性能优化 # 调度 # 异构计算

aliyun9170107523-43660

|

1月前

|

博文

|

来自： ModelScope模型即服务

123_自监督任务变体：Causal LM详解 - GPT-style下一词预测机制与训练优化

2025年，自监督学习已成为大型语言模型（LLM）训练的核心范式，其中因果语言建模（Causal Language Modeling, CLM）作为GPT系列模型的基础训练目标，展现出了卓越的生成能力和下游任务迁移性能。与掩码语言建模（Masked Language Modeling, MLM）不同，因果语言建模专注于预测序列中的下一个词元，这种训练方式自然地适应了自回归生成的需求，为文本生成、对话系统等任务奠定了坚实基础。

# 机器学习/深度学习 # 人工智能 # 自然语言处理 # 搜索推荐 # 调度

aliyun9170107523-43660

|

1月前

|

博文

|

来自： ModelScope模型即服务

128_自我监督变体：SimCLR for Text - 推导对比学习的文本应用，代码实现无标注预训练的独特目标

在大型语言模型快速发展的今天，自我监督学习已成为训练高质量模型的核心技术。然而，传统的掩码语言建模（MLM）和因果语言建模（CLM）方法存在一些局限性，如计算效率低下和上下文利用不充分等问题。对比学习作为一种新兴的自我监督学习范式，通过学习相似性和差异性来提取数据的内在表示，为语言模型预训练提供了新的思路。

# 数据采集 # 自然语言处理 # 并行计算 # 调度 # 知识图谱

aliyun9170107523-43660

|

1月前

|

博文

|

来自： ModelScope模型即服务

90_推理优化：性能调优技术

随着大型语言模型（LLM）规模的不断扩大和应用场景的日益复杂，推理性能已成为制约模型实际部署和应用的关键因素。尽管大模型在各项任务上展现出了令人惊艳的能力，但其庞大的参数量和计算需求也带来了严峻的性能挑战。在资源受限的环境中，如何在保持模型效果的同时，最大化推理性能，成为了研究人员和工程师们亟待解决的核心问题。

# 机器学习/深度学习 # 缓存 # 并行计算 # 调度 # 异构计算

aliyun9170107523-43660

|

1月前

|

博文

|

来自： ModelScope模型即服务

77_自动化脚本：Makefile与Airflow

在当今AI大模型时代，高效的工作流管理对于模型训练、推理和部署至关重要。随着大模型规模的不断增长和复杂度的提升，传统的手动脚本管理方式已无法满足需求。自动化脚本和工作流调度系统成为构建健壮、可重复、可扩展的LLM Pipeline的关键工具。其中，Makefile作为经典的自动化构建工具，与Airflow作为现代工作流调度平台的结合，为LLM开发团队提供了强大的工作流管理能力。

# 人工智能 # 监控 # Kubernetes # 调度 # 容器

aliyun9170107523-43660

|

1月前

|

博文

24_BERT模型详解：从预训练到微调的全方位指南

BERT（Bidirectional Encoder Representations from Transformers）是由Google AI在2018年推出的革命性预训练语言模型，它彻底改变了自然语言处理（NLP）领域的格局。通过创新的双向训练方式，BERT能够捕捉词语在上下文环境中的完整语义信息，从而在各种下游任务中取得了突破性的表现。

# 人工智能 # 自然语言处理 # 调度 # AI芯片 # SEO

aliyun9170107523-43660

|

1月前

|

博文

|

来自： ModelScope模型即服务

59_实时性模型：选择低延迟LLM

在当今快速发展的人工智能领域，大型语言模型（LLM）的应用正迅速渗透到各个行业。随着企业对AI响应速度的要求不断提高，低延迟LLM的选择与优化已成为技术团队面临的关键挑战。实时聊天机器人、智能客服、自动驾驶辅助系统等场景对响应时间提出了极高的要求，毫秒级的延迟差异可能直接影响用户体验和业务效率。2025年，随着推理优化技术的突破性进展，低延迟LLM已不再是难以企及的目标，而是成为实际生产环境中的标准配置。

# 缓存 # 人工智能 # 并行计算 # 调度 # 异构计算

aliyun9170107523-43660

|

1月前

|

博文

|

来自： ModelScope模型即服务

70_大模型服务部署技术对比：从框架到推理引擎

在2025年的大模型生态中，高效的服务部署技术已成为连接模型能力与实际应用的关键桥梁。随着大模型参数规模的不断扩大和应用场景的日益复杂，如何在有限的硬件资源下实现高性能、低延迟的推理服务，成为了所有大模型应用开发者面临的核心挑战。

# 缓存 # API # 调度 # 异构计算 # Python

aliyun9170107523-43660

|

1月前

|

博文

36_T5与编码器-解码器架构

T5（Text-to-Text Transfer Transformer）是由Google Research于2019年提出的一种革命性的预训练语言模型。它的核心创新在于提出了一种统一的框架，将所有自然语言处理（NLP）任务都转换为文本到文本的格式，即输入和输出都是文本序列。

# 机器学习/深度学习 # 人工智能 # 自然语言处理 # 数据处理 # 调度

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

调度