PyTorch的搜索结果_文章_第17页-阿里云开发者社区

Deephub

|

8月前

|

博文

|

PyTorch团队推出创新技术，在其低精度计算库TorchAO中引入低位运算符支持，实现1至8位精度的嵌入层权重量化及8位动态量化激活的线性运算符。该技术通过模块化设计和高效硬件利用，优化了资源受限环境下的深度学习计算，提升了计算效率并降低了资源消耗。新内核与PyTorch生态系统无缝集成，支持即时执行、编译优化及边缘计算，为开发者提供全方位性能优势。测试结果显示，多层次量化策略显著提升了计算效率，保持了模型精度。这一突破为深度学习框架优化开辟了多个研究方向，推动了人工智能在边缘计算等领域的广泛应用。

# 机器学习/深度学习 # 边缘计算 # PyTorch # 算法框架/工具 # 开发者

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

SPRIGHT：提升文本到图像模型空间一致性的数据集

SPRIGHT 是一个专注于空间关系的大型视觉-语言数据集，通过重新描述600万张图像，显著提升文本到图像模型的空间一致性。

# 视觉智能开放平台 # 人工智能 # 并行计算 # PyTorch # 算法框架/工具 # vr&ar

Deephub

|

8月前

|

博文

|

来自：大数据与机器学习

面向强化学习的状态空间建模：RSSM的介绍和PyTorch实现

循环状态空间模型（Recurrent State Space Models, RSSM）由 Danijar Hafer 等人提出，是现代基于模型的强化学习（MBRL）中的关键组件。RSSM 旨在构建可靠的环境动态预测模型，使智能体能够模拟未来轨迹并进行前瞻性规划。本文介绍了如何用 PyTorch 实现 RSSM，包括环境配置、模型架构（编码器、动态模型、解码器和奖励模型）、训练系统设计（经验回放缓冲区和智能体）及训练器实现。通过具体案例展示了在 CarRacing 环境中的应用，详细说明了数据收集、训练过程和实验结果。

# 机器学习/深度学习 # 存储 # 数据管理 # PyTorch # 算法框架/工具

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

VITRON：开源像素级视觉大模型，同时满足图像与视频理解、生成、分割和编辑等视觉任务

VITRON 是由 Skywork AI、新加坡国立大学和南洋理工大学联合推出的像素级视觉大模型，支持图像与视频的理解、生成、分割和编辑，适用于多种视觉任务。

# 视觉智能开放平台 # 人工智能 # 自然语言处理 # 并行计算 # 前端开发 # PyTorch

Deephub

|

8月前

|

博文

|

来自：大数据与机器学习

PyTorch FlexAttention技术实践：基于BlockMask实现因果注意力与变长序列处理

本文介绍了如何使用PyTorch 2.5及以上版本中的FlexAttention和BlockMask功能，实现因果注意力机制与填充输入的处理。通过attention-gym仓库安装相关工具，并详细展示了MultiheadFlexAttention类的实现，包括前向传播函数、因果掩码和填充掩码的生成方法。实验设置部分演示了如何组合这两种掩码并应用于多头注意力模块，最终通过可视化工具验证了实现的正确性。该方法适用于处理变长序列和屏蔽未来信息的任务。

# 机器学习/深度学习 # 数据可视化 # PyTorch # 算法框架/工具 # 索引

Deephub

|

8月前

|

博文

|

来自：大数据与机器学习

深度强化学习中SAC算法：数学原理、网络架构及其PyTorch实现

软演员-评论家算法（Soft Actor-Critic, SAC）是深度强化学习领域的重要进展，基于最大熵框架优化策略，在探索与利用之间实现动态平衡。SAC通过双Q网络设计和自适应温度参数，提升了训练稳定性和样本效率。本文详细解析了SAC的数学原理、网络架构及PyTorch实现，涵盖演员网络的动作采样与对数概率计算、评论家网络的Q值估计及其损失函数，并介绍了完整的SAC智能体实现流程。SAC在连续动作空间中表现出色，具有高样本效率和稳定的训练过程，适合实际应用场景。

# 机器学习/深度学习 # 算法 # PyTorch # 算法框架/工具 # 网络架构

aliyun4381607004

|

8月前

|

博文

|

来自：大数据与机器学习

阿里云PAI-部署Qwen2-VL-72B

阿里云PAI-部署Qwen2-VL-72B踩坑实录

# 容器镜像服务 # GPU云服务器 # 人工智能平台 PAI # 对象存储 # 专有网络VPC # 并行计算 # PyTorch # 算法框架/工具 # Python # 容器

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

AGUVIS：指导模型实现 GUI 自动化训练框架，结合视觉-语言模型进行训练，实现跨平台自主 GUI 交互

AGUVIS 是香港大学与 Salesforce 联合推出的纯视觉 GUI 自动化框架，能够在多种平台上实现自主 GUI 交互，结合显式规划和推理，提升复杂数字环境中的导航和交互能力。

# 图像识别 # 自然语言处理 # 人工智能 # 编解码 # 自然语言处理 # 测试技术 # PyTorch

不要葱姜蒜

|

9月前

|

博文

|

来自：通义大模型

Qwen2.5-7B-Instruct Lora 微调

本教程介绍如何基于Transformers和PEFT框架对Qwen2.5-7B-Instruct模型进行LoRA微调。

# 大模型服务平台百炼 # 搜索推荐 # 物联网 # PyTorch # 算法框架/工具 # Python

弹性计算小冉

|

9月前

|

博文

|

来自：弹性计算

阿里云GPU云服务器怎么样？产品优势、应用场景介绍与最新活动价格参考

阿里云GPU云服务器怎么样？阿里云GPU结合了GPU计算力与CPU计算力，主要应用于于深度学习、科学计算、图形可视化、视频处理多种应用场景，本文为您详细介绍阿里云GPU云服务器产品优势、应用场景以及最新活动价格。

# 云服务器 ECS # GPU云服务器 # 自然语言处理 # 机器学习/深度学习 # 人工智能 # PyTorch # 算法框架/工具 # 异构计算

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

PyTorch