GPU云服务器的搜索结果_文章_第4页-阿里云开发者社区

楠竹11

|

11天前

|

博文

【10月更文挑战第19天】中国科学院计算技术研究所提出了一种名为LLaMA-Omni的新型模型架构，实现与大型语言模型（LLMs）的低延迟、高质量语音交互。该模型集成了预训练的语音编码器、语音适配器、LLM和流式语音解码器，能够在不进行语音转录的情况下直接生成文本和语音响应，显著提升了用户体验。实验结果显示，LLaMA-Omni的响应延迟低至226ms，具有创新性和实用性。

# GPU云服务器 # 智能语音交互 # 智能语音交互 # 人工智能 # 语音技术 # UED # 异构计算

小陈写代码

|

11天前

|

博文

|

来自：弹性计算

2024阿里云双11金秋云创季活动相关内容简介：云上盛惠，助力企业数字化转型

在这个金秋时节，阿里云迎来了盛大的2024年双11金秋云创季活动，为企业和个人用户带来了一场前所未有的云上盛惠。从新迁入云的5亿算力补贴，到AI 算力云产品的直降85%，再到金秋上云礼包的抢先领取，阿里云双11金秋云创季活动以一系列优惠政策，助力企业轻松上云，加速数字化转型。

# 实人认证 # GPU云服务器 # 机器学习/深度学习 # 人工智能 # 双11 # 云计算 # 异构计算

jianz123

|

15天前

|

博文

提高 PyTorch 性能

提高 PyTorch 是一个非常流行的深度学习框架，它支持动态计算图，非常适合快速原型设计和研究。

# GPU云服务器 # 机器学习/深度学习 # 并行计算 # PyTorch # 算法框架/工具 # 异构计算

Deephub

|

17天前

|

博文

|

来自：大数据与机器学习

梯度累积的隐藏陷阱：Transformer库中梯度累积机制的缺陷与修正

在本地微调大规模语言模型时，由于GPU显存限制，通常采用梯度累积技术来模拟大批次训练。然而，实际研究表明，梯度累积方法在主流深度学习框架中会导致模型性能显著下降，尤其是在多GPU环境中。本文详细探讨了梯度累积的基本原理、应用场景及存在的问题，并通过实验验证了修正方案的有效性。研究指出，该问题可能在过去多年中一直存在且未被发现，影响了模型的训练效果。

# GPU云服务器 # 机器学习/深度学习 # 存储 # 人工智能 # 数据挖掘 # 异构计算

叫做饺子

|

17天前

|

博文

《触手可及，函数计算玩转 AI 大模型》

# GPU云服务器 # 函数计算 # 人工智能 # 运维 # Serverless # 云计算 # 异构计算

wljslmz

|

17天前

|

博文

保姆级教程！教你如何基于deepgpu-llm和fastchat快速搭建通义千问web在线服务

【10月更文挑战第13天】

# 客服工作台 # 云服务器 ECS # GPU云服务器 # 网络安全 # 开发工具 # 数据安全/隐私保护 # git # 异构计算

sp_fyf_2024

|

18天前

|

博文

【深度学习】经典的深度学习模型-01 开山之作：CNN卷积神经网络LeNet-5

# GPU云服务器 # 机器学习/深度学习 # 编解码 # 算法 # 计算机视觉 # 异构计算

阿里云存储

|

18天前

|

博文

|

来自：云存储

OSS 深度解析：Data + AI 时代的对象存储

在 Data + AI 时代，随着大数据分析和 AI/ML 工作负载的进一步融合，对象存储 OSS 作为面向 AI 时代的数据基础设施，迎来了新的挑战与创新机遇。本话题我们将会介绍对象存储的能力创新，深度解读对象存储在实现稳定、安全、高性能和低成本背后的技术进展，并展望未来 AI 驱动趋势下的技术发展方向。

# 对象存储 # 云解析DNS # 云服务器 ECS # GPU云服务器 # 内容安全 # 私网连接 # 存储 # 人工智能 # 安全 # 网络性能优化 # 对象存储

sp_fyf_2024

|

18天前

|

博文

[大语言模型-算法优化] 微调技术-LoRA算法原理及优化应用详解

# GPU云服务器 # 机器学习/深度学习 # 人工智能 # 算法 # 物联网 # 异构计算

sp_fyf_2024

|

18天前

|

博文

[大语言模型] LINFUSION：1个GPU，1分钟，16K图像

# GPU云服务器 # 机器学习/深度学习 # 编解码 # 自然语言处理 # 算法 # 异构计算

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

GPU云服务器