异构计算的搜索结果-阿里云开发者社区

Deephub

|

博文

|

You Only Cache Once:YOCO 基于Decoder-Decoder 的一个新的大语言模型架构

YOCO是一种新的解码器-解码器架构，旨在解决大型语言模型推理时的内存限制问题。通过只缓存一次键值对，YOCO显著减少了GPU内存占用，与Transformer相比，内存使用降低了约L倍。模型由自解码器和交叉解码器组成，自解码器使用滑动窗口注意力，而交叉解码器利用全局KV缓存。实验表明，YOCO在保持竞争力的性能同时，提高了推理速度，尤其是在处理长序列时。此外，YOCO还减少了预填充时间，提升了吞吐量。

# 存储 # 缓存 # 分布式计算 # 异构计算

LabVIEW开发

|

1小时前

|

博文

LabVIEW压电驱动迟滞补偿控制

# 监控 # 算法 # 定位技术 # 异构计算

LabVIEW开发

|

1小时前

|

博文

LabVIEW轨道交通列车牵引制动试验平台

# 传感器 # 数据采集 # 算法 # 数据可视化 # 异构计算

LabVIEW开发

|

2小时前

|

博文

LabVIEW开发远程结构健康监测系统

# 存储 # 传感器 # 异构计算

LabVIEW开发

|

2小时前

|

博文

LabVIEW发开发电状态监测系统

# 数据采集 # 运维 # 监控 # 网络协议 # 异构计算

LabVIEW开发

|

2小时前

|

博文

LabVIEW开发自适应降噪ANC

# 传感器 # 异构计算

LabVIEW开发

|

3小时前

|

博文

LabVIEW多通道数据采集系统

# 数据采集 # 存储 # 数据处理 # 芯片 # 异构计算

楠竹11

|

3小时前

|

博文

论文介绍：Mamba：线性时间序列建模与选择性状态空间

【5月更文挑战第11天】Mamba是新提出的线性时间序列建模方法，针对长序列处理的效率和内存问题，采用选择性状态空间模型，只保留重要信息，减少计算负担。结合硬件感知的并行算法，优化GPU内存使用，提高计算效率。Mamba在多种任务中展现出与Transformer相当甚至超越的性能，但可能不适用于所有类型数据，且硬件适应性需进一步优化。该模型为长序列处理提供新思路，具有广阔应用前景。[论文链接](https://arxiv.org/abs/2312.00752)

# 存储 # 人工智能 # 自然语言处理 # 算法 # 异构计算

肥猪肥猪-17824

|

6小时前

|

博文

构建高效AI系统：深度学习优化技术解析

【5月更文挑战第12天】随着人工智能技术的飞速发展，深度学习已成为推动创新的核心动力。本文将深入探讨在构建高效AI系统中，如何通过优化算法、调整网络结构及使用新型硬件资源等手段显著提升模型性能。我们将剖析先进的优化策略，如自适应学习率调整、梯度累积技巧以及正则化方法，并讨论其对模型训练稳定性和效率的影响。文中不仅提供理论分析，还结合实例说明如何在实际项目中应用这些优化技术。

# 机器学习/深度学习 # 人工智能 # 算法 # 决策智能 # 异构计算

LabVIEW开发

|

19小时前

|

博文

LabVIEWL实现鸟巢等大型结构健康监测

# 传感器 # 存储 # 定位技术 # 数据中心 # 异构计算