异构计算的搜索结果_第12页-阿里云开发者社区

Deephub

|

1月前

|

博文

|

来自：大数据与机器学习

vLLM推理加速指南：7个技巧让QPS提升30-60%

GPU资源有限，提升推理效率需多管齐下。本文分享vLLM实战调优七招：请求塑形、KV缓存复用、推测解码、量化、并行策略、准入控制与预热监控。结合代码与数据，助你最大化吞吐、降低延迟，实现高QPS稳定服务。

# 缓存 # 运维 # 监控 # API # 异构计算

DuHz

|

1月前

|

博文

|

来自：物联网

一种基于连续相位频移键控的高效频谱利用新型雷达信号——论文阅读

本文提出一种基于连续相位频移键控（CPFSK）的新型雷达信号设计方法，通过确保频率切换时相位连续，有效抑制频谱旁瓣与能量泄漏。相比传统FSK信号，该方法在不牺牲脉冲压缩性能的前提下，实现旁瓣降低约20dB，显著提升频谱利用效率，适用于复杂电磁环境下的高性能雷达系统。

# 编解码 # 人工智能 # 数据建模 # 异构计算

游客lr655r7wycjc4

|

1月前

|

博文

阿里云无影云电脑具体价格：个人版、企业版和免费云电脑配置介绍

阿里云无影云电脑2025年最新价格：企业版4核8G低至199元/年，支持办公与设计；个人版分黄金到黑金多款，月费14元起，适配云游戏与AI办公。含GPU高配机型，另享免费试用。

# 人工智能 # 弹性计算 # 安全 # 小程序 # 异构计算

sysin

|

1月前

|

博文

VMware ESXi 9.0.1.0 发布 - 领先的裸机 Hypervisor

# 存储 # 虚拟化 # 异构计算 # Windows # 内存技术

aliyun9170107523-43660

|

1月前

|

博文

|

来自： ModelScope模型即服务

142_故障容错：冗余与回滚机制 - 配置多副本的独特健康检查

在大语言模型（LLM）的生产环境部署中，系统的可靠性和稳定性至关重要。随着LLM应用场景的不断扩展，从简单的文本生成到复杂的多模态交互，用户对服务可用性和响应质量的要求也日益提高。据2025年最新的AI服务可用性报告显示，顶级AI服务提供商的SLA（服务级别协议）承诺已达到99.99%，这意味着每年的计划外停机时间不得超过52.56分钟。

# 运维 # 监控 # 异构计算 # 容器 # Perl

aliyun9170107523-43660

|

1月前

|

博文

|

来自： ModelScope模型即服务

119_LLM训练的高效内存管理与优化技术：从ZeRO到Flash Attention

大型语言模型（LLM）的训练面临着前所未有的计算和内存挑战。随着模型规模达到数百亿甚至数千亿参数，高效的内存管理成为训练成功的关键因素之一。2025年，LLM训练的内存优化技术已经取得了显著进展，从ZeRO优化器到Flash Attention等创新技术，为训练超大规模模型提供了可能。

# 存储 # 机器学习/深度学习 # PyTorch # 异构计算 # 内存技术

aliyun9170107523-43660

|

1月前

|

博文

|

来自： ModelScope模型即服务

118_LLM模型量化与压缩：从理论到2025年实践技术详解

大型语言模型（LLM）在自然语言处理领域取得了前所未有的成功，但模型规模的快速增长带来了巨大的计算和存储挑战。一个典型的大型语言模型（如GPT-4或LLaMA 3）可能包含数千亿甚至万亿参数，需要数百GB甚至TB级的存储空间，并且在推理时需要大量的计算资源。这种规模使得这些模型难以在边缘设备、移动设备甚至资源有限的云服务器上部署和使用。

# 机器学习/深度学习 # PyTorch # 算法框架/工具 # 异构计算 # AI芯片

aliyun9170107523-43660

|

1月前

|

博文

|

来自： ModelScope模型即服务

109_噪声鲁棒微调：对抗训练

在当今大语言模型（LLM）的广泛应用中，模型的鲁棒性问题日益凸显。对抗性攻击通过在输入中添加微小但精心设计的扰动，能够误导模型产生错误输出，这对依赖LLM的关键系统构成了严重威胁。噪声鲁棒微调作为提升模型抵抗对抗攻击能力的重要技术，正成为大模型安全性研究的核心方向之一。

# 存储 # 自然语言处理 # 算法 # 调度 # 异构计算

aliyun9170107523-43660

|

1月前

|

博文

|

来自： ModelScope模型即服务

138_绿色计算：碳排放优化 - 估算部署的碳足迹与LLM环境友好型部署最佳实践

随着大语言模型(LLM)在各个行业的广泛应用，其计算需求和环境影响正日益受到关注。根据最新研究，训练一个大型LLM模型可能产生数百吨二氧化碳当量的排放，这相当于普通家庭几十年的碳足迹。在全球气候变化和可持续发展的背景下，如何优化LLM部署的碳足迹，实现环境友好型AI应用，已成为行业面临的重要挑战。

# 存储 # 人工智能 # 数据中心 # 异构计算 # Python

aliyun9170107523-43660

|

1月前

|

博文

|

来自： ModelScope模型即服务

139_剪枝优化：稀疏模型压缩 - 分析结构化剪枝的独特速度提升与LLM部署加速实践

随着大语言模型(LLM)规模的不断增长，模型参数量已从最初的数亿扩展到数千亿甚至万亿级别。这种规模的模型在推理过程中面临着巨大的计算和内存挑战，即使在最先进的硬件上也难以高效部署。剪枝优化作为一种有效的模型压缩技术，通过移除冗余或不重要的参数，在保持模型性能的同时显著减少计算资源需求。

# 机器学习/深度学习 # 缓存 # 监控 # 算法 # 异构计算

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

异构计算