GPU云服务器的搜索结果_文章_第2页-阿里云开发者社区

Deephub

|

1月前

|

博文

|

来自：大数据与机器学习

MXFP4量化：如何在80GB GPU上运行1200亿参数的GPT-OSS模型

GPT-OSS通过MXFP4量化技术实现1200亿参数模型在单个80GB GPU上的高效运行，将权重压缩至每参数4.25位，大幅降低内存需求，同时保持高精度和竞争力的基准性能，为大规模模型部署提供了新思路。

# GPU云服务器 # 对象存储 # 存储 # 机器学习/深度学习 # 人工智能 # 网络架构 # 异构计算

技术员阿伟

|

1月前

|

博文

《WebGPU资源同步屏障效率提升10大实用技巧》

本文针对前端WebGPU资源同步屏障的效率优化，提出10个实用技巧。从精准匹配屏障类型、合并相邻屏障，到利用子资源范围缩小同步域、延迟屏障触发以并行执行无依赖任务，再到避免跨队列屏障、复用参数、按资源生命周期调整策略等，覆盖同步设计、资源管理、硬件适配多维度。同时强调通过监控屏障耗时定位瓶颈，结合硬件特性差异化适配。这些技巧需结合应用场景灵活组合，核心是在数据安全与GPU性能释放间找平衡，为前端WebGPU应用（如3D渲染、AI推理）突破性能瓶颈提供技术支撑，也深化对WebGPU底层并行模型的理解。

# GPU云服务器 # 人工智能 # 监控 # 前端开发 # 开发者 # 异构计算

Deephub

|

1月前

|

博文

|

来自：大数据与机器学习

JAX快速上手：从NumPy到GPU加速的Python高性能计算库入门教程

JAX是Google开发的高性能数值计算库，旨在解决NumPy在现代计算需求下的局限性。它不仅兼容NumPy的API，还引入了自动微分、GPU/TPU加速和即时编译（JIT）等关键功能，显著提升了计算效率。JAX适用于机器学习、科学模拟等需要大规模计算和梯度优化的场景，为Python在高性能计算领域开辟了新路径。

# GPU云服务器 # 机器学习/深度学习 # API # 异构计算 # Python # AI芯片

微服务和网关

|

1月前

|

博文

|

来自：云原生

不增加 GPU，首 Token 延迟下降50%｜LLM 服务负载均衡的新实践

针对LLM服务的特点，Higress AI网关以插件形式提供了面向LLM服务的负载均衡算法，包括全局最小请求数负载均衡、前缀匹配负载均衡以及GPU感知负载均衡，能够在不增加硬件成本的前提下，提升系统的吞吐能力、降低响应延迟，并实现更公平、高效的任务调度。

# GPU云服务器 # 负载均衡 # 负载均衡 # NoSQL # Redis # 异构计算 # Perl

阿里云基础设施.

|

1月前

|

博文

突破算力瓶颈：库存感知下的多地域 GPU 弹性调度

介绍多集群通过基于库存的弹性调度提供了 GPU 在多地域供给问题的解决方案。

# GPU云服务器 # 运维 # 容灾 # 调度 # 异构计算 # 容器

FISSPACE

|

2月前

|

博文

|

来自：大数据与机器学习

《VGSP-C (Virtual GPU Scheduling Platform on CPU)：基于CPU的虚拟GPU调度平台》

VGSP-C（基于CPU的虚拟GPU调度平台）提出通过“软仿真+并行调度+多机协同”三大路径，在普通CPU上模拟GPU并行计算行为。适用于资源受限或低成本场景，支持单机推理、分布式训练与极简CPU集群部署，提供统一编程接口与弹性扩展能力，助力AI普惠与算力再平衡。

# GPU云服务器 # 人工智能 # 缓存 # 并行计算 # 调度 # 异构计算

Deephub

|

2月前

|

博文

|

来自：大数据与机器学习

构建高性能LLM推理服务的完整方案：单GPU处理172个查询/秒、10万并发仅需15美元/小时

本文将通过系统性实验不同的优化技术来构建自定义LLaMA模型服务，目标是高效处理约102,000个并行查询请求，并通过对比分析确定最优解决方案。

# GPU云服务器 # 缓存 # 异构计算 # Docker # 容器 # Perl

阿里云云原生

|

2月前

|

博文

|

来自：云原生

GPU 降成本免运维，睿观 AI 助手选择函数计算

从跨境电商 ERP 到“睿观 AI 助手”，阿里云函数计算的支持下，深圳三态股份利用 AI 技术快速完成专利、商标、版权等多维度的侵权风险全面扫描。结合函数计算实现弹性算力支持，降低成本并提升效率，实现业务的快速发展。

# GPU云服务器 # 函数计算 # 人工智能 # 运维 # Serverless # 开发者 # 异构计算

程序元宝

|

3月前

|

博文

模型被挤了？立即查看服务器GPU/CPU占用，别再误杀他人进程！

模型在服务器上跑得好好的，突然就“卡”了甚至被挤掉？别急着抱怨！本文手把手教你如何优雅地查看共享服务器的CPU和GPU占用情况，学会做一个有素质的“共享玩家”，告别模型被挤的尴尬！文末还有硬核忠告和Linux学习建议。

# GPU云服务器 # Prometheus # 监控 # 数据可视化 # Linux # 异构计算

技术员阿伟

|

3月前

|

博文

《深入解析：如何通过CSS集成WebGPU实现高级图形效果》

CSS与WebGPU的结合，如同规则与力量的完美交融，在虚拟空间中编织出超越现实的数字灵境。CSS以细腻笔触塑造秩序与美学，WebGPU则注入磅礴算力，打破物理限制，创造沉浸式体验。两者共生，让网页图形艺术突破边界：导航栏化为液态金属，图片如清泉流淌，多维空间交织奇幻景象。通过传感技术和AI算法，图形可感知用户情绪并实时响应，带来深度情感共鸣。开发者成为数字世界的建筑师与艺术家，将创意转化为鲜活的虚拟现实，重新定义人与数字空间的互动方式。这是一场技术与艺术的跨界革命，开启无限可能的未来创作范式。

# 云解析DNS # GPU云服务器 # 人工智能 # 前端开发 # 算法 # vr&ar # 开发者

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

GPU云服务器