GPU云服务器

首页 标签 GPU云服务器
# GPU云服务器 #
关注
7000内容
社区供稿 | 10G显存,通义千问-7B-int4消费级显卡最佳实践
在魔搭社区,通义千问团队发布了Qwen-7B-Chat的Int4量化模型,Qwen-7B-Chat-Int4。该方案的优势在于,它能够实现几乎无损的性能表现,模型大小仅为5.5GB,内存消耗低,速度甚至超过BF16。
阿里云郑晓:浅谈GPU虚拟化技术(第二章)
注:本系列第一章推送门:阿里云郑晓:浅谈GPU虚拟化技术(第一章) GPU虚拟化发展史 第二章 GPU虚拟化方案之——GPU直通模式 目前流行的商用GPU虚拟化方案可以分为以下几类:GPU 直通模式,GPU SRIOV 模式,GPU 半虚拟化(mediated passthrough:包括Intel GVT-g和Nvidia GRID vGPU),VMWare的GPU全虚拟化(vSGA)。
阿里巴巴集群追踪计划Alibaba Cluster Trace Program
在阿里巴巴集群追踪程序是由阿里巴巴集团出版。通过提供来自实际生产的集群跟踪,该计划帮助研究人员、学生和对该领域感兴趣的人更好地了解现代互联网数据中心 (IDC) 的特征和工作负载。
黄仁勋全面解读英伟达发展战略:打造面向未来的AI技术平台
9 月 26 日,英伟达 GTC 大会中国站在北京开幕。在大会第一天上午的 Keynote 中,英伟达 CEO 黄仁勋介绍了 TensorRT 3.0、全新机器智能芯片 Xavier 等新产品(详见:英伟达 GTC 中国站开幕:宣布 TensorRT3、自动机器处理器 Xavier)。随着计算机硬件和人工智能技术的发展,整个科技产业的基础正在被颠覆,大数据和深度学习正在影响着我们。在大会上,黄仁勋也为我们介绍了英伟达近期的发展战略。
免费试用