并行计算

首页 标签 并行计算
# 并行计算 #
关注
5304内容
|
8小时前
|
LMCache:基于KV缓存复用的LLM推理优化方案
LMCache推出KV缓存持久化方案,显著优化大模型推理首Token延迟(TTFT)。通过将KV缓存存储至GPU、CPU或磁盘,实现跨请求复用,支持任意位置文本匹配,与vLLM深度集成,多轮对话、RAG场景提速3-10倍,降低硬件压力,提升吞吐。开源支持Linux/NVIDIA,正拓展AMD及更多生态支持。
|
3天前
|
openEuler操作系统环境:目标检测软件开发实操与性能评估
本文系统研究了在openEuler 22.03 LTS SP3上基于YOLOv8实现鸟类目标检测的全流程,涵盖环境搭建、模型训练、性能优化与容器化部署。实验表明,openEuler凭借内核优化与异构计算支持,在GPU加速下推理速度达142 FPS,资源占用降低18%以上,展现出卓越的AI任务处理能力。
基于卡尔曼滤波的锂离子电池剩余电量估算
基于卡尔曼滤波的锂离子电池剩余电量(SOC)估算的方案,结合等效电路模型与自适应优化策略
|
5天前
|
包年包月、按量付费和抢占式实例有什么区别?阿里云ECS付费类型如何选择?
阿里云ECS提供三种付费模式:包年包月适合长期稳定使用,价格优惠且支持备案;按量付费按小时计费,灵活但成本较高,适合短期或突发业务;抢占式实例价格低至1折,但可能被释放,仅推荐用于无状态应用。根据业务需求选择合适模式可优化成本与稳定性。
|
6天前
| |
来自: 云原生
为什么别人用 DevPod 秒启 DeepSeek-OCR,你还在装环境?
DevPod 60秒极速启动,一键运行DeepSeek OCR大模型。告别环境配置难题,云端开箱即用,支持GPU加速、VSCode/Jupyter交互开发,重塑AI原生高效工作流。
|
6天前
|
毅硕HPC | 在HPC集群上优雅地使用conda
通过本教程,你将掌握在HPC集群中从零开始部署并高效利用Conda的核心技能。为你的课题创建一个干净的environment.yml文件,让你的科研计算之旅更加规范、高效和可复现。
|
11天前
|
产业布局:黄仁勋“左脚踩右脚”,马斯克“铁索连环船”,谁更创新?
法思诺创新学院聚焦科技战略前沿,深度解析马斯克“全栈自研”与黄仁勋“生态赋能”两大技术路线。通过“铁索连环船”与“左脚踩右脚”生动类比,揭示企业如何在控制与杠杆间抉择,构建可持续创新的技术地图,助力未来领军者破局增长。
Lab4AI Q&A 第一期:Flash Attention 安装 OOM、文件上传失败?解决方法在这
Lab4AI大模型实验室是专注高性能GPU算力的实操平台与社区。本文整理了5大常见问题:Flash Attention安装OOM解决方案、FileZilla上传失败处理、文件权限错误、数据集上传限制及多实例通信方法,助您高效使用平台资源,提升开发效率。
|
13天前
|
Python解析NC格式文件全攻略:从基础到实战
本文系统介绍NetCDF(NC)文件的解析与应用,涵盖其结构、常用工具(netCDF4、xarray、Dask)、核心操作及性能优化方法,结合气象、台风分析等实战案例,助力高效处理海量气候数据,适用于地球科学研究与大数据分析。
免费试用