并行计算

首页 标签 并行计算
# 并行计算 #
关注
5421内容
|
1小时前
| |
InCoder-32B开源:320亿参数工业代码基座,保住通用代码能力,工业代码全线领先
北航联合发布InCoder-32B工业代码大模型,专攻芯片设计、GPU内核、嵌入式、编译器与3D建模等硬核领域。基于250万条真实执行验证数据训练,全量权重开源,通用能力不降反升,多项工业基准大幅领先。
|
2小时前
| |
大模型应用:大模型运行全流程解析:从初始化加载→计算→结果输出.69
本文系统解析大模型推理全流程:从硬盘加载权重、CPU内存预处理、GPU显存计算,到自回归生成与自然语言解码。涵盖硬件协同(硬盘→内存→GPU)、软件步骤(分词、注意力、采样、后处理)及资源调度优化,揭示其软硬协同的本质。
|
2小时前
|
支付宝余额在线生成器,数值提交引擎Rust-GPU处理器
该项目为支付在线生成器引擎,采用Rust语言开发并利用GPU进行高效数据处理,旨在快速生成支付相关数据与验证码。
|
3小时前
|
股票交割单生成器下载,交割单生成器CUDA实现
基于CUDA的交通灯倒计时生成器,利用GPU并行计算能力,实时生成高精度交通信号灯时序方案,技术栈包括CUDA、C++及并行优化算法。
|
3小时前
|
微信自定义余额,数值计算OpenCL并行引擎
该项目基于OpenCL并行计算框架开发,用于微信自定义数据的快速处理与分析,主要技术栈包括OpenCL并行编程、C++核心逻辑及数据预处理模块。
|
18小时前
|
股票盈亏截图,并行计算OpenCL数值快照
该项目基于OpenCL技术构建并行计算库,用于加速图形处理与科学计算,支持跨平台高性能运算。
|
19小时前
|
基于神经网络的YOLO目标检测算法
基于神经网络的YOLO目标检测算法在C语言中的实现需要结合深度学习框架的底层优化与硬件加速技术。
|
2天前
| |
大模型应用:GPU的黑盒拆解:可视化看透大模型并行计算的底层逻辑.67
本文深入解析GPU核心架构与大模型算力优化原理,涵盖SM流式多处理器、显存、显存控制器、PCIe接口等关键组件,详解线程级/指令级并行及张量核心加速机制,并通过全流程耗时分析与任务拆分可视化,揭示“数据传输是主要瓶颈”的核心结论,助力高效部署大模型。
|
3天前
| |
大模型应用:多卡集群跑满14B模型:大模型推理算力应用实践.66
本项目面向10台RTX 4090集群,优化Qwen-14B大模型推理:通过NF4量化压缩显存、动态批处理(基于Amdahl定律)提升GPU利用率至85%+、多卡模型并行均衡负载,解决卡顿、显存溢出与调度不均问题,支撑日均10万次高并发稳定服务。
|
3天前
|
C++在人工智能与机器学习中的应用——当传统语言拥抱新浪潮
人工智能和机器学习正在重塑世界,而C++正在这个浪潮中扮演着关键角色。虽然Python在AI研究和原型开发中占据主导地位,但在模型训练、推理部署、框架底层、边缘AI等高性能场景中,C++是不可替代的力量。本文将深入探讨C++在人工智能领域的各种应用。
免费试用