异构计算

首页 标签 异构计算
# 异构计算 #
关注
20112内容
万字详解:普通开发者如何用Ollama、llama.cpp把大模型无缝跑在本地消费级显卡上?
本文详解普通开发者如何用Ollama与llama.cpp,将7B–14B大模型高效部署于本地消费级显卡(如RTX 4060 8GB)。涵盖显存评估、量化原理(Q4_K_M等)、一键运行与精细调优、避坑指南及跨平台(CUDA/ROCm/Metal)实测数据,助你零成本、高隐私、离线可用。
|
5小时前
|
C++在科学计算与数值模拟(有限元分析)中的应用
工程仿真(结构力学、流体力学、电磁场)需要解大型偏微分方程组,网格规模可达数千万单元,计算量巨大。
|
10小时前
|
一个高性能、双模式、拓扑感知的量子计算模拟核心库。
NEXUS QUANTUM DEFENSE 是一款高性能Python量子模拟核心库(v1.5.0),首创“惰性求值+双模式引擎”:纯态用高效态矢量,遇噪声自动切换至密度矩阵模式;支持CPU并行、CuPy GPU加速及拓扑感知API,零依赖轻量部署。
|
13小时前
| |
大模型应用:大模型实测对比:1.8B vs 6B,本地部署的极限拉扯与真实体感.119
本文对比Qwen1.5-1.8B与ChatGLM2-6B两大中文大模型:前者轻量易部署,CPU即可运行,代码简洁,但易幻觉、指令遵循弱;后者参数量大,中文理解与逻辑更强,但需GPU、加载复杂。二者代表“小而美”与“大而全”的典型路径。
|
22小时前
| |
从软件订阅到基础设施计费:AI双轨制如何破解包月制成本错配困局
本文剖析AI订阅制的结构性困局——固定月费难承浮动算力成本,导致限速、降智与用户信任崩塌。提出“双轨制”(存算分离)新范式:存储轨按月固定收费,保障对话记忆永续;算力轨按Token用量计费,谁用谁付。借鉴电信“月租+流量”逻辑,实现公平、透明、可迁移的基础设施级计费。
|
1天前
| |
来自: 云原生
Linux 多发行版 远程桌面踩坑总结:Deepin / openKylin / Ubuntu 实战记录
本文详述TigerVNC在Ubuntu 26.04、Deepin 20.9/23.9及openKylin 2.0 SP2四大发行版的适配实践,重点解决Wayland/X11冲突、DBus、输入法、DDE兼容等痛点,最终推荐「deepin」为最稳定方案。(239字)
LLM 训练能不能少跑一点?Nous Research 的 TST 方法
Nous Research提出Token-Superposition Training(TST),一种不改模型架构、分词器、优化器或推理形式的预训练加速方法:训练前期将连续token平均为“叠加token”并预测下一组token,提升单位算力的数据吞吐;后期切回标准自回归训练。实验显示,在10B-A1B模型上可达2.5倍训练加速,显著降低GPU小时消耗。
终端里跑 3D 老鼠,桌面窗口成摆锤;AI 大佬新公司估值百亿起
上周技术圈的信息挺杂,但有几条线索值得放在一起看。 一边,AI 产品继续往具体工作流里走:Claude Code 开始支持 Agent View,OpenAI 把 Codex 带到移动端;另一边,开发者社区继续整活:有人给 Claude Code 做实体旋钮,有人做 Claude 用量桌面仪表盘,还有人把终端做成能显示 3D 老鼠的玩具。
|
1天前
| |
来自: 弹性计算
2026年阿里云便宜云服务器推荐与选购指南
2026年阿里云推出史上最强优惠:打破新老用户壁垒,实现“新老同价、续费同价”。99元/年e实例、199元/年u1实例长期稳定;新用户可抢38元/年轻量服务器;企业享百万迁云补贴与GPU 4折。省钱避坑指南,助你轻松上云!
|
1天前
| |
来自: 弹性计算
2026阿里云服务器选购省钱攻略:优惠活动、配置规划与购买策略
2026年阿里云服务器省钱选购策略:首先,阿里云产品线丰富,涵盖ECS云服务器、轻量应用服务器及GPU云服务器等,用户需根据业务场景精准匹配。其次,充分利用优惠活动可大幅降低成本,包括新用户首购折扣、限时秒杀(如轻量服务器低至38元/年)及免费试用等。在配置规划上,应基于实际需求评估CPU、内存、存储等资源,并预留扩展空间。此外,合理运用预留实例和竞价实例、选择长期包年包月付费方式,以及关注"99计划"等长效优惠,均能有效控制成本,实现资源利用与成本控制的最优平衡。
免费试用