异构计算

首页 标签 异构计算
# 异构计算 #
关注
20126内容
|
2天前
|
2026 年企业 AI Agent 落地:从 Demo 到生产的四个关键跨越
本文剖析AI Agent从Demo到生产落地的四大关键跨越:长时任务支持、多Agent协同、GPU弹性伸缩与全链路可观测性,并结合Google ADK、Anthropic MCP等新协议,给出务实解法与平台选型建议。
|
2天前
|
5 分钟搭建你的第一个 AI Agent:别再说门槛高了
本文介绍阿里云AgentRun平台:无需配置服务器、不装模型,5分钟即可零代码部署AI Agent。支持模板化创建(如编程专家、电商助手)、内置大模型与工具(浏览器/代码解释器),Serverless架构自动扩缩容,流式响应,真正让AI“能动手”执行任务。
|
3天前
|
TraceML:用三行代码为训练循环加入 step 级诊断
TraceML 是专为 PyTorch 训练设计的轻量级诊断工具,无需侵入式改造代码,仅需标记训练 step,即可实时可视化各阶段(数据加载、前向/反向、优化)耗时与内存分布,自动生成结构化 `final_summary.json`,快速定位性能瓶颈——是开启深度 profiling 前的「零号判断工具」。
|
3天前
| |
来自: 视觉智能
ECS GPU 上跑 vLLM:模型目录、镜像和 runtime 排查记录
本文记录ECS GPU环境部署vLLM时“容器运行但服务不ready”的排查过程。聚焦NAS模型挂载、Docker GPU透传、镜像预检、runtime配置及vLLM冷启动分层验证,避免将存储延迟误判为GPU或模型问题,提炼出7项可复用的GPU推理服务上线前检查清单。(239字)
万字详解:普通开发者如何用Ollama、llama.cpp把大模型无缝跑在本地消费级显卡上?
本文详解普通开发者如何用Ollama与llama.cpp,将7B–14B大模型高效部署于本地消费级显卡(如RTX 4060 8GB)。涵盖显存评估、量化原理(Q4_K_M等)、一键运行与精细调优、避坑指南及跨平台(CUDA/ROCm/Metal)实测数据,助你零成本、高隐私、离线可用。
|
4天前
|
C++在科学计算与数值模拟(有限元分析)中的应用
工程仿真(结构力学、流体力学、电磁场)需要解大型偏微分方程组,网格规模可达数千万单元,计算量巨大。
一个高性能、双模式、拓扑感知的量子计算模拟核心库。
NEXUS QUANTUM DEFENSE 是一款高性能Python量子模拟核心库(v1.5.0),首创“惰性求值+双模式引擎”:纯态用高效态矢量,遇噪声自动切换至密度矩阵模式;支持CPU并行、CuPy GPU加速及拓扑感知API,零依赖轻量部署。
|
5天前
| |
大模型应用:大模型实测对比:1.8B vs 6B,本地部署的极限拉扯与真实体感.119
本文对比Qwen1.5-1.8B与ChatGLM2-6B两大中文大模型:前者轻量易部署,CPU即可运行,代码简洁,但易幻觉、指令遵循弱;后者参数量大,中文理解与逻辑更强,但需GPU、加载复杂。二者代表“小而美”与“大而全”的典型路径。
|
5天前
| |
从软件订阅到基础设施计费:AI双轨制如何破解包月制成本错配困局
本文剖析AI订阅制的结构性困局——固定月费难承浮动算力成本,导致限速、降智与用户信任崩塌。提出“双轨制”(存算分离)新范式:存储轨按月固定收费,保障对话记忆永续;算力轨按Token用量计费,谁用谁付。借鉴电信“月租+流量”逻辑,实现公平、透明、可迁移的基础设施级计费。
|
5天前
| |
来自: 云原生
Linux 多发行版 远程桌面踩坑总结:Deepin / openKylin / Ubuntu 实战记录
本文详述TigerVNC在Ubuntu 26.04、Deepin 20.9/23.9及openKylin 2.0 SP2四大发行版的适配实践,重点解决Wayland/X11冲突、DBus、输入法、DDE兼容等痛点,最终推荐「deepin」为最稳定方案。(239字)
免费试用