AI芯片

首页 标签 AI芯片
# AI芯片 #
关注
1350内容
|
6月前
|
vLLM-Ascend 安装部署与环境配置指南
vLLM-Ascend 是 vLLM 项目专为华为昇腾 NPU 设计的硬件插件,支持主流大模型与多模态架构,提供高性能推理能力。项目结构清晰,涵盖核心算子、工具脚本与容器化部署方案,兼容单/多节点环境,助力高效构建昇腾上的 AI 推理服务。
【AI系统】寒武纪介绍
中科寒武纪科技股份有限公司,成立于2016年,致力于打造云边端一体、软硬件协同的智能芯片产品和平台化基础系统软件。寒武纪的产品线涵盖了终端智能处理器IP、边缘端和云端智能加速卡,形成了从1A处理器核到思元系列MLU100、MLU200、MLU300的完整布局。其核心技术包括高效的MLU Core架构和Cambricon Neuware软件栈,支持高性能AI计算,助力机器更好地理解和服务人类。
|
7月前
| |
来自: 云原生
MATLAB R2024b 数据分析软件,安装详细步骤,附安装包
MATLAB R2024b 发布,聚焦性能提升与稳定性优化,支持GPU加速、5G/6G工具链及HDL代码生成,新增NPU硬件支持,配合深色界面与调试增强,助力高效科学计算与工程设计。
|
5天前
|
K-438G 免处理硅胶专用瞬干胶技术解析:从表面活化机理到工程选型应用
K-438G是科耀研发的免底涂硅胶专用瞬干胶,通过表面活性基团实现对硅胶、TPU、TPE等低表面能材料的直接化学键合,初固4–6秒,剪切强度1.5–3.5 MPa(内聚破坏),耐温-50℃~+100℃,透光率≥92%,通过ISO 10993生物相容性认证,广泛应用于医疗器械、智能穿戴及汽车电子等领域。
|
3月前
| |
来自: 物联网
找到了多个 **Kokoro 量化版本** 可以下载
Kokoro语音合成模型提供多种量化版本:FP32(350MB)、FP16(169MB)、INT8/Q8(约100–103MB)、Q4及AMD NPU优化版,适配桌面、移动端、浏览器与嵌入式设备。支持GitHub、HuggingFace、npm多源下载,兼顾体积与性能。
内部干货 | 基于华为昇腾910B算力卡的大模型部署和调优-课程讲义
近日上海,TsingtaoAI为某央企智算中心交付华为昇腾910B算力卡的大模型部署和调优课程。课程深入讲解如何在昇腾NPU上高效地训练、调优和部署PyTorch与Transformer模型,并结合实际应用场景,探索如何优化和迁移模型至昇腾NPU平台。课程涵盖从模型预训练、微调、推理与评估,到性能对比、算子适配、模型调优等一系列关键技术,帮助学员深入理解昇腾NPU的优势及其与主流深度学习框架(如PyTorch、Deepspeed、MindSpore)的结合应用。
|
6月前
|
分享一款端侧AI部署工具Nexa SDK
2025年AI硬件爆发,但云端大模型面临成本高、隐私差、延迟大等问题。开源小模型崛起,推动边缘AI发展。Nexa SDK应运而生,提供跨平台统一推理框架,支持NPU/GPU/CPU深度适配,实现低代码、高性能、多模态模型Day-0支持,兼容OpenAI API,助力手机、PC、汽车、IoT等端侧AI快速落地,重塑智能体验。
|
2月前
|
2026EDGE AI报告-深入解读塑造EDGE AI下一阶段发展的关键技术指南
《2026 Edge AI 技术报告》深度解析边缘智能前沿:涵盖小型化基础模型、多模态感知、超低功耗硬件(神经形态/传感器内计算)、Agentic AI架构、Physical AI系统,以及MLOps、协作学习与信任栈(安全/隐私/可解释性)。报告由Wevolver联合顶尖专家与生态伙伴发布,聚焦工程落地与可持续发展。(239字)
AI服务器电源设计:功率电感选型避坑指南
随着NVIDIA GB300等新一代AI芯片功耗突破千瓦级,GPU供电模块(VRM)正面临“大电流、高频化、高密度”的三重挑战。电感作为储能与滤波的核心元件,其选型直接决定了算力系统的稳定性与能效比。本文结合《AI服务器用一体成型电感》团体标准(2025征求意见稿)及一线大厂实测数据,深度解析AI服务器电感的五大核心指标、避坑指南及主流厂商方案,为硬件工程师提供一份可落地的选型手册。
免费试用