芯片

首页 标签 芯片
# 芯片 #
关注
13566内容
|
7月前
| |
来自: 云原生
大模型推理服务全景图
国内大模型推理需求激增,性能提升的主战场将从训练转移到推理。
|
7月前
| |
DeepSeek-R1论文细节时间线梳理
中国AI初创公司DeepSeek发布了大语言模型R1,该模型在推理任务上媲美OpenAI的ChatGPT,且训练成本仅600万美元。DeepSeek由杭州对冲基金High-Flyer支持,总部位于杭州和北京。R1基于V3-Base,使用监督微调和强化学习训练,针对硬件限制进行了优化。模型在多语言处理、推理风格等方面表现出色,但存在一些局限性,如法语表现欠佳、偶尔切换语言等。DeepSeek的创新技术包括FP8量化、多头潜在注意力和蒸馏方法,引发了广泛关注和讨论。开源社区正积极尝试复现其结果,但面临训练数据和代码未公开的挑战。DeepSeek的低成本高效训练策略为AI领域带来了新的思考方向。
|
7月前
|
PCIe 以太网芯片 RTL8125B 的 spec 和 Linux driver 分析备忘
本文详细介绍了 Realtek RTL8125B PCIe 以太网芯片的规格以及在 Linux 中的驱动安装和配置方法。通过深入分析驱动源码,可以更好地理解其工作原理和优化方法。在实际应用中,合理配置和优化驱动程序可以显著提升网络性能和稳定性。希望本文能帮助您更好地使用和管理 RTL8125B,以满足各种网络应用需求。
|
7月前
|
使用Ollama和Botnow本地部署DeepSeek R1模型的对比分析
本文详细对比了使用Ollama和Botnow两种方式在本地运行DeepSeek R1等开源大模型的不同。通过Ollama,用户可以在个人电脑(如MacBook Pro)上快速部署和测试模型;而Botnow则提供了企业级的API接入和本地部署方案,支持更复杂的应用场景。具体步骤包括环境准备、模型下载与运行、图形化界面操作等,帮助用户选择最适合自己的方式体验大模型的强大功能。
|
8月前
|
《近阈值计算:硬件加速芯片的低功耗密码》
近阈值计算(NTC)技术通过将晶体管工作电压降至接近阈值电压,有效降低功耗并提升芯片性能,成为硬件加速芯片领域的研究热点。NTC优化了电路设计、器件选型和系统级协同设计,采用流水线技术和冗余设计提高稳定性和可靠性。尽管面临性能、稳定性和设计复杂性的挑战,NTC为低功耗高性能芯片提供了新方向,推动人工智能、物联网等领域的发展。
|
8月前
|
《片上网络,如何让硬件加速系统通信“快人一步”》
片上网络(NoC)作为提升硬件加速系统通信效率的核心技术,正逐渐成为科技领域的焦点。它借鉴计算机网络概念,在芯片内构建复杂高效的通信网络,确保各组件间信息快速传递。NoC通过节点和链路组成,采用不同拓扑结构优化性能,如网状、环形等。高效路由算法、流量控制机制及拓扑结构优化是其关键技术,旨在解决带宽瓶颈、延迟等问题,推动人工智能和高性能计算发展。
新手入门:DGL在昇腾上的安装问题
本文介绍了在aarch64架构和Python 3.10环境下安装DGL(Deep Graph Library)的过程。首先通过`uname -a`确认硬件架构,接着使用`python --version`检查Python版本。为确保兼容性,从指定链接下载适合的whl包或通过pip安装dgl。过程中遇到了torchdata版本不兼容的问题,通过降级torchdata至0.7.1版本解决。此外,针对NPU芯片适配,重新安装了与CANN 8.0.RC2兼容的torch和torch_npu组件。最终成功导入dgl包并准备进行模型训练验证。
北京市经开区对首次通过国家级大模型备案一次性奖励100万!
北京市为推动人工智能产业发展,出台了多项政策支持大模型及AI企业。经济技术开发区提供算力服务补贴(最高2000万)、数据集建设支持(最高200万)等;经信局推出算力券补贴(最高200万/年)。海淀区对通用和垂直大模型给予资金补贴(最高1000万)。石景山区则提供算力建设、应用、房租等多方面补贴(最高1000万),并强调智算中心建设。这些政策有效降低了研发成本,促进了技术创新与产业升级,助力北京在全球AI领域领先。
免费试用