内存技术

首页 标签 内存技术
# 内存技术 #
关注
10909内容
(一)走进阿里云实时计算Flink版-产品能力篇
阿里云实时计算Flink版是企业级高性能实时大数据处理平台,由Flink创始团队打造。提供VVR+Flash双引擎,性能达开源Flink的3-4倍;支持动态扩缩容、SQL开发、CEP规则热更新、湖流一体(Fluss+Paimon)、大模型集成等能力,全面兼容开源生态。(239字)
NSA推理在昇腾芯片上的一种亲和实现方案
本文提出昇腾AI芯片上NSA推理的亲和优化方案:①创新设计稀疏系数矩阵,将compress中importance score计算转为高效矩阵乘,实现online softmax,耗时从200μs降至80+μs;②融合无依赖的select与sliding算子,消除约40μs开销。综合加速比达8.8×,逼近理论极限11.6×。(239字)
|
2月前
|
Keil MDK常见报错与解决方案详细笔记
本文系统梳理Keil MDK开发中常见错误,涵盖编译、链接、下载调试、路径配置、警告处理等八大类问题,含典型错误码(如#5、L6218E)、根因分析及实操解决方案,助力嵌入式开发者高效排错。(239字)
|
2月前
| |
FPGA时序收敛的痛点与解决之道——从一次高速接口调试谈起
本文深入剖析FPGA时序收敛难题,结合JESD204B+DDR4实战案例,系统讲解STA原理、约束关键点(时钟/IO/多周期/虚假路径)、分层优化策略及系统级收敛方法论,强调时序能力是高速数字设计的核心素养。(239字)
|
2月前
|
C语言深度解析:大小端字节序——多字节数据的底层存储规则
大小端指CPU对多字节数据在内存中的存放顺序:大端高字节存低地址,小端反之。x86/ARM默认小端,网络字节序统一为大端。跨平台、网络通信、二进制协议开发中必须显式处理字节序转换,否则数据解析必错。
|
2月前
|
QQ接入openclaw 保姆级教程
不用代码基础,不用复杂配置,低成本使用windows电脑安装openclaw,接入QQ机器人,实现轻松养龙虾,让QQ变成你的AI智能助手。
阶跃星辰 Step 3.5 Flash 预训练/中训练/训练框架全部开源!
阶跃星辰开源Step 3.5 Flash——迄今最强开源Agent基座模型,含Base/Midtrain权重及Steptron全栈训练框架,支持预训练、SFT与强化学习,专为智能体设计。已登OpenRouter榜首,获社区广泛好评。(239字)
|
2月前
|
大模型训练的硬件基础:GPU内存层级、分块与并行策略
本文深入解析GPU加速大模型训练的核心原理与五大优化技巧:低精度计算、算子融合、重计算、内存合并访问与分块,进而详解FlashAttention的在线softmax实现;并系统对比数据并行(含ZeRO各阶段)、流水线并行与张量并行等多级并行策略,揭示如何突破内存与带宽瓶颈,高效扩展至万卡规模。
Codex CLI 速查表
本文详解 OpenAI Codex CLI(cx)的安装、配置与实战技巧:涵盖 WSL2/Windows 双环境部署、沙盒安全机制、TOML 配置、AGENTS.md 项目约定、快捷键及斜杠命令,对比 cc 差异,附避坑指南与自动化最佳实践。
免费试用