Qwen3-Next:迈向更极致的训练推理性价比
来了来了又来了,通义千问Qwen团队又在深夜(其实是凌晨)带来了最新的开源工作 Qwen3-Next。针对长上下文与大参数规模优化,创新融合混合注意力机制、高稀疏度MoE及多token预测,显著提升训练与推理效率。
MicroNAS:面向MCU的零样本神经架构搜索——论文阅读
MicroNAS是一种专为微控制器单元(MCU)设计的零样本神经架构搜索(NAS)框架,无需训练即可通过理论驱动的性能指标评估网络架构。相比传统NAS方法,其搜索效率提升高达1104倍,同时兼顾精度与硬件效率,适用于边缘计算场景。该框架结合神经切线核(NTK)条件数、线性区域计数及硬件感知延迟模型,实现快速、高效的架构搜索,为资源受限设备上的AI部署提供了新思路。