缓存输入便宜120倍,DeepSeek V4 怎么做到的
DeepSeek V4创新采用CSA+HCA混合注意力架构,支持1M超长上下文,并通过KV缓存压缩、磁盘存储与智能命中复用,大幅降低prefill成本。其Pro版未命中/命中输入价差达120倍,显著高于竞品,真正实现长上下文“又便宜又高效”。
基于蝙蝠优化的恶意 URL 检测元启发式特征选择模型研究
本文提出基于蝙蝠算法的包装式特征选择模型,有效解决恶意URL检测中高维特征冗余问题。在ISCX-URL-2016等数据集上实现最高67.09%降维,BA-LightGBM准确率达99.92%,兼具高精度、低延迟与强泛化能力,支持网关、邮件系统等工程化部署。(239字)