LLM 训练能不能少跑一点?Nous Research 的 TST 方法
Nous Research提出Token-Superposition Training(TST),一种不改模型架构、分词器、优化器或推理形式的预训练加速方法:训练前期将连续token平均为“叠加token”并预测下一组token,提升单位算力的数据吞吐;后期切回标准自回归训练。实验显示,在10B-A1B模型上可达2.5倍训练加速,显著降低GPU小时消耗。
用好 Codex Goal,关键就这三步
Codex 新增 /goal 命令,支持目标驱动的Agent式循环:设定可量化目标(如“运行时间降20%且测试全通过”)、构建短反馈闭环、用PLAN/EXPERIMENTS等Markdown文件持久化记忆。三要素缺一不可,方能真正释放长任务自动化潜力。
谷歌域名滥用型高级钓鱼攻击机理分析与闭环防御体系研究
本文剖析2026年谷歌域名钓鱼事件,揭示SPF/DKIM/DMARC在可信云服务滥用下全面失效的严峻现实。攻击者利用Google Sites等合法子域实施多层跳转与页面仿真,绕过传统网关。研究提出“内容语义—链接行为—终端行为”三层协同防御框架,并提供重定向追踪、邮件风险分析、钓鱼页识别等可落地代码,推动防御从静态域名校验转向动态行为感知。(239字)