解码策略
解码策略影响模型文本生成的创造性和准确性。本文介绍贪婪解码、Beam Search、随机采样(如Top-k、Top-p)等方法,对比其在多样性、质量与计算成本上的优劣,助你选择合适策略应对不同应用场景。
AI工程vs传统工程 —「道法术」中的变与不变
本文从“道、法、术”三个层面对比AI工程与传统软件工程的异同,指出AI工程并非推倒重来,而是在传统工程坚实基础上,为应对大模型带来的不确定性(如概率性输出、幻觉、高延迟等)所进行的架构升级:在“道”上,从追求绝对正确转向管理概率预期;在“法”上,延续分层解耦、高可用等原则,但建模重心转向上下文工程与不确定性边界控制;在“术”上,融合传统工程基本功与AI新工具(如Context Engineering、轨迹可视化、多维评估体系),最终以确定性架构驾驭不确定性智能,实现可靠价值交付。
归一化技术
归一化技术对大模型训练至关重要,常见方法包括LayerNorm与RMSNorm。前者稳定高效,用于标准Transformer;后者计算更轻量,应用于LLaMA等模型。现代架构多采用Pre-norm结构,提升训练稳定性与收敛速度。