C++

首页 标签 C++
# C++ #
关注
62150内容
🎲 解码策略🎲 解码策略
解码策略决定语言模型生成文本的方式,平衡创造性与准确性。常见方法包括:贪婪解码(确定性高)、Beam Search(质量高但计算成本高)、随机采样(如Top-k、Top-p,提升多样性)。不同策略适用于翻译、摘要、创意写作等场景。
数组(顺序存储)基本原理
本章讲解数组的底层原理,区分静态数组与动态数组。静态数组是连续内存空间,支持O(1)随机访问,但增删效率低;动态数组基于静态数组封装,提供自动扩容与常用API,使用更便捷。通过手写动态数组,理解其增删查改实现及时间复杂度,为后续数据结构打基础。
状态检索:如何快速判断一个用户是否存在?
本文探讨如何高效判断对象是否存在,对比有序数组、二叉树、哈希表等结构后,重点介绍位图与布隆过滤器。位图利用bit级存储,大幅节省空间;布隆过滤器通过多哈希函数进一步压缩数组长度,实现O(1)查询,适用于允许误判的场景,如用户注册、网页抓取去重等,是时间与空间权衡的典范方案。
|
28天前
|
📚 RAG技术
RAG(检索增强生成)通过结合外部知识库与大模型,提升回答准确性,缓解幻觉与知识过时问题。涵盖基础流程、核心组件、密集与混合检索技术,并对比FAISS、Pinecone等向量数据库。附实战代码与面试高频问题解析,助力系统构建与优化。
|
28天前
|
归一化技术
归一化技术对大模型训练至关重要。LayerNorm通过对特征维度归一化提升稳定性,是Transformer标配;RMSNorm省去均值计算,更高效且广泛用于LLaMA等模型;Pre-norm结构因更好性能成为现代架构主流。
|
28天前
|
解码策略
解码策略影响模型文本生成的创造性和准确性。本文介绍贪婪解码、Beam Search及随机采样(如Top-k、Top-p)等方法,对比其在多样性、质量与计算成本上的差异,助你选择合适策略应对不同应用场景。
|
28天前
|
📈 模型评估
模型评估涵盖基础能力、对齐性与效率三大维度,涉及语言理解、知识问答、推理代码等任务,常用MMLU、C-Eval、GSM8K等基准,结合Hugging Face工具实现自动化评测,面试关注幻觉检测、指标设计与人工评估权衡。
归一化技术
归一化技术对大模型训练至关重要,如LayerNorm稳定训练、RMSNorm提升效率。Pre-norm结构更受现代模型青睐,助力收敛与性能优化。
|
28天前
|
⚡ 模型推理加速
大模型推理加速涵盖KV-Cache优化、连续批处理、投机解码、模型并行等技术,通过算法与系统协同优化,提升推理效率。vLLM等框架实现高效部署,兼顾吞吐与延迟,助力大模型落地。
非精准 Top K 检索:如何给检索结果的排序过程装上加速器?
本文介绍了非精准Top K检索的优化思路与实现方法,通过简化打分机制提升检索效率。重点讲解三种技术:基于静态质量得分排序截断、胜者表利用词频加速、分层索引两阶段查询。核心思想是将计算前移至离线阶段,在线仅做快速截断,结合精准排序形成召回+排序的两阶段架构,显著降低开销,广泛应用于搜索与推荐系统。
免费试用