机器学习/深度学习

首页 标签 机器学习/深度学习
# 机器学习/深度学习 #
关注
71618内容
|
10天前
|
11|精准 Top K 检索:搜索结果是怎么进行打分排序的?
搜索引擎排序核心在于打分与Top K检索。本文详解TF-IDF、BM25及机器学习打分方法,阐述如何综合词频、文档长度、查询词权重等因素提升排序质量,并介绍利用堆排序优化大规模数据下Top K结果返回效率,助力构建高效精准检索系统。
|
10天前
|
18 | 搜索引擎:输入搜索词以后,搜索引擎是怎么工作的?
本文介绍了搜索引擎的核心架构与工作原理,重点解析了爬虫、索引和检索三大系统。通过分词、纠错、推荐等查询分析技术,结合倒排索引与位置信息索引法,搜索引擎能精准理解用户意图并高效返回相关结果。特别地,以“极客时间”为例,深入讲解了短语检索中最小窗口排序与多关键词相关性判断机制,揭示了搜索背后的技术逻辑。(238字)
|
10天前
| |
构建AI智能体:五十七、LangGraph + Gradio:构建可视化AI工作流的趣味指南
本文介绍了一个基于LangGraph和Qwen大模型的可视化智能工作流系统,旨在降低AI应用门槛,让非技术用户也能轻松组合各种AI能力。系统通过四层处理引擎(预处理、情感分析、关键词提取、智能回复)自动化处理用户反馈,相比传统人工方式可大幅提升效率和质量。文章详细展示了系统架构设计、代码实现和可视化交互界面,并提供了电商客服场景的应用案例。该系统将复杂的大模型能力封装成模块化工作流,支持实时流程监控和灵活配置,有效解决了传统用户反馈处理中效率低下、标准不一等痛点。
16 | 最近邻检索(下):如何用乘积量化实现「拍照识花」功能?
AI时代,图片检索依赖高效向量相似搜索。本文解析聚类算法与局部敏感哈希差异,详解K-Means聚类、乘积量化压缩及倒排索引技术,揭示“以图搜图”背后原理,实现海量高维数据快速精准检索。(238字)
11|精准 Top K 检索:搜索结果是怎么进行打分排序的?
搜索引擎排序核心在于打分与Top K检索。本文详解三种打分算法:经典TF-IDF衡量词频与区分度;BM25引入文档长度、词频上限等优化,效果更优;机器学习则融合数百因子自动学习权重,适应复杂场景。最后通过堆排序高效实现Top K结果返回,提升性能。
19 | 广告系统:广告引擎如何做到在 0.1s 内返回广告信息
广告系统是互联网核心营收支柱,支撑Google、Facebook等巨头超80%收入。它需在0.1秒内完成百万级广告实时检索,属高并发、低延迟典型。本文以展示广告为例,解析其引擎架构:通过标签构建倒排索引,结合树形分片、向量检索与非精准打分预筛,优化召回效率;再用深度学习精准排序,提升匹配度。同时,在索引构建时前置过滤无效广告,压缩检索空间,并依赖全量+增量机制实现实时更新。整体设计兼顾性能与效果,实现千人千面的高效投放。
12 | 非精准 Top K 检索:如何给检索结果的排序过程装上加速器
本文介绍了非精准 Top K 检索的优化思路与三种实现方法:基于静态质量得分排序截断、胜者表利用词频打分、分层索引两阶段检索。核心思想是将复杂计算移至离线,在线快速截断,降低打分开销。结合精准检索的两阶段架构,可显著提升检索效率,广泛应用于搜索与推荐系统中。
2025年中国数字人企业排名与新推荐榜及新技术指南
AI数字人正重塑人机交互,具备情感共鸣、多语言沟通、全天候服务、个性化定制与持续学习五大优势,广泛应用于教育、医疗、客服等领域。它们不仅是高效工具,更成为有温度的智慧伙伴,推动科技向人性化迈进,开启“人人拥有数字分身”的未来新图景。
|
11天前
|
机器学习超参数调优:十个实用的贝叶斯优化(Bayesian Optimization)进阶技巧
贝叶斯优化虽强大,但直接使用常面临收敛慢、计算贵等问题。本文总结十大实战技巧:引入先验加速冷启动,动态调整采集函数打破平台期,对数变换处理量级差异,避免超-超参数过拟合,成本感知抑制资源浪费,混合随机搜索提升鲁棒性,并行化利用多GPU,正确编码类别变量,约束无效区域,以及集成代理模型降方差。结合这些策略,让BO更智能、高效,真正发挥超参调优潜力。
免费试用