机器学习/深度学习的搜索结果_文章_第13页-阿里云开发者社区

Jokerw

|

5天前

|

博文

|

分词器是将文本转为模型可处理数字序列的关键组件。本文详解BPE、WordPiece、SentencePiece三大主流算法原理与优劣，对比其在多语言支持、分词粒度等方面的差异，并提供中英文实战代码示例，助你掌握词汇表构建流程、特殊标记处理及常见面试问题应对策略。

# 大模型服务平台百炼 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 算法

游客hxb2wskd57xio

|

5天前

|

博文

广告系统：广告引擎如何做到在 0.1s 内返回广告信息？

广告系统是互联网核心营收支柱，支撑Google、Facebook等公司超80%收入。其引擎需在0.1秒内完成百万级并发请求，实现“千人千面”。本文详解展示广告引擎架构：通过标签分层过滤、树形索引分片提升召回效率；引入向量检索实现智能匹配；结合非精准打分与深度学习排序，在保障效果的同时优化性能；并在离线索引构建中前置过滤无效广告，压缩检索空间。四大策略协同，打造高性能、低延迟的广告检索系统。

# 机器学习/深度学习 # 搜索推荐 # 算法 # 数据挖掘 # 索引

游客hxb2wskd57xio

|

5天前

|

博文

搜索引擎：输入搜索词以后，搜索引擎是怎么工作的？

本文深入解析搜索引擎的工作原理，涵盖爬虫、索引与检索三大核心系统，重点讲解查询分析、分词纠错、短语检索及倒排索引等关键技术，揭示其如何精准理解用户意图并高效返回结果。

# 机器学习/深度学习 # 数据采集 # 自然语言处理 # 搜索推荐 # 索引

Jokerw

|

5天前

|

博文

AI大模型Transformer基础结构

Transformer是2017年提出的基于注意力机制的神经网络，摒弃了传统RNN结构，采用自注意力与多头注意力机制，实现并行化处理和长距离依赖建模。其核心由编码器-解码器架构、位置编码、残差连接和层归一化组成，广泛应用于NLP任务，成为BERT、GPT等模型的基础。

# 机器学习/深度学习 # 人工智能 # 自然语言处理 # 网络架构

游客hxb2wskd57xio

|

5天前

|

博文

推荐引擎：没有搜索词，「头条」怎么找到你感兴趣的文章？

本文深入解析资讯类App推荐引擎的检索技术。通过“下拉刷新”无搜索词场景，介绍推荐系统如何基于用户行为数据构建用户与文章画像，并详解基于内容召回和协同过滤（用户/物品）两大个性化推荐算法原理及优缺点。最后阐述多路召回与分层排序的混合推荐机制，揭示推荐系统高效精准运作的核心逻辑。（238字）

# 机器学习/深度学习 # 搜索推荐 # 算法 # 数据库 # 索引

游客hxb2wskd57xio

|

5天前

|

博文

最近邻检索（下）：如何用乘积量化实现「拍照识花」功能？

随着AI发展，以图搜图、拍图识物等基于图片检索的技术广泛应用。其核心是将图片转化为高维向量，并通过聚类算法、局部敏感哈希、乘积量化等技术实现高效相似性搜索。相比粗粒度的哈希方法，聚类能更好保留语义相似性，而乘积量化则大幅压缩存储空间。结合倒排索引，可实现快速精准的近似最近邻检索，广泛应用于图像、推荐等领域。

# 存储 # 机器学习/深度学习 # 算法 # 数据挖掘 # 索引

游客hxb2wskd57xio

|

5天前

|

博文

非精准 Top K 检索：如何给检索结果的排序过程装上加速器？

本文介绍了非精准Top K检索的优化思路与实现方法，通过简化打分机制提升检索效率。重点讲解三种技术：基于静态质量得分排序截断、胜者表利用词频加速、分层索引两阶段查询。核心思想是将计算前移至离线阶段，在线仅做快速截断，结合精准排序形成召回+排序的两阶段架构，显著降低开销，广泛应用于搜索与推荐系统。

# 机器学习/深度学习 # 搜索推荐 # 算法 # C++ # 索引

游客hxb2wskd57xio

|

5天前

|

博文

精准 Top K 检索：搜索结果是怎么进行打分排序的？

搜索引擎的核心是排序，Top K检索通过打分选出最相关的结果。本文介绍三种打分方法：经典TF-IDF衡量词频与逆文档频率；BM25算法在此基础上优化，引入文档长度和词频饱和机制；机器学习模型则融合数百因子自动学习权重，提升排序精度。为高效实现Top K检索，采用堆排序降低时间复杂度，显著提升大规模数据下的性能。

# 机器学习/深度学习 # 算法 # 搜索推荐 # UED

游客hxb2wskd57xio

|

5天前

|

博文

倒排索引：如何从海量数据中查询同时带有「极」和「客」的唐诗？

本文通过唐诗检索的实例，讲解正排索引与倒排索引的原理与区别。正排索引以文档ID为键，适合精确查找；倒排索引以关键词为键，指向包含该词的文档列表，显著提升多关键词联合查询效率，广泛应用于搜索引擎、推荐系统等场景。

# 存储 # 机器学习/深度学习 # 自然语言处理 # 搜索推荐 # 索引

游客gyr3h2epvizc2

|

5天前

|

博文

Chap01. 认识AI

本文介绍AI核心概念与大模型开发原理，涵盖人工智能发展历程及Transformer神经网络的关键作用。通过注意力机制，Transformer实现对文本、图像、音频的高效处理，成为GPT等大模型的基础。大语言模型（LLM）利用其持续生成能力，逐字预测输出，实现连贯对话。

# 机器学习/深度学习 # 人工智能 # 自然语言处理

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

机器学习/深度学习