自然语言处理的搜索结果_文章_第12页-阿里云开发者社区

游客bjnjbvjj3nb64

|

5天前

|

博文

搜索引擎：输入搜索词以后，搜索引擎是怎么工作的？

搜索引擎通过爬虫抓取网页，经索引系统处理生成倒排索引，再由检索系统结合分词、纠错、推荐等技术理解用户意图，利用位置信息和最小窗口排序提升短语检索相关性，实现高效精准搜索。

# 机器学习/深度学习 # 数据采集 # 自然语言处理 # 搜索推荐 # 索引

游客bjnjbvjj3nb64

|

5天前

|

博文

索引拆分：大规模检索系统如何使用分布式技术加速检索？

本文介绍了分布式技术在大规模检索系统中的应用，重点探讨了索引拆分的三种方式：业务拆分、基于文档的水平拆分和基于关键词的垂直拆分。其中，基于文档的拆分通过将数据均匀分布到多台服务器，实现并行检索与负载均衡，既能提升吞吐量，又能缩短单次查询时间，且更易于扩展和维护，是工业界主流方案。

# 自然语言处理 # 运维 # 负载均衡 # 搜索推荐 # 索引

游客rgrjnscks5qhs

|

5天前

|

博文

FastJson：大面积故障规避案例

本文分享了一次因Kotlin语法误用导致FastJson反序列化全局崩溃的排查经历。混编工程中，一个`{}`被误赋值为Java对象字段，触发FastJson解析异常，静态标记位`kotlin_error`被置为true且无法恢复，导致后续所有Kotlin类反序列化失败，影响全链路。问题隐蔽、影响巨大，最终通过日志和源码深入分析定位。反思多语言混编风险、框架局限性及灰度发布的重要性。

# 自然语言处理 # fastjson # Java # 编译器 # Kotlin

游客qbwohdg5vs6oq

|

5天前

|

博文

认识AI

本文介绍了AI核心概念及大模型开发原理，涵盖人工智能发展历程与Transformer神经网络的关键作用。重点解析了Transformer的注意力机制及其在自然语言处理中的应用，揭示大语言模型（LLM）如何通过持续生成实现连贯文本输出，帮助理解GPT等模型的工作机制。

# 机器学习/深度学习 # 人工智能 # 自然语言处理

游客bjnjbvjj3nb64

|

5天前

|

博文

倒排索引：如何从海量数据中查询同时带有「极」和「客」的唐诗？

本文通过唐诗检索的实例，讲解正排索引与倒排索引的核心原理。正排索引以文档ID为键，支持快速键值查询；而倒排索引以关键词为键，记录包含该词的文档列表，显著提升内容检索效率。文章详细介绍了倒排索引的构建步骤、多关键词联合查询的实现方法（如交集、并集、差集），以及归并算法在有序链表中查找公共元素的应用。倒排索引广泛应用于搜索引擎、数据库全文检索等系统，是信息检索的基石技术。

# 存储 # 自然语言处理 # 搜索推荐 # 数据库 # 索引

游客wp377xfxa7gym

|

5天前

|

博文

适合电商的智能客服系统推荐（2025年12月更新）

瓴羊Quick Service是阿里云旗下智能客服产品，深度整合电商交易链路，支持全渠道协同与大模型应用，具备高并发稳定性，助力中大型电商实现服务智能化与业务增长。

# 人工智能 # 自然语言处理 # 机器人 # 双11 # 数据安全/隐私保护

游客sxy3tsjozsoec

|

5天前

|

博文

分词器详解

分词器将文本转为模型可处理的数字序列，主流算法包括BPE、WordPiece和SentencePiece。BPE高效但中文支持弱；WordPiece适合英文，用于BERT；SentencePiece语言无关，尤擅中文。实战中需结合语种与需求选择，并合理配置参数与特殊标记。

# 自然语言处理 # 算法

Jokerw

|

5天前

|

博文

解码策略

解码策略影响模型文本生成的创造性和准确性。本文介绍贪婪解码、Beam Search及随机采样（如Top-k、Top-p）等方法，对比其在多样性、质量与计算成本上的差异，助你选择合适策略应对不同应用场景。

# 自然语言处理 # C++

游客sxy3tsjozsoec

|

5天前

|

博文

主流大模型结构

主流大模型架构分为四类：Encoder-Decoder（如T5）、Decoder-Only（如GPT、LLaMA）、Encoder-Only（如BERT）和Prefix-Decoder（如GLM），分别适用于生成、理解或兼顾任务。GPT系列从GPT-1到GPT-4，参数量跃升至约1.7万亿，支持多模态与长上下文；LLaMA系列持续优化开源模型；国产模型如Qwen、ChatGLM、Kimi、DeepSeek在中文场景表现突出，涵盖对话、数学推理等能力。

# 自然语言处理

Jokerw

|

5天前

|

博文

模型架构篇🏗️ 主流大模型结构

本文系统梳理主流大模型架构：Encoder-Decoder、Decoder-Only、Encoder-Only及Prefix-Decoder，解析GPT、LLaMA、BERT等代表模型特点与应用，并对比参数、上下文长度与优势场景，涵盖中英文大模型发展及面试核心要点。

# 自然语言处理

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

自然语言处理