自然语言处理的搜索结果_文章_第10页-阿里云开发者社区

游客hxb2wskd57xio

|

5天前

|

博文

RocketMQ总结

本课程系统讲解人工智能基础理论与应用实践，涵盖机器学习、深度学习、自然语言处理等核心内容，结合案例分析与项目实操，帮助学习者掌握AI关键技术，提升解决实际问题的能力，适用于初学者及进阶开发者。

# 消息中间件 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # RocketMQ

QuickBI产品运营

|

5天前

|

博文

干货收藏｜深度解析数据分析Agent技术原理与产品发展

《2025数据分析Agent白皮书》内容聚焦数据分析Agent的技术路线、落地方案与未来方向，希望能将Quick BI团队多年积累的思考传递给所有关心数据领域技术和应用发展的用户。

# SQL # 人工智能 # 自然语言处理 # 数据挖掘 # BI

游客qbwohdg5vs6oq

|

5天前

|

博文

索引更新：刚发布的文章就能被搜到，这是怎么做到的？

本文介绍工业级倒排索引的高效更新机制。针对小规模内存索引，采用Double Buffer实现无锁读写；对于大规模索引，则使用“全量+增量”索引方案，结合删除列表处理删改操作，并通过完全重建、再合并或滚动合并策略管理增量数据增长，提升系统性能与稳定性。

# 存储 # 自然语言处理 # 搜索推荐 # Java # 索引

游客wsxnwr5p22s5w

|

5天前

|

博文

🔤 分词器详解

分词器将文本转为模型可处理的数字序列，主流算法如BPE、WordPiece和SentencePiece各有特点：BPE高效但中文支持弱；WordPiece用于BERT，适合英文；SentencePiece语言无关，支持多语言。选择时需权衡粒度、速度与模型需求，中文推荐SentencePiece。

# 机器学习/深度学习 # 自然语言处理 # 算法

游客wi7ee6geiosfw

|

5天前

|

博文

Chap01. 认识AI

本文介绍了AI核心概念及大模型开发原理，涵盖人工智能发展历程与Transformer神经网络的关键作用。通过注意力机制，Transformer实现对文本、图像、音频的高效处理，成为GPT等大模型的基础。大语言模型（LLM）利用其持续生成能力，逐字推理输出内容，实现连贯对话与多模态生成。

# 机器学习/深度学习 # 人工智能 # 自然语言处理

SelectDB

|

5天前

|

博文

Apache Doris AI 能力揭秘（四）：HSAP 一体化混合搜索架构全解

AI 时代正在重塑数据库的角色。过去，数据库主要为人类分析者提供报表与查询能力；而现在，越来越多的查询来自智能代理（Agent），它们会自动检索知识、过滤数据、组合多种信号，并将数据库作为“实时信息源”支撑推理与决策。

# 人工智能 # 自然语言处理 # Apache # 数据库 # 索引

t55cenhjuilvw

|

5天前

|

博文

08 | 索引构建：搜索引擎如何为万亿级别网站生成索引？

针对超大规模数据场景，如搜索引擎需处理万亿级网页，倒排索引远超内存容量。解决方案是：先将文档分批，在内存中为每批构建小型倒排索引，再写入磁盘生成有序临时文件；最后通过多路归并技术合并临时文件，生成全局有序的最终倒排文件。此过程类似MapReduce思想，支持分布式加速。检索时，优先将词典加载至内存（可用哈希表或B+树），结合磁盘上的posting list进行高效查询，对过长的列表可采用分层索引或缓存优化。

# 存储 # 自然语言处理 # 分布式计算 # 搜索推荐 # 索引

t55cenhjuilvw

|

5天前

|

博文

解码策略

解码策略影响文本生成的创造性和准确性。贪婪解码确定性强但重复性高；Beam Search提升质量，适合翻译与摘要；随机采样结合Temperature、Top-k和Top-p，增强多样性，适用于创意写作。不同方法在质量、多样性和计算成本间权衡，适配各类NLP任务需求。（238字）

# 自然语言处理 # C++

t55cenhjuilvw

|

5天前

|

博文

Transformer基础结构

Transformer由Vaswani等人于2017年提出，基于自注意力机制，摒弃传统循环结构，实现并行化处理，显著提升长距离依赖建模能力。其核心包括编码器-解码器架构、多头注意力、位置编码、残差连接与层归一化，广泛应用于NLP及多模态任务，是当前大模型的基础架构。（238字）

# 机器学习/深度学习 # 自然语言处理 # 网络架构

t55cenhjuilvw

|

5天前

|

博文

主流大模型结构

本文系统梳理主流大模型架构：Encoder-Decoder（如T5）、Decoder-Only（如GPT）、Encoder-Only（如BERT）和Prefix-Decoder（如GLM），详解GPT、LLaMA及中文模型发展，对比参数、上下文与特性，助力理解架构差异与选型策略，涵盖面试核心要点。

# 自然语言处理

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

自然语言处理