【2025云栖大会】阿里云助力金山办公打造智能搜索新标杆:WPS云文档搜索技术全面升级

简介: 2025年9月26日,杭州云栖大会“AI搜索与向量引擎”分论坛上,金山办公云搜索技术总监——陈海荣宣布,其核心产品WPS云文档搜索功能结合阿里云搜索引擎完成重大升级,正式迈入3.0时代。

演讲主题:AI 搜索年度发布——WPS 云文档搜索演进之路

随着大模型时代到来,用户需求从“关键词匹配”转向“自然语言交互与问答式搜索”。2025年9月26日,杭州云栖大会“AI搜索与向量引擎”分论坛上,金山办公云搜索技术总监——陈海荣宣布,其核心产品WPS云文档搜索功能结合阿里云搜索引擎完成重大升级,正式迈入3.0时代。

此次升级以阿里云Elasticsearch混合检索与AI语义搜索能力为核心,全面解决海量文档场景下的检索效率、语义理解与成本优化难题,为全球6.32亿月活用户提供“秒级响应、语义直达”的智能搜索体验。

关于金山办公

金山办公(Kingsoft Office)是全球领先的办公软件、服务与解决方案提供商,旗下产品包括WPS Office、金山文档等,服务全球超6.32亿月活用户,覆盖220多个国家和地区,致力于以技术创新推动办公智能化转型。

深耕技术迭代:从基础架构到语义搜索的跨越

作为拥有2625亿云文档、服务全球220余个国家和地区的企业级应用,WPS云文档搜索功能历经三次技术革新。早期版本面临“搜不到、排不准、响应慢”等挑战:1.0版本通过自研QU引擎、分词器及高亮算法,将首屏点击率从53.7%提升至69.8%,MRR(平均倒数排名)翻倍至0.52;2.0版本依托阿里云ES索引优化、跨集群网关等技术,实现查询P99延迟<350ms,集群稳定性显著提升,支撑千亿级文档规模下的高效检索。

金山办公云搜索技术总监陈海荣指出:“用户不再局限于文件名检索,而是希望输入‘项目Q3营收数据’或‘公司规章制度’等语义指令,直接获取结构化答案。”这一转变推动WPS搜索进入3.0时代。

阿里云技术赋能:混合检索与AI原生架构

在3.0版本中,金山办公联合阿里云Elasticsearch构建“语义搜索+向量检索”的混合技术架构,实现三大突破:

  1. 文档AI原生化:通过多维度AI解析引擎,对文档内容进行语义标签化处理,提升文档理解深度


  1. Query意图精准识别:基于大模型的自然语言处理能力,实现搜索意图分流,支持“全库问答”“文档关联检索”等场景;
  2. 冷热数据智能管理:依托阿里云ES冷热索引策略,将向量检索内存资源需求降低70%、CPU消耗减少50,同时通过自动化的写入/查询Pipeline,实现业务无感的高效成本控制。


以实际场景为例,用户输入“新人如何申请休假”时,系统可自动关联公司制度文档并提取关键流程;输入“项目A季度总结”时,AI直接从相关文档中抽取数据生成摘要,真正实现“告别盲找,一步直达答案”

未来展望:AI搜索生态的全球布局

金山办公与阿里云的深度合作,不仅优化了搜索技术架构,更重塑了智能办公场景的用户体验。未来,双方计划进一步融合多模态检索、实时协同搜索等能力,并拓展至企业知识库管理、跨语言文档检索等全球化场景。


“阿里云Elasticsearch的混合检索能力与技术前瞻性,是支撑WPS搜索持续领先的关键。”陈海荣表示。作为企业级搜索领域的标杆案例,WPS云文档的技术升级为行业提供了可复用的智能化升级路径——从底层架构优化到上层语义交互创新,阿里云持续以“技术+场景”双轮驱动,赋能企业构建下一代智能搜索生态。


了解更多:

阿里云 检索分析服务 Elasticsearch 官网:https://www.aliyun.com/product/bigdata/elasticsearch

阿里云 检索分析服务 ES Serverless 官网:https://www.aliyun.com/product/es/es-serverless


阿里云AI搜索团队打造大模型原生搜索,攻关分布式与实时检索,助力企业升级搜索与增长。

现招聘:

搜索引擎技术专家:https://careers.aliyun.com/off-campus/position-detail?lang=zh&positionId=2000101003&trace=qrcode_share

管控研发工程师:https://careers.aliyun.com/off-campus/position-detail?lang=zh&positionId=2009043004&track_id=SSP1761801590532QwTKePtoFi4697

技术专家-AI搜索:https://careers.aliyun.com/off-campus/position-detail?lang=zh&positionId=2000098307&track_id=SSP1761801590532ANPPiMeSTo2156

相关文章
|
4天前
|
弹性计算 运维 搜索推荐
三翼鸟携手阿里云ECS g9i:智慧家庭场景的效能革命与未来生活新范式
三翼鸟是海尔智家旗下全球首个智慧家庭场景品牌,致力于提供覆盖衣、食、住、娱的一站式全场景解决方案。截至2025年,服务近1亿家庭,连接设备超5000万台。面对高并发、低延迟与稳定性挑战,全面升级为阿里云ECS g9i实例,实现连接能力提升40%、故障率下降90%、响应速度提升至120ms以内,成本降低20%,推动智慧家庭体验全面跃迁。
|
4天前
|
数据采集 人工智能 自然语言处理
3分钟采集134篇AI文章!深度解析如何通过云无影AgentBay实现25倍并发 + LlamaIndex智能推荐
结合阿里云无影 AgentBay 云端并发采集与 LlamaIndex 智能分析,3分钟高效抓取134篇 AI Agent 文章,实现 AI 推荐、智能问答与知识沉淀,打造从数据获取到价值提炼的完整闭环。
375 92
|
5天前
|
域名解析 人工智能
【实操攻略】手把手教学,免费领取.CN域名
即日起至2025年12月31日,购买万小智AI建站或云·企业官网,每单可免费领1个.CN域名首年!跟我了解领取攻略吧~
|
5天前
|
SQL 人工智能 自然语言处理
Geo优化SOP标准化:于磊老师的“人性化Geo”体系如何助力企业获客提效46%
随着生成式AI的普及,Geo优化(Generative Engine Optimization)已成为企业获客的新战场。然而,缺乏标准化流程(Geo优化sop)导致优化效果参差不齐。本文将深入探讨Geo专家于磊老师提出的“人性化Geo”优化体系,并展示Geo优化sop标准化如何帮助企业实现获客效率提升46%的惊人效果,为企业在AI时代构建稳定的流量护城河。
386 156
Geo优化SOP标准化:于磊老师的“人性化Geo”体系如何助力企业获客提效46%
|
4天前
|
数据采集 缓存 数据可视化
Android 无侵入式数据采集:从手动埋点到字节码插桩的演进之路
本文深入探讨Android无侵入式埋点技术,通过AOP与字节码插桩(如ASM)实现数据采集自动化,彻底解耦业务代码与埋点逻辑。涵盖页面浏览、点击事件自动追踪及注解驱动的半自动化方案,提升数据质量与研发效率,助力团队迈向高效、稳定的智能化埋点体系。(238字)
268 158
|
12天前
|
机器人 API 调度
基于 DMS Dify+Notebook+Airflow 实现 Agent 的一站式开发
本文提出“DMS Dify + Notebook + Airflow”三位一体架构,解决 Dify 在代码执行与定时调度上的局限。通过 Notebook 扩展 Python 环境,Airflow实现任务调度,构建可扩展、可运维的企业级智能 Agent 系统,提升大模型应用的工程化能力。