【2025云栖大会】阿里云助力金山办公打造智能搜索新标杆:WPS云文档搜索技术全面升级

简介: 2025年9月26日,杭州云栖大会“AI搜索与向量引擎”分论坛上,金山办公云搜索技术总监——陈海荣宣布,其核心产品WPS云文档搜索功能结合阿里云搜索引擎完成重大升级,正式迈入3.0时代。

演讲主题:AI 搜索年度发布——WPS 云文档搜索演进之路

随着大模型时代到来,用户需求从“关键词匹配”转向“自然语言交互与问答式搜索”。2025年9月26日,杭州云栖大会“AI搜索与向量引擎”分论坛上,金山办公云搜索技术总监——陈海荣宣布,其核心产品WPS云文档搜索功能结合阿里云搜索引擎完成重大升级,正式迈入3.0时代。

此次升级以阿里云Elasticsearch混合检索与AI语义搜索能力为核心,全面解决海量文档场景下的检索效率、语义理解与成本优化难题,为全球6.32亿月活用户提供“秒级响应、语义直达”的智能搜索体验。

关于金山办公

金山办公(Kingsoft Office)是全球领先的办公软件、服务与解决方案提供商,旗下产品包括WPS Office、金山文档等,服务全球超6.32亿月活用户,覆盖220多个国家和地区,致力于以技术创新推动办公智能化转型。

深耕技术迭代:从基础架构到语义搜索的跨越

作为拥有2625亿云文档、服务全球220余个国家和地区的企业级应用,WPS云文档搜索功能历经三次技术革新。早期版本面临“搜不到、排不准、响应慢”等挑战:1.0版本通过自研QU引擎、分词器及高亮算法,将首屏点击率从53.7%提升至69.8%,MRR(平均倒数排名)翻倍至0.52;2.0版本依托阿里云ES索引优化、跨集群网关等技术,实现查询P99延迟<350ms,集群稳定性显著提升,支撑千亿级文档规模下的高效检索。

金山办公云搜索技术总监陈海荣指出:“用户不再局限于文件名检索,而是希望输入‘项目Q3营收数据’或‘公司规章制度’等语义指令,直接获取结构化答案。”这一转变推动WPS搜索进入3.0时代。

阿里云技术赋能:混合检索与AI原生架构

在3.0版本中,金山办公联合阿里云Elasticsearch构建“语义搜索+向量检索”的混合技术架构,实现三大突破:

  1. 文档AI原生化:通过多维度AI解析引擎,对文档内容进行语义标签化处理,提升文档理解深度


  1. Query意图精准识别:基于大模型的自然语言处理能力,实现搜索意图分流,支持“全库问答”“文档关联检索”等场景;
  2. 冷热数据智能管理:依托阿里云ES冷热索引策略,将向量检索内存资源需求降低70%、CPU消耗减少50,同时通过自动化的写入/查询Pipeline,实现业务无感的高效成本控制。


以实际场景为例,用户输入“新人如何申请休假”时,系统可自动关联公司制度文档并提取关键流程;输入“项目A季度总结”时,AI直接从相关文档中抽取数据生成摘要,真正实现“告别盲找,一步直达答案”

未来展望:AI搜索生态的全球布局

金山办公与阿里云的深度合作,不仅优化了搜索技术架构,更重塑了智能办公场景的用户体验。未来,双方计划进一步融合多模态检索、实时协同搜索等能力,并拓展至企业知识库管理、跨语言文档检索等全球化场景。


“阿里云Elasticsearch的混合检索能力与技术前瞻性,是支撑WPS搜索持续领先的关键。”陈海荣表示。作为企业级搜索领域的标杆案例,WPS云文档的技术升级为行业提供了可复用的智能化升级路径——从底层架构优化到上层语义交互创新,阿里云持续以“技术+场景”双轮驱动,赋能企业构建下一代智能搜索生态。


了解更多:

阿里云 检索分析服务 Elasticsearch 官网:https://www.aliyun.com/product/bigdata/elasticsearch

阿里云 检索分析服务 ES Serverless 官网:https://www.aliyun.com/product/es/es-serverless


阿里云AI搜索团队打造大模型原生搜索,攻关分布式与实时检索,助力企业升级搜索与增长。

现招聘:

搜索引擎技术专家:https://careers.aliyun.com/off-campus/position-detail?lang=zh&positionId=2000101003&trace=qrcode_share

管控研发工程师:https://careers.aliyun.com/off-campus/position-detail?lang=zh&positionId=2009043004&track_id=SSP1761801590532QwTKePtoFi4697

技术专家-AI搜索:https://careers.aliyun.com/off-campus/position-detail?lang=zh&positionId=2000098307&track_id=SSP1761801590532ANPPiMeSTo2156

相关文章
|
存储 缓存 文件存储
如何保证分布式文件系统的数据一致性
分布式文件系统需要向上层应用提供透明的客户端缓存,从而缓解网络延时现象,更好地支持客户端性能水平扩展,同时也降低对文件服务器的访问压力。当考虑客户端缓存的时候,由于在客户端上引入了多个本地数据副本(Replica),就相应地需要提供客户端对数据访问的全局数据一致性。
32704 79
如何保证分布式文件系统的数据一致性
|
前端开发 容器
HTML5+CSS3前端入门教程---从0开始通过一个商城实例手把手教你学习PC端和移动端页面开发第8章FlexBox布局(上)
HTML5+CSS3前端入门教程---从0开始通过一个商城实例手把手教你学习PC端和移动端页面开发第8章FlexBox布局
17757 20
|
设计模式 存储 监控
设计模式(C++版)
看懂UML类图和时序图30分钟学会UML类图设计原则单一职责原则定义:单一职责原则,所谓职责是指类变化的原因。如果一个类有多于一个的动机被改变,那么这个类就具有多于一个的职责。而单一职责原则就是指一个类或者模块应该有且只有一个改变的原因。bad case:IPhone类承担了协议管理(Dial、HangUp)、数据传送(Chat)。good case:里式替换原则定义:里氏代换原则(Liskov 
36685 20
设计模式(C++版)
|
存储 编译器 C语言
抽丝剥茧C语言(初阶 下)(下)
抽丝剥茧C语言(初阶 下)
|
机器学习/深度学习 人工智能 自然语言处理
带你简单了解Chatgpt背后的秘密:大语言模型所需要条件(数据算法算力)以及其当前阶段的缺点局限性
带你简单了解Chatgpt背后的秘密:大语言模型所需要条件(数据算法算力)以及其当前阶段的缺点局限性
24765 14
|
机器学习/深度学习 弹性计算 监控
重生之---我测阿里云U1实例(通用算力型)
阿里云产品全线降价的一力作,2023年4月阿里云推出新款通用算力型ECS云服务器Universal实例,该款服务器的真实表现如何?让我先测为敬!
36665 15
重生之---我测阿里云U1实例(通用算力型)
|
SQL 存储 弹性计算
Redis性能高30%,阿里云倚天ECS性能摸底和迁移实践
Redis在倚天ECS环境下与同规格的基于 x86 的 ECS 实例相比,Redis 部署在基于 Yitian 710 的 ECS 上可获得高达 30% 的吞吐量优势。成本方面基于倚天710的G8y实例售价比G7实例低23%,总性价比提高50%;按照相同算法,相对G8a,性价比为1.4倍左右。
|
存储 算法 Java
【分布式技术专题】「分布式技术架构」手把手教你如何开发一个属于自己的限流器RateLimiter功能服务
随着互联网的快速发展,越来越多的应用程序需要处理大量的请求。如果没有限制,这些请求可能会导致应用程序崩溃或变得不可用。因此,限流器是一种非常重要的技术,可以帮助应用程序控制请求的数量和速率,以保持稳定和可靠的运行。
29840 52

热门文章

最新文章

下一篇
开通oss服务