社区论坛行业搜索最佳实践

本文涉及的产品
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
智能开放搜索 OpenSearch向量检索版,4核32GB 1个月
OpenSearch LLM智能问答版免费试用套餐,存储1GB首月+计算资源100CU
简介: 社区内容通常包括UGC和PGC。由于关键词和内容多样性丰富、用词规范程度参差不齐,这就要求搜索引擎对关键词和内容进行智能语义分析,通过机器识别出用户查询的真正意图,找到最全面最相关的结果进行需求满足。本文和大家详细介绍如何通过“开放搜索”在社区论坛场景的应用,带来更多的业务转化,以提升整体业务收入。

案例背景

某技术社区作为国内的中文IT内容社区,致力于为中国软件开发者提供知识传播、在线学习、职业发展等全生命周期服务,旗下包括多款产品。

自开始接触阿里云开放搜索产品,在一年的时间里逐步上量,陆续接入PC端、移动端的多个平台,覆盖首页搜索、博客、下载、问答等细分业务的频道搜索。通过开放搜索,为旗下产品的用户提供高质量的搜索服务,并通过搜索能力的优化带来更多的业务转化,以提升整体业务收入。

内容搜索场景需求:

»更多的曝光机会——空结果率低;
»更好的搜索质量——搜索相关性高;
»更丰富的业务特征——结合业务特性调整搜索结果;
»更全面的配套功能——智能纠错、下拉提示等配套能力;
»更低的拥有成本——相较自建搜索引擎更低的TCO成本;
»更便捷的开发使用——上线周期短,降低搜索引擎开发、效果调优难度;

以某论坛社区为例,产品线覆盖多个平台,包含网页、APP、小程序等形式,同时业务上区分多个频道。随着业务的发展,首页综合搜索(后简称“主搜”)的流量越来越大,各种付费、引流业务接入,对搜索流量的运营变得更加重要,对主搜的业务诉求越来越多,需要聚合多个频道的内容,同时搜索结果相关性要求更加精准,在考虑文本相关性的前提下,要加入更多的商业因素考虑,如eCPM等。
成熟的搜索引擎涉及离线模块、在线模块、查询理解服务、算法平台等系统组成,所需大量开发、算法调优以及持续的复杂运维工作,由于人力有限,社区论坛经过多方竞品调研和产品试用,最终接入阿里云开放搜索。

开放搜索最佳实践

image.png
更符合IT行业的查询理解功能
在核心索引上配置使用针对IT行业定制了词权重模型,纠错模型,改写模型等,扩大召回结果,精准命中需求;
image.png

排序优化
- 排序表达式应用
支持制两轮相关性排序规则来准确控制搜索结果的排序。第一轮为基础排序(粗排),从命中的文档集合里海选出相关文档。第二轮为业务排序(精排),对粗排的结果做更精细筛选,支持任意复杂的表达式和特征函数应用,方便更准确控制排序效果,优化系统性能,提高搜索响应速度。定制CTR点击率预估模型,实现更智能的排序效果.
image.png

- 算法调优-人气模型
人气模型是淘宝搜索最基础的排序算法模型,计算量化出每个产品的静态质量及受欢迎的程度的值,将人气模型引入到排序表达式中,可构建更精细化的排序模型;
image.png

- 高级定制排序插件-Cava语言
更强的灵活性和定制能力:Cava提供了较表达式更加丰富的语法功能支持及时编译满足更多个性化的业务需求。
image.png

搜索引导功能

下拉提示
是搜索服务的基础功能,在用户输入查询词的过程中,智能推荐候选query,提高用户输入效率,帮助用户尽快找到想要的内容。
下拉提示实现了基于用户文档内容的query智能抽取,可以通过中文前缀,拼音全拼,拼音首字母简拼查询以及汉字加拼音,分词后前缀,中文同音别字等查询下拉提示的候选query
image.png

业务价值

对比客户基于开源自建的服务CTR提升超过80%
• 经迭代,开放搜索返回的搜索结果首位点击率高于某D站内搜索服务的点击率,期间多日点击率高出3%

配置前后效果对比


image.png

以上就是社区论坛行业开放搜索最佳实践的内容,如果您对搜索与推荐相关技术感兴趣,欢迎加入钉钉群内交流~

image.png

【开放搜索】新用户活动:阿里云实名认证用户享1个月免费试用戳我

目录
相关文章
|
人工智能 自然语言处理 搜索推荐
阿里云开放搜索重磅发布!云时代搜索业务的价值重构
【云栖大会】阿里云开放搜索重磅发布~
6885 0
阿里云开放搜索重磅发布!云时代搜索业务的价值重构
|
3月前
|
人工智能 安全
新必应打造问题之搜索体验的创新的实现如何解决
新必应打造问题之搜索体验的创新的实现如何解决
17 0
|
6月前
|
存储 搜索推荐 Java
开发者热议GitHub代码搜索政策,最佳搜索解决方案探索
近日,名为koepnick 的开发者因在一台老式电脑上使用GitHub 搜索自己的存储库代码,却没有手机等设备协助验证,导致无法登录GitHub 账户,发文怒斥GitHub:如若没有登录,就无法使用搜索代码服务,与其这样不如弃用。 其实,早在今年6月,GitHub 官方便发布了一封《代码搜索现在需要登录》的公告内容,官宣除了在 GitHub.com 上全局搜索代码已经需要用户登录的政策之后,自 6 月 7 日起,这一政策将其扩展为包括存储库范围的搜索。即要访问 GitHub 的新代码搜索和代码导航的全部功能,需要创建账户或登录 GitHub.com。
|
机器学习/深度学习 搜索推荐 算法
搜索场景下的智能推荐演变之路:从基础到个性化
本篇详细介绍了搜索场景下智能推荐技术的演变历程,从基础的协同过滤算法到个性化推荐的深度学习实现。通过代码示例,读者可以了解不同阶段推荐算法的原理和实际应用,以及如何评估推荐效果。文章旨在帮助读者深入理解智能推荐的发展趋势,为构建更智能、个性化的推荐系统提供有益的指导。
2080 0
|
存储 移动开发 自然语言处理
|
搜索推荐 UED 索引
闲鱼技术2022年度白皮书-服务端主题-电商搜索里都有啥?详解闲鱼搜索系统(下)
闲鱼技术2022年度白皮书-服务端主题-电商搜索里都有啥?详解闲鱼搜索系统
268 0
|
容灾 算法 数据可视化
闲鱼技术2022年度白皮书-服务端主题-电商搜索里都有啥?详解闲鱼搜索系统(中)
闲鱼技术2022年度白皮书-服务端主题-电商搜索里都有啥?详解闲鱼搜索系统
275 0
|
机器学习/深度学习 自然语言处理 达摩院
跨境电商多语言搜索最佳实践
本文详细介绍智能开放搜索OpenSearch行业版在跨境电商领域的智能搜索应用。
1429 0
|
机器学习/深度学习 自然语言处理 达摩院
文娱行业搜索最佳实践
本文将详细介绍如何通过“开放搜索(OpenSearch)内容增强版“在文娱垂类场景的应用,提升用户搜索体验,带来更多的业务转化
635 0
|
自然语言处理 运维 搜索推荐
内容社区行业搜索最佳实践
社区内容通常包括UGC和PGC。由于关键词和内容多样性丰富、用词规范程度参差不齐,搜索引擎需要对关键词和内容进行智能语义分析,识别出用户真正的查询意图,找到最全面最相关的结果满足用户需求。本文将详细介绍如何通过“开放搜索(OpenSearch)内容增强版”在社区论坛场景的应用,提升用户搜索体验,带来更多的业务转化
935 0