社区论坛行业搜索最佳实践

本文涉及的产品
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
OpenSearch LLM智能问答版免费试用套餐,存储1GB首月+计算资源100CU
简介: 社区内容通常包括UGC和PGC。由于关键词和内容多样性丰富、用词规范程度参差不齐,这就要求搜索引擎对关键词和内容进行智能语义分析,通过机器识别出用户查询的真正意图,找到最全面最相关的结果进行需求满足。本文和大家详细介绍如何通过“开放搜索”在社区论坛场景的应用,带来更多的业务转化,以提升整体业务收入。

案例背景

某技术社区作为国内的中文IT内容社区,致力于为中国软件开发者提供知识传播、在线学习、职业发展等全生命周期服务,旗下包括多款产品。

自开始接触阿里云开放搜索产品,在一年的时间里逐步上量,陆续接入PC端、移动端的多个平台,覆盖首页搜索、博客、下载、问答等细分业务的频道搜索。通过开放搜索,为旗下产品的用户提供高质量的搜索服务,并通过搜索能力的优化带来更多的业务转化,以提升整体业务收入。

内容搜索场景需求:

»更多的曝光机会——空结果率低;
»更好的搜索质量——搜索相关性高;
»更丰富的业务特征——结合业务特性调整搜索结果;
»更全面的配套功能——智能纠错、下拉提示等配套能力;
»更低的拥有成本——相较自建搜索引擎更低的TCO成本;
»更便捷的开发使用——上线周期短,降低搜索引擎开发、效果调优难度;

以某论坛社区为例,产品线覆盖多个平台,包含网页、APP、小程序等形式,同时业务上区分多个频道。随着业务的发展,首页综合搜索(后简称“主搜”)的流量越来越大,各种付费、引流业务接入,对搜索流量的运营变得更加重要,对主搜的业务诉求越来越多,需要聚合多个频道的内容,同时搜索结果相关性要求更加精准,在考虑文本相关性的前提下,要加入更多的商业因素考虑,如eCPM等。
成熟的搜索引擎涉及离线模块、在线模块、查询理解服务、算法平台等系统组成,所需大量开发、算法调优以及持续的复杂运维工作,由于人力有限,社区论坛经过多方竞品调研和产品试用,最终接入阿里云开放搜索。

开放搜索最佳实践

image.png
更符合IT行业的查询理解功能
在核心索引上配置使用针对IT行业定制了词权重模型,纠错模型,改写模型等,扩大召回结果,精准命中需求;
image.png

排序优化
- 排序表达式应用
支持制两轮相关性排序规则来准确控制搜索结果的排序。第一轮为基础排序(粗排),从命中的文档集合里海选出相关文档。第二轮为业务排序(精排),对粗排的结果做更精细筛选,支持任意复杂的表达式和特征函数应用,方便更准确控制排序效果,优化系统性能,提高搜索响应速度。定制CTR点击率预估模型,实现更智能的排序效果.
image.png

- 算法调优-人气模型
人气模型是淘宝搜索最基础的排序算法模型,计算量化出每个产品的静态质量及受欢迎的程度的值,将人气模型引入到排序表达式中,可构建更精细化的排序模型;
image.png

- 高级定制排序插件-Cava语言
更强的灵活性和定制能力:Cava提供了较表达式更加丰富的语法功能支持及时编译满足更多个性化的业务需求。
image.png

搜索引导功能

下拉提示
是搜索服务的基础功能,在用户输入查询词的过程中,智能推荐候选query,提高用户输入效率,帮助用户尽快找到想要的内容。
下拉提示实现了基于用户文档内容的query智能抽取,可以通过中文前缀,拼音全拼,拼音首字母简拼查询以及汉字加拼音,分词后前缀,中文同音别字等查询下拉提示的候选query
image.png

业务价值

对比客户基于开源自建的服务CTR提升超过80%
• 经迭代,开放搜索返回的搜索结果首位点击率高于某D站内搜索服务的点击率,期间多日点击率高出3%

配置前后效果对比


image.png

以上就是社区论坛行业开放搜索最佳实践的内容,如果您对搜索与推荐相关技术感兴趣,欢迎加入钉钉群内交流~

image.png

【开放搜索】新用户活动:阿里云实名认证用户享1个月免费试用戳我

目录
相关文章
|
7月前
|
移动开发 JavaScript API
HarmonyOS Next 简单上手元服务开发
本文介绍了 HarmonyOS Next 中元服务的开发流程与关键特性。元服务是一种轻量级应用程序形态,支持免安装、秒开直达,适用于听音乐、打车等场景,大幅提升服务获取效率。文章详细讲解了元服务的开发旅程,包括在 AGC 平台上新建项目、修改名称与图标、新增卡片等内容,并提供了代码示例,如 AtomicServiceTabs 的 tab 切换和标题设置、AtomicServiceNavigation 的路由管理等。此外,还探讨了 AtomicServiceWeb 的使用方法,涵盖鸿蒙页面与 h5 页面的数据传递及方法调用。
425 20
HarmonyOS Next 简单上手元服务开发
|
11月前
|
存储 大数据 数据管理
大数据垂直分区(Vertical Partitioning)
【11月更文挑战第1天】
207 1
|
存储 NoSQL 关系型数据库
数据库的演变与未来:技术趋势与行业应用
一、引言 数据库作为信息技术的核心组成部分,承载着数据的存储、管理和分析功能
|
计算机视觉 Python
AttributeError: module ‘cv2‘ has no attribute ‘face‘
AttributeError: module ‘cv2‘ has no attribute ‘face‘
381 0
|
机器学习/深度学习 算法 Java
Java中的机器学习模型集成与训练策略
Java中的机器学习模型集成与训练策略
|
11月前
|
安全 区块链 数据安全/隐私保护
介绍一下PoW机制的优缺点
介绍一下PoW机制的优缺点
|
算法 计算机视觉
基于Chan-Vese算法的图像边缘提取matlab仿真
**算法预览展示了4幅图像,从边缘检测到最终分割,体现了在matlab2022a中应用的Chan-Vese水平集迭代过程。核心代码段用于更新水平集并显示迭代效果,最后生成分割结果及误差曲线。Chan-Vese模型(2001)是图像分割的经典方法,通过最小化能量函数自动检测平滑区域和清晰边界的图像分割,适用于复杂环境,广泛应用于医学影像和机器视觉。**
|
供应链 监控 调度
ERP系统中的供应链协同与协作解析
【7月更文挑战第25天】 ERP系统中的供应链协同与协作解析
930 1
|
机器学习/深度学习 算法 索引
【机器学习】特征选择之过滤式特征选择法
【机器学习】特征选择之过滤式特征选择法
1252 3
|
存储 缓存 监控
python任务调度利器-APScheduler
APScheduler是Python的任务调度库,提供基于时间、固定时间点和CRONTAB的任务调度,适用于离线作业和缓存更新等场景。它包含触发器、调度器、任务存储器、执行器和任务事件组件。安装使用`pip install apscheduler`,简单示例展示了如何配置调度器、添加任务并监听任务异常。支持的触发器有间隔、日期和CRON类型,执行器包括线程池和进程池等。任务存储器可选择内存或各种数据库存储。调度器模式有BlockingScheduler和BackgroundScheduler等,可进行任务的添加、删除、暂停和修改,并监听任务事件。5月更文挑战第20天
419 0