文娱行业搜索最佳实践

本文涉及的产品
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
OpenSearch LLM智能问答版免费试用套餐,存储1GB首月+计算资源100CU
推荐全链路深度定制开发平台,高级版 1个月
简介: 本文将详细介绍如何通过“开放搜索(OpenSearch)内容增强版“在文娱垂类场景的应用,提升用户搜索体验,带来更多的业务转化

内容搜索的价值主要体现在两个方面:

对用户而言,用户将搜索作为寻找内容的工具,目标是“搜的到,搜的准”。用户更关心搜索结果的相关性、时效性和多样性。

对平台而言,搜索是内容消费、流量引导的核心入口,目标是提升用户满意度与留存率。更进一步,搜索还能支持平台的宣发和商业价值,实现业务增长与流量变现。

常见文娱搜索场景

  1. 新闻、资讯搜索
  2. 社区、论坛、话题搜索
  3. 影音娱乐搜索
  4. 在线阅读小说、网漫、文章搜索
  5. 图像、视频搜索

文娱搜索业务特点

  • 搜索效果需保证时效性和个性化
  • 涉及多频道、多类别,内容覆盖广泛,需要精准理解用户搜索意图
  • 热搜、下拉提示等搜索引导功能流量占比高
  • 可能有文字、语音、图像、视频综合的多模态搜索需求

搜索痛点

  1. 用户用词规范程度参差不齐,文本内容复杂,用户意图理解要求高
  2. 内容垂类特殊,需要行业数据积累,分词和查询分析难度大
  3. 千人千面的的个性化搜索,需要5人以上的算法团队持续投入,成本高,周期长
  4. 业务导向性差,无法通过搜索实现付费内容引导

开放搜索内容文娱增强版解决方案

内容文娱行业分词模型

对于内容文娱行业,OpenSearch汇集多个相关数据来源,利用千万级数据训练了行业增强版分词模型。

针对更加特殊的垂类业务场景,在原有分词算法模型基础上,支持基于业务数据的定制分词模型,提供专属文本分词器。

文本

通用版

内容文娱版

拜仁或将签下凯恩以接替莱万

拜仁 或 将 签 下 凯恩 以 接替 莱 万

拜仁 或 将 签 下 凯恩 以 接替 莱万

夜兰配队

夜 兰 配 队

夜兰 配 队

复联4高燃场面

复 联 4 高燃 场面

复联 4 高燃 场面

彭昱畅和江疏影演情侣

彭昱 畅和 江疏影 演 情侣

彭 昱畅 和 江 疏影 演 情侣

内容文娱行业向量模型

相比传统文本搜索通过分词、同义词、纠错、词权重等算法技术增强语义搜索效果,基于深度学习的语义向量召回模型具备更强大的表征能力,可以更好地处理用户查询词中的简写、别名、拼写错误等情况。

开放搜索OpenSearch和阿里达摩院合作自研的向量召回技术,在业界知名榜单MS MARCO上夺冠。

结合文娱行业数据训练的向量召回模型目前已在OpenSearch对客户透出。

query

詹姆士绝杀

向量召回 TOP 1

詹姆斯绝杀

向量召回 TOP 2

詹姆斯不是绝杀?

向量召回 TOP 3

关于詹姆斯绝杀球

query

佐鸣

向量召回 TOP 1

鸣佐结局

向量召回 TOP 2

鸣人喜欢佐助哪点

向量召回 TOP 3

鸣人和佐助谁更强?

内容文娱行业CTR排序模型

针对内容文娱行业往往个性化诉求和实时性需求较高。比如不同用户兴趣爱好的引导、以及当天的热点事件引导。

CTR预估模型充分结合行业特点,保障搜索个性化建模和内容实时性。整体网络框架如下:

CTR预估模型可以根据客户特点和诉求做对应模型定制和链路定制,以达到更优业务转化效果。

球鞋爱好者搜:科比

粉丝搜:科比

8.24当天搜:科比

科比那些年穿过的球鞋

科比10佳投篮精彩瞬间

球迷致敬科比

科比同款球鞋

体验科比的一天

科比头像

科比8球鞋评测

巅峰科比实力到底有多强?

科比永远的MVP

案例实践

某文娱资讯平台,原自建搜索存在搜不准,跳出率较高等问题,直接影响用户体验和用户粘性。通过接入开放搜索OpenSearch 15天快速实现搜索效果各项指标的提升。

  1. PV-CTR提升超过10%,UV-CTR提升超过5%,有点击PV占比提升超过5%
  2. 具备语义向量模型能力,针对长文本复杂关键词也可准确返回语义相关文档
  3. 个性化排序模型,支持千人千面的搜索结果展示

填写问卷享开放搜索产品首月1元试用:https://page.aliyun.com/form/act4137000/index.htm

如果你想与更多开发者们进行交流、了解最前沿的搜索与推荐技术,可以钉钉扫码加入社群

相关实践学习
基于OpenSearch搭建高质量商品搜索服务
本场景主要介绍开放搜索(OpenSearch)打造独有的电商行业垂直解决方案,模板内置电商查询分析、排序表达式及行业算法能力,沉浸式体验更高性能和效果的智能搜索服务,助力企业在线业务智能增长。
目录
相关文章
|
人工智能 自然语言处理 搜索推荐
阿里云开放搜索重磅发布!云时代搜索业务的价值重构
【云栖大会】阿里云开放搜索重磅发布~
6893 0
阿里云开放搜索重磅发布!云时代搜索业务的价值重构
|
机器学习/深度学习 搜索推荐 算法
搜索场景下的智能推荐演变之路:从基础到个性化
本篇详细介绍了搜索场景下智能推荐技术的演变历程,从基础的协同过滤算法到个性化推荐的深度学习实现。通过代码示例,读者可以了解不同阶段推荐算法的原理和实际应用,以及如何评估推荐效果。文章旨在帮助读者深入理解智能推荐的发展趋势,为构建更智能、个性化的推荐系统提供有益的指导。
2138 0
|
搜索推荐
《搜索端上动态化-搜索推荐事业部》电子版地址
搜索端上动态化-搜索推荐事业部
111 0
《搜索端上动态化-搜索推荐事业部》电子版地址
《开放搜索在智能化行业搜索和业务增长领域的应用实践》电子版地址
《开放搜索在智能化行业搜索和业务增长领域的应用实践》PDF
145 0
《开放搜索在智能化行业搜索和业务增长领域的应用实践》电子版地址
|
自然语言处理 运维 搜索推荐
内容社区行业搜索最佳实践
社区内容通常包括UGC和PGC。由于关键词和内容多样性丰富、用词规范程度参差不齐,搜索引擎需要对关键词和内容进行智能语义分析,识别出用户真正的查询意图,找到最全面最相关的结果满足用户需求。本文将详细介绍如何通过“开放搜索(OpenSearch)内容增强版”在社区论坛场景的应用,提升用户搜索体验,带来更多的业务转化
952 0
|
自然语言处理 分布式计算 搜索推荐
专题实战 | 如何快速构建高质量电商行业搜索?
本文详细介绍如何快速接入智能开放搜索(OpenSearch)电商行业增强版,助力企业实现高质量搜索效果,提升业务转化率及用户产品体验!
1811 1
|
机器学习/深度学习 自然语言处理 搜索推荐
游戏行业搜索最佳实践
本文通过游戏行业客户案例带大家了解游戏内容,游戏论坛等场景搜索特性,以及如何通过开放搜索游戏增强版解决方案轻松快速接入,实现高质量搜索效果,提升业务指标和用户体验。
755 0
|
新零售 弹性计算 自然语言处理
新零售行业搜索最佳实践
本文通过新零售客户案例带大家了解零售电商、生鲜电商线上业务搜索中的行业特性,以及如何通过开放搜索电商增强版解决方案构建智能搜索服务,快速实现各项指标的提升,为业务带来了更多新的机会。
1403 0
新零售行业搜索最佳实践
|
存储 分布式计算 自然语言处理
基于MaxCompute+开放搜索的电商、零售行业搜索开发实践
搜索一直是电商行业流量来源的核心入口之一,如何搭建电商行业搜索并提升搜索效果,一直是电商行业开发者努力攻克的难题。基于传统数据库或开源引擎虽然能够搭建基础搜索服务,但随着商品数据的增多和业务流量的增长,难免会遇到性能瓶颈和效果瓶颈。另一方面,随着电商、直播、云计算等技术的不断发展,越来越多的传统零售企业正在进行互联网云上转型,特别是受近两年疫情等因素的影响,APP、小程序已经成为零售企业重要的业务增长来源。在此背景下,如何快速搭建高效搜索服务成为零售行业上云及转型的难题。
1211 0
基于MaxCompute+开放搜索的电商、零售行业搜索开发实践
|
机器学习/深度学习 自然语言处理 文字识别
算法专家解读 | 开放搜索教育搜题能力和实践
达摩院算法专家--徐光伟(昆卡)聚焦在线教育行业的拍照搜题场景,介绍如何应用开放搜索来构建更高搜索性能及搜题准确率的搜题系统,从而助力在线教育行业客户掌握更高层次用户体验的获客工具。
1722 0
算法专家解读 | 开放搜索教育搜题能力和实践