云栖硬核回顾|企查查搜索引擎演进之路
企查查作为企业征信行业的搜索引擎,一直以来都与阿里云开放搜索团队有深度合作。本次朱总独家揭秘,开放搜索陪伴企查查从创业初期到成为企业征信行业的独角兽的过程中,是如何满足企查查产品海量数据的精准搜索需求的。
OpenSearch:轻松构建大数据搜索服务
如何从海量的历史、实时数据中快速获取有用信息,令搜索变得越来越具挑战性。OpenSearch是阿里云推出的一款云搜索服务,本文将介绍OpenSearch的发展历程、基本功能、以及实现原理和架构,以实际应用场景为例讲述应用实践过程。
云栖全程回顾|搜索推荐工程技术专场(附视频与文档)
2019年9月26日在云栖大会《搜索推荐工程技术专场》上,介绍了阿里巴巴搜索推荐与广告,淘系推荐算法云上赋能的分享。基于阿里巴巴十几年搜索与推荐引擎的技术沉淀,承载了包括淘宝、天猫、菜鸟、盒马、钉钉、优酷乃至海外电商在内的整个阿里集团业务,同时由搜索推荐体系支撑起的云产品矩阵已服务于全球的开发者。本次分享邀请到了阿里巴巴搜索和推荐最核心的资深技术专家,为大家带来搜索和推荐领域最前沿、专业、深度的技术内容盛宴。
OpenSearch 使用二三事
先交代下我们的使用场景。我们是把一张分库分表的逻辑表导入了 OpenSearch,建立了相关索引,供后台管理界面查询使用。最近在使用的过程中遇到了几个问题。记之。
## 查询的数据最多只有 5000 条
我们有一个数据导出功能,当导出的数据超过 5000 条时,导出的表格里就只有 5000 条。我们使用的是 search 接口分页查,看日志发现当 startHit 到 5000 左右就返回
阿里云双11访谈之Elasticsearch
阿里云宣布与Elastic公司建立了合作伙伴关系,并在云栖大会上联合发布阿里云Elasticsearch产品。在阿里云双11访谈Elasticsearch专场中,阿里云大数据Elasticsearch资深产品经理洪阳为大家简单介绍了阿里云Elasticsearch的基本情况,并且分享了阿里云Elasticsearch的优势以及在日志处理分析、搜索以及安全等领域实际应用。
玩转大数据系列之四:搜索服务
搜索服务是阿里云产品非常重要的组成部分,也承载了阿里巴巴集团的全部主要的搜索任务。这里的搜索服务主要包含两个产品:阿里云Elasticsearch和开放搜索OpenSearch。本文将介绍如何玩转阿里云搜索的大数据服务。
OpenSearch自定义分词服务
背景
OpenSearch是一个以云服务方式提供给广大开发者使用的搜索引擎平台。在搜索引擎中,分词是最基础但很重要的功能,其效果会直接影响文档的召回。分词歧义会导致引擎无法召回目标文档。例如:
乒乓球拍卖完了 ==> 乒乓球/拍卖/完了
乒乓球拍 ==> 乒乓/球拍
在上面的case中,短语“乒乓球拍”不同的上下文中分词的结果不一样。
OpenSearch算法产品化探索与实践
作为搜索的用户,我觉得最关心的是两个方面:一是召回的结果是否符合预期,二是召回结果的排序是否符合预期。OpenSearch作为一个搜索服务提供平台,在这两个方面我们提供了一定机制方便用户定制自己的召回和排序逻辑。