阿里提供中文搜索新选项!AI引擎+达摩院黑科技,你要试试吗?

简介:

云栖号资讯:【点击查看更多行业资讯
在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来!


最近中文搜索引擎市场又突然热了起来,一家巨头的入场让外界充满期待。

6月9日,阿里向外界确认成立智能搜索业务部,隶属阿里创新业务事业群,由UC事业部总经理、书旗事业部总经理吴嘉担任负责人。

阿里人事变动,莫非要进军搜索引擎市场?其实阿里的产品早已先行。

今年4月,一款名为“夸克”的智能搜索App首次在苹果应用商店排名超越百度,并首次跻身前20。

1

其实早在2018年,夸克就开始发力智能搜索,2019年1月,夸克发布3.0版,在自主订制的AI搜索引擎、搜索直达、指令控制等方面实现了重要升级。

搜索引擎诞生已有20余年,无论国内外,市场似乎早已尘埃落定,阿里为何如此“头铁”,夸克为何近两年来越来越进击智能搜索?

2

这恐怕与近年来AI成熟落地密不可分,也不得不从搜索行业的变化开始说起。

多模态搜索的变革

PC时代,我们以文字作为主要的搜索形式。移动互联网兴起后,手机端的搜索引擎App依然如此。

后来,智能手机开始普及,说一段话、拍一张图变得容易起来,各大搜索引擎公司又加入了语音、图片搜索。

如果我们仔细思考就会发现,现阶段大多数语音、图片搜索,其实本质上还是把多媒体信息转变成文字,然后再进行搜索。

这类搜索只是理解用户输入的信息,实际上对另一端抓取的信息是没有理解的。夸克要做的就是跳出这种机械文本检索的围墙,改变搜索引擎。

3

在吴嘉看来,这次的转变是一场搜索引擎的真正变革。

吴嘉认为,今天的内容生态有很大的变化,搜索技术也应该拥抱相应的变化。

至少在语音、图像理解的搜索上,夸克背后的阿里已经拥抱变化。淘宝的图片搜索技术早已在移动端得到应用,天猫精灵也是国内智能音箱领域的头部玩家。

在夸克的产品中,也有这两类智能搜索技术的体现。

那么未来的多模态搜索又会怎样?

夸克的判断是,未来搜索很大程度上会是视频内容检索。注意不是对标题的搜索标题,而是对视频内容本身。

随着短视频这种娱乐、学习方式的兴起,传统的搜索方式变得无效,因为它不能对视频内容做出理解。

而这正是夸克在今天做的工作。

据夸克搜索技术负责人介绍,他们正在做视频理解——深入到视频每一帧画面、每一句语音里,去分析这个视频的主题和质量,然后在分析的结果上建设一个视频库。

将来用户只要一搜,就能把现在最好最热门的视频内容返回给用户,提升用户在视频搜索上的体验。

这项技术离我们不会太遥远。夸克产品负责人郑嗣寿透露,夸克将在不久后就会这样的视频搜索产品。

夸克为何要做搜索

通过搜索框和AI,我们初步了解了夸克产品。可是在信息孤岛化的今天,有人认为通用搜索已死,夸克为何还要做搜索?

因为在夸克团队看来,通用搜索不但不会死,未来的价值还会越来越重要。

而且,直到今天,搜索引擎一直是互联网的基础服务之一,每天国内就有数亿用户在用。

只要用户有需求,通用搜索就会一直存在。

4

吴嘉在接受采访时说,过去我们的搜索内容在链接里、在H5里,但是今天想做好一个内容,已经没有现成的链接和H5可供抓取了。

只有把要把内容生态做起来,同时提高技术,搜索引擎才有出路。

生态方面,夸克不必担心,有阿里的电商和大文娱内容有阿里的生态内容作为支持。

而更重要的是有AI搜索还有对内容的理解,从海量化信息中把有价值的信息呈现给用户。在这方面,夸克有自然语言理解AI技术帮助提取有效信息。

夸克为何有底气做好搜索

无疑,阿里的中台架构帮助夸克在一年内快速实现智能搜索的愿景。

产品负责人嗣寿自豪地说:“阿里的基础设施建设是非常完善的,算力也有很大的优势,在这里可以实现更先进的算法。”

在技术方面,夸克搜索技术负责人向我们介绍,夸克在自然语言理解、知识图谱、多模内容理解方面都有大量投入:

在过去一年多的时间里,夸克构建了超大规模的基础的阅读理解的数据集,为网页搜索提供了段落级、句子级、单词级别不同粒度的阅读理解技术。

抽取网页文本的知识,将其与结构化的知识做融合,构建知识体系。目前已经在医疗类搜索中得到应用。

最后就是之前提到的对视频内容的理解。

除了搜索的基础技术外,夸克还在AR、VR围绕这些交互方式上有非常多的探索。

作为阿里前沿技术的大脑,达摩院也为夸克输送了大量的技术。

前不久达摩院提出的StructBERT,在通用语言理解评估基准GLUE上超过了谷歌、微软,排名第一。

5

这篇研究成果也被国际顶级AI学术会议ICLR 2020收录,夸克团队也很快将这项技术用到自己的搜索产品当中来。

去年谷歌将BERT用于文字搜索,大大提高搜索结果的准确性,夸克在方面紧跟国外前沿公司的潮流。

技术以人为本,以上的技术离不开夸克团队内部人才的吸引和培养机制。

现在的团队中也有很多搜索行业的老兵,他们分别来自各大互联网顶级公司。

据夸克搜索技术负责人介绍,现在的搜索技术团队,最初来自于阿里的多个业务领域的技术团队,之前研究过聊天机器人、智能问答等技术场景,后来还参加过智能音箱相关技术的研发。

技术团队不是天生为搜索,但是却与现在的智能搜索技术紧密关联。

面对瞬息万变的搜索市场,夸克也在及时获取新鲜血液,有很多入职不到两三年的新阿里人渐渐加入到当中来,不断壮大团队。

虽然夸克的完成度已经很高,但是未来还有很大的提升空间,尤其是视频搜索、交互模式等方面。这离不开更多新人的加入。

嗣寿希望,能够更多年轻人加入夸克,夸克的AI研发岗位会一直向顶尖技术人才敞开,为做出更好中文搜索引擎的愿景一起努力。

【云栖号在线课堂】每天都有产品技术专家分享!
课程地址:https://yqh.aliyun.com/live

立即加入社群,与专家面对面,及时了解课程最新动态!
【云栖号在线课堂 社群】https://c.tb.cn/F3.Z8gvnK

原文发布时间:2020-06-16
本文作者:晓查
本文来自:“量子位公众号”,了解相关信息可以关注“公众号 QbitAI”

相关文章
|
22天前
|
人工智能 供应链 搜索推荐
生成式 AI 与向量搜索如何扩大零售运营:巨大潜力尚待挖掘
唯有打破领域壁垒,让数据在整个系统中流转 方可实现 AI 驱动的自动化增长
|
27天前
|
人工智能 搜索推荐 API
用于企业AI搜索的Bocha Web Search API,给LLM提供联网搜索能力和长文本上下文
博查Web Search API是由博查提供的企业级互联网网页搜索API接口,允许开发者通过编程访问博查搜索引擎的搜索结果和相关信息,实现在应用程序或网站中集成搜索功能。该API支持近亿级网页内容搜索,适用于各类AI应用、RAG应用和AI Agent智能体的开发,解决数据安全、价格高昂和内容合规等问题。通过注册博查开发者账户、获取API KEY并调用API,开发者可以轻松集成搜索功能。
|
24天前
|
人工智能
云端问道12期-构建基于Elasticsearch的企业级AI搜索应用陪跑班获奖名单公布啦!
云端问道12期-构建基于Elasticsearch的企业级AI搜索应用陪跑班获奖名单公布啦!
168 2
|
1月前
|
消息中间件 人工智能 Cloud Native
|
28天前
|
机器学习/深度学习 人工智能 自然语言处理
阿里云百炼大模型:引领企业智能化升级的下一代 AI 驱动引擎
随着人工智能技术的快速发展,大规模预训练模型正在改变各行各业的智能化进程。阿里云百炼大模型(Ba-Lian Large Model)作为阿里云推出的企业级 AI 解决方案,通过深度学习、自然语言处理、计算机视觉等前沿技术,帮助企业实现智能化升级,提升业务效率和创新能力。本文将详细介绍阿里云百炼大模型的核心技术、应用场景及其优势,帮助企业更好地理解和利用这一革命性工具。
174 1
|
1月前
|
人工智能 编解码 文字识别
阿里国际AI开源Ovis1.6,多项得分超GPT-4o-mini!
阿里国际AI团队提出了一种名为Ovis (Open VISion)的新型多模态大模型的架构。
|
1月前
|
人工智能 Ubuntu Linux
安装阿里图文融合AI - AnyText心路历程(安装失败告终,心痛!)
安装阿里图文融合AI - AnyText心路历程(安装失败告终,心痛!)
|
2月前
|
人工智能 前端开发 Java
Spring Cloud Alibaba AI,阿里AI这不得玩一下
🏀闪亮主角: 大家好,我是JavaDog程序狗。今天分享Spring Cloud Alibaba AI,基于Spring AI并提供阿里云通义大模型的Java AI应用。本狗用SpringBoot+uniapp+uview2对接Spring Cloud Alibaba AI,带你打造聊天小AI。 📘故事背景: 🎁获取源码: 关注公众号“JavaDog程序狗”,发送“alibaba-ai”即可获取源码。 🎯主要目标:
70 0
|
3天前
|
存储 XML 人工智能
深度解读AI在数字档案馆中的创新应用:高效识别与智能档案管理
基于OCR技术的纸质档案电子化方案,通过先进的AI能力平台,实现手写、打印、复古文档等多格式高效识别与智能归档。该方案大幅提升了档案管理效率,确保数据安全与隐私,为档案馆提供全面、智能化的电子化管理解决方案。
69 48
|
3天前
|
机器学习/深度学习 人工智能 自然语言处理
当前AI大模型在软件开发中的创新应用与挑战
【10月更文挑战第31天】2024年,AI大模型在软件开发领域的应用取得了显著进展,从自动化代码生成、智能代码审查到智能化测试,极大地提升了开发效率和代码质量。然而,技术挑战、伦理与安全问题以及模型可解释性仍是亟待解决的关键问题。开发者需不断学习和适应,以充分利用AI的优势。

热门文章

最新文章