深入搜索引擎原理 | 5月15日云栖夜读

简介: 在本刊开篇文章中,讲述了:之前几段工作经历都与搜索有关,现在也有业务在用搜索,对搜索引擎做一个原理性的分享,包括搜索的一系列核心数据结构和算法,尽量覆盖搜索引擎的核心原理,但不涉及数据挖掘、NLP等。文章有点长,多多指点~~ # 一、搜索引擎引题 ## 搜索引擎是什么? 这里有个概念需要提一下。

点击订阅云栖夜读日刊,专业的技术干货,不容错过!

阿里专家原创好文

1.深入搜索引擎原理

本文讲述:之前几段工作经历都与搜索有关,现在也有业务在用搜索,对搜索引擎做一个原理性的分享,包括搜索的一系列核心数据结构和算法,尽量覆盖搜索引擎的核心原理,但不涉及数据挖掘、NLP等。文章有点长,多多指点~~ # 一、搜索引擎引题 ## 搜索引擎是什么? 这里有个概念需要提一下。阅读更多》》

2.印度版的“大众点评”如何将 Food Feed 业务从 Redis 迁移到 Cassandra

Zomato 是一家食品订购、外卖及餐馆发现平台,被称为印度版的“大众点评”。目前,该公司的业务覆盖全球24个国家(主要是印度,东南亚和中东市场)。本文将介绍该公司的 Food Feed 业务是如何从 Redis 迁移到 Cassandra 的。阅读更多》》

3.如何实现7*24小时灵活发布?阿里技术团队这么做

本文讲述研发效能分为两块,一是用技术的更新来提升效率;二是提高整个技术生态中的协同效率,激发技术活力。阅读更多》》

4.OPPO数据中台之基石:基于Flink SQL构建实数据仓库

本文整理自 2019 年 4 月 13 日在深圳举行的 Flink Meetup 会议,分享嘉宾张俊,目前担任 OPPO 大数据平台研发负责人,也是 Apache Flink contributor。阅读更多》》

5.etcd 在超大规模数据场景下的性能优化

里云智能事业部高级开发工程师 陈星宇(宇慕) 概述 etcd是一个开源的分布式的kv存储系统, 最近刚被cncf列为沙箱孵化项目。etcd的应用场景很广,很多地方都用到了它,例如kubernetes就用它作为集群内部存储元信息的账本。阅读更多》》

视频课程及PPT下载

1.图数据库GDB——Gremlin介绍及范例
第一部分:Gremlin基础与概念
第二部分:Gremlin场景与查询范例
第三部分:Gremlin最佳实践
视频地址:https://yq.aliyun.com/live/1083
PPT下载地址:https://yq.aliyun.com/download/3549

2.DTCC 2019第十届中国数据库技术大会--《云时代数据库迁移 & 容灾技术新进展与应用》
视频地址:https://yq.aliyun.com/live/1048
PPT下载地址:待上传

3.阿里云新品发布会第57期:DataWorks 实时数据开发平台发布会
视频地址:https://yq.aliyun.com/live/1019
PPT下载地址:待上传

更多精彩直播

热门话题

1.菜鸟进阶 | 程序员必备装备有哪些?

  • 那么,大家都用过哪些神装备?拉出来遛一遛哇~ Show Time !!!

点此进入回答赢取礼物

2.阿里开发者招聘节 | 面试题15-17:如何看待异构计算在整个云计算中的位置和作用?

  • 请分析MaxCompute产品与分布式技术的关系、当前大数据计算平台类产品的市场现状和发展趋势。
  • 一颗现代处理器,每秒大概可以执行多少条简单的MOV指令,有哪些主要的影响因素?
  • 请计算XILINX公司VU9P芯片的算力相当于多少TOPS,给出计算过程与公式。

点此进入回答赢取礼物

往期精彩回顾

架构整洁之道, 看这一篇就够了 | 5月14日云栖夜读

点击订阅云栖夜读日刊,专业的技术干货,不容错过!

目录
相关文章
|
分布式计算 资源调度 算法
Meetup杭州站!精华内容合集
Meetup杭州站!精华内容合集
154 0
|
消息中间件 Apache RocketMQ
优秀实践案例征集火热开启,快来投稿!
RocketMQ 社区「优秀实践案例征集」活动开始啦! 将RocketMQ实践过程中的最佳实践与踩坑经历,快来和大家分享 优秀案例作者更有机会参与RocketMQ Summit、获得社区纪念
123 0
优秀实践案例征集火热开启,快来投稿!
|
机器学习/深度学习 人工智能 监控
DayDayUp:7月25日,如何打造技术品牌影响力?顶级大咖独家传授—阿里云乘风者计划专家博主&CSDN TOP1“一个处女座程序猿”《我是如何通过写作成为百万粉丝博主的?》演讲全文回顾
DayDayUp:7月25日,如何打造技术品牌影响力?顶级大咖独家传授—阿里云乘风者计划专家博主&CSDN TOP1“一个处女座程序猿”《我是如何通过写作成为百万粉丝博主的?》演讲全文回顾 目录 个人简介 一、什么内容是受欢迎的写作内容? 1.1、学生(计算机相关)群体 1.2、同行(开发者)群体 1.3、好内容的特点 二、一些经典的技术文章逻辑框架设计 2.1、从写作逻辑和结构角度考虑 (1)、对于bug类型的文章——通过分析刨根问底 (2)、对于学习类型的文章—通过案例学以致用 (3)、对于总结类型的文章—通过思考产生共鸣 2.2、从写作技巧考虑 (1)、题目和摘要必须简单、清晰明了且定位
DayDayUp:7月25日,如何打造技术品牌影响力?顶级大咖独家传授—阿里云乘风者计划专家博主&CSDN TOP1“一个处女座程序猿”《我是如何通过写作成为百万粉丝博主的?》演讲全文回顾
|
网络协议 云栖大会 调度
探秘2021云栖大会 | DNS论坛亮点抢先看!
云栖大会开启倒计时,DNS论坛诚意满满,惊喜无限,期待您的参加!
探秘2021云栖大会 | DNS论坛亮点抢先看!
|
存储 Kubernetes Cloud Native
重磅合集 | 31 篇技术文章,带你从零入门 K8s (留言赠书)
由阿里云与 CNCF 共同开发的《CNCF x Alibaba 云原生技术公开课》(视频课程)第一期已更新完毕。本文整理了全部课程文章 31 篇,期待给正在学习 Kubernetes 的同学提供一些参考。
12946 0
重磅合集 | 31 篇技术文章,带你从零入门 K8s (留言赠书)
|
机器学习/深度学习 人工智能 算法
【云栖大会精彩回顾 】 | 一文了解搜索&推荐产品技术论坛
解读本期云栖大会搜索与推荐论坛的精彩内容,公布活动中奖名单~
5228 0
【云栖大会精彩回顾 】 | 一文了解搜索&推荐产品技术论坛
2019阿里巴巴技术面试题集锦 | 6月5号云栖夜读
在本刊开篇文章中,讲述了:为帮助开发者们提升面试技能、有机会入职阿里,云栖社区特别制作了这个专辑——阿里巴巴资深技术专家们结合多年的工作、面试经验总结提炼而成的面试真题这一次整体放出。并通过这些笔试真题开放阿里巴巴工作机会,让更多的开发者加入到阿里这个大平台。
6277 0
|
大数据 云栖大会 云计算
新书来了!一本书集讲述《云栖之路》(附下载)
阿里云研究中心及《大数据时代》杂志社特推出聚焦基于云计算、数据创新应用的云上实践案例集《云栖之路》,这本书集结了来自多位云上先行者们的技术积淀、创新实践,云栖社区带你先睹为快!
28451 0
|
前端开发 中间件 程序员
【资料合集】首届互联网新兵进阶在线峰会:讲义PDF+活动视频!(持续更新)
阿里云云栖社区与云翼计划联合主办了首届互联网新兵进阶在线峰会,两个阿里老人与4位刚进入角色的新兵分别分享了技术人的职业规划与面试和成长经验,我们将本次峰会的讲义PDF+活动视频整理出来,以供大家学习参考。
25167 0
|
存储 弹性计算 人工智能
10年后,阿里给千万开源人写了一封信 | 1月15号云栖号夜读
今天的首篇文章,讲述了:年末将至,阿里巴巴开源技术委员会负责人贾扬清写了一封信,想要和热爱开源的你说一声:谢谢。未来,我们希望与更多开源人一起,用技术普惠世界。
2909 0
下一篇
DataWorks