【开源访谈】Elastic 曾勇:我与 Elasticsearch 的共同成长之路

本文涉及的产品
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
简介:

Elasticsearch 由于其简单易用且能够解决实际的问题,从最开始的分布式搜索引擎到如今遍地开花的各种应用场景,Elasticsearch 正成为大数据分析的热门工具。Elasticsearch 是如何在国内发展起来的?又是如何取得今日的成就的呢?本期【开源访谈】邀请到 Elastic 工程师与布道师曾勇,和大家分享:我与 Elasticsearch 的共同成长之路。

【本期嘉宾】

曾勇(Medcl),Elastic 工程师与布道师,2015 年加入 Elastic 公司,在加入 Elastic 之前,在搜索和运维等方面积累了超过七年的经验。Elasticsearch 国内首批用户,自 2010 年起就开始接触 Elasticsearch,是 Elasticsearch 中文社区的发起人,同时也是 Elastic 在中国的首位员工。

screenshot

【访谈实录】

1、先简单做个自我介绍。(学习、工作经历,以及主要负责的领域)

关于学习经历没什么可圈可点的,普通高校毕业,唯一能说说的就是从大二开始就进工作室开始做项目。毕业时找工作,简历上项目经验可以打印三张纸,毕业之后先是在一家传统软件公司做数据仓库和元数据的产品研发,开始接触 Lucene 来做搜索,记得因为要处理元数据的搜索,那个时候几千万对我来说已经是海量了,折腾过各种方案,很是痛苦,后面就发现了 ES 这个新项目,眼前一亮,非常简单的就解决了很多问题。

后面没多久换到另外一家做人才管理的公司负责平台架构的工作,将 ES 引入进去,并成功解决了之前招聘产品搜索频繁出问题,动不动只能重建索引的情况,慢慢做成了整个公司的搜索平台,各个业务的搜索也都接进来了。

目前我是 Elastic 的工程师和技术布道师,负责 ES 在国内发展的相关工作。

2、您是在 2010 年开始接触 Elasticsearch 的,当时它在国内的使用情况如何?

我是在 2010 年三月份开始接触 ES,ES 是二月份写的第一行代码,刚开始没有什么人知道这个项目,不过因为实在是太好用了,自然而然的就会有人愿意帮忙分享。刚开始大家的用途基本上就是用来做搜索,替换 Solr 之类的搜索服务器。国内有一些小的公司,尤其是互联网公司有在用,大的互联网公司已经有一套现成的在维护,和一些同行交流,基本上是多套索引定期重建定期切换,然后我就极力推荐 ES。

3、是什么原因让您对 Elasticsearch 持有如此高的热情,以至发起 Elasticsearch 中文社区的?

主要还是 ES 实在是太好用了,设计理念也很新颖,那个时候我还接触其他的分布式系统,对比起来差距非常明显,ES 在很多细节处理的很好,对开发者真是非常友好,所以我也很佩服 ES 的创始人 Shay Banon。

至于为什么有这么高热情,出于喜欢肯定是一方面,另外工作刚好也用到,研究的也比较多,也希望让更多人和我一起用,于是建了第一个 QQ 群,方便爱好者一起交流,算是社区的第一个初始形态吧,后面人数越来越多,群也越来越多,搭网站,建 wiki,做资源聚合搜索网站,社区热心帮忙的成员也越来越多,各种线上线下活动,不知不觉 ES 的社区就慢慢起来了,但这些都不是一个人的功劳,要归功于社区的所有成员。

4、既然对 Elasticsearch 如此喜爱,为何没有一开始就加入 Elastic 公司,而是选择了自己创业?

其实也是缘分吧,ES 成立公司时我也刚被朋友来出来创业,如果 Shay 再早一个月联系我,我可能会加入Elastic,不过这都是后话,我那会已经答应朋友出来帮他了,大家在一起一干就是三年,后面公司遇到问题,创始团队成员陆续离开,然后刚好 Shay 又来找到我,后面就是这样了,现在 Elastic 也是创业公司。

5、创业的同时兼顾 Elasticsearch 中文社区的维护,是如何坚持下来的?

真的很忙,所以那几年并没有做太多社区的相关事情,一年可能就一次线下活动,不过工作中也还是一直围绕 ES 转,因为在公司很多地方都用到了 ES,ES 的这种灵活性和多用途对小团队非常适用。

6、在国内宣传推广 Elasticsearch 的过程中遇到过哪些阻碍?您是如何解决的?

作为一个新的服务端软件,让人很快接受并使用是不容易的,只能慢慢来影响,产品本身足够优秀自然就有了像我这样的爱好者帮忙传播了。

7、对于正在创业的开发者,您有什么经验和建议要与他们分享?

第一,我认为创业过程中团队很重要。作为团队领导人,一定要正确引导团队成员,协调好成员之间关系,保持团队稳定。

第二,产品本身要足够优秀。在开始创业之前,要先想清楚几个问题:自己要做什么产品,它能满足什么需求,用户是否会喜欢。而不是盲目地扎堆创业,人云亦云,那样很容易被同行误导。

文章转载自 开源中国社区[https://www.oschina.net]

相关实践学习
使用阿里云Elasticsearch体验信息检索加速
通过创建登录阿里云Elasticsearch集群,使用DataWorks将MySQL数据同步至Elasticsearch,体验多条件检索效果,简单展示数据同步和信息检索加速的过程和操作。
ElasticSearch 入门精讲
ElasticSearch是一个开源的、基于Lucene的、分布式、高扩展、高实时的搜索与数据分析引擎。根据DB-Engines的排名显示,Elasticsearch是最受欢迎的企业搜索引擎,其次是Apache Solr(也是基于Lucene)。 ElasticSearch的实现原理主要分为以下几个步骤: 用户将数据提交到Elastic Search 数据库中 通过分词控制器去将对应的语句分词,将其权重和分词结果一并存入数据 当用户搜索数据时候,再根据权重将结果排名、打分 将返回结果呈现给用户 Elasticsearch可以用于搜索各种文档。它提供可扩展的搜索,具有接近实时的搜索,并支持多租户。
相关文章
|
5月前
|
运维 架构师 搜索推荐
7 年+积累、 Elastic 创始人Shay Banon 等 15 位专家推荐的 Elasticsearch 8.X新书已上线...
7 年+积累、 Elastic 创始人Shay Banon 等 15 位专家推荐的 Elasticsearch 8.X新书已上线...
67 4
|
5月前
|
SQL 监控 搜索推荐
Elasticsearch 与 OpenSearch:开源搜索技术的演进与选择
Elasticsearch 与 OpenSearch:开源搜索技术的演进与选择
356 2
|
5月前
|
存储 安全 数据处理
Elastic 中国开发者大会2023最新干货——Elasticsearch 7、8 新功能一网打尽
Elastic 中国开发者大会2023最新干货——Elasticsearch 7、8 新功能一网打尽
55 0
|
5月前
|
存储 搜索推荐 Java
Java远程连接本地开源分布式搜索引擎ElasticSearch
Java远程连接本地开源分布式搜索引擎ElasticSearch
|
10月前
|
搜索推荐 索引
Elasticsearch elastic io 100%,但磁盘的iops和吞吐量没爆没啥原因吗?
Elasticsearch elastic io 100%,但磁盘的iops和吞吐量没爆没啥原因吗?
159 3
|
10月前
|
存储 缓存 监控
Elasticsearch elastic io 100%,但磁盘的iops和吞吐量没爆没啥原因吗?
Elasticsearch elastic io 100%,但磁盘的iops和吞吐量没爆没啥原因吗?
203 2
|
5月前
|
监控 搜索推荐 数据挖掘
一文快速了解Elastic Search 开源搜索引擎(技术选型+启动命令)
一文快速了解Elastic Search 开源搜索引擎(技术选型+启动命令)
100 0
|
12月前
|
存储 自然语言处理 监控
ElasticSearch第三讲:ES详解 - Elastic Stack生态和场景方案
ElasticSearch第三讲:ES详解 - Elastic Stack生态和场景方案
131 0
|
SQL AliSQL API
阿里云ElasticSearch安装开源插件实践
阿里云ElasticSearch安装开源插件实践,包含较为常用的NLPchina/elasticsearch-sql与medcl/elasticsearch-analysis-stconvert两个插件的安装、使用测试及同类插件的差异对比
|
数据采集 数据可视化 搜索推荐
带你读《Elastic Stack 实战手册》之3:——3.1.1.从 Elasticsearch 到 Elastic Stack(上)
带你读《Elastic Stack 实战手册》之3:——3.1.1.从 Elasticsearch 到 Elastic Stack(上)
240 0