这多年来我一直在钻研的技术

简介: 上次有人说,听说tinyfool看到AlphaGo火了,马上去赶时髦学机器学习,结果真的获益匪浅。

我大学时代最爱玩的一个游戏,法老王-埃及艳后,这是一个以古代文明为背景的城市建设游戏。最近又捡起来玩了玩,还是那个味儿,倍爽。

上次有人说,听说tinyfool看到AlphaGo火了,马上去赶时髦学机器学习,结果真的获益匪浅。

我给大家介绍下,我从业10多年是怎么赶时髦的吧。

怎么赶上搜索技术的时髦

98年,第一次上网,也是第一次看到Google,那时候简直觉得Google就是天下第一的好东西。互联网是个无穷无尽的宝库。但是没有Google这把钥匙,你什么也不知道。

那时候,我就对搜索技术很感兴趣。一直在看各种技术文章,但是因为基础的问题,对各种文章的描述也不是很懂。01年,我根据一些自己的理解,写过一个原理性 的单字倒排搜索引擎,那时候,我连怎么做好中文分词都不了解。05年,看文章知道了Lucene,但是一直没有机会用,也没上过手。

08年做技术咨询的时候,客户想上一套搜索,方案公司的报价是20万。客户询问我们有没有解决方案,我当时觉得是个千载难逢的好机会,我就跟霍炬商量好,我们 试试看客户满意的话,未来还可以卖给别人。但是我们两个当时的技术路线思路不同,我看好Lucene,基于Java开发简便社区成熟,文档全面,刚刚还出 了本Lucene in action,他看好Tokyo Cabinet作者用C++写的一个搜索内核。春节放假回家,我们各自写一套,因为大家技术路线不同,所以越好不吵不闹,看产品见真章。春节7天假后,我 的更成熟一点,所以他的就放弃了。

马上交付客户,客户很满意,搜索流量暴增且每天都在持续增长,一个月不到,客户的竞争对手打电话要求买一套。

这套系统曾用于饭统、点评、六间房、FtChinese,等公司。单一服务器最大日搜索量2000万次。

怎么赶上移动互联网的时髦

01-02年,J2ME刚刚推出来的时候,我就很有热忱想在手机上写程序,但是受限于当时J2ME的设计思想,以及当时手机的机能,玩了玩,我觉得这不是我要的可以编程的手机。

其后到iOS之前,所有流行过的手机操作系统和开发环境我都碰过。我研究过J2ME在Nokia s40上的开发,研究过Symbian,研究过Android 1.0 SDK,那时候还没Android手机呢。

到了07年乔布斯宣布iPhone的时候,我觉得这就是我梦想的手机。但是那时候没有原生SDK,只有一个Web SDK,我第一时间就开始玩,后来失望的放弃了。过了1年以后,乔布斯发布了当时还叫iPhoneOS SDK的iOS SDK第一版。当天,我就发邮件给在美国读博士的朋友徐宥,请他用他的信用卡帮我买了一个开发者账号。

有了开发者账号后,我自己开发的第一个App是运行在我在朋友公司年会抽奖,运气好,得到的iPod touch上的一个记账软件。这个软件大概开发了2个星期以后,网易有道的人辗转找到我,请我帮我开发有道词典iOS版。

后来,有道词典iOS版是我上线App Store的第一个App。

最近为什么在赶机器学习的时髦

08-09 年,我们做搜索创业的时候,我就开始自学机器学习。那时候,机器学习的理念还不是很流行,更多的说法还是人工智能。还是徐宥博士,他读完回国探亲的时候, 因为他是相关专业的博士,所以他给我做了最早的启蒙。当时人工智能行业的现状,为什么从规则开始往概率转变。为什么现在流行的概念是机器学习,什么是监督 学习和非监督学习,等等。

那时候开始对机器学习感兴趣的主因是,我们做搜索的时候,大量的看跟Google有关系的东西,当Google有了大量数据积累后,大量的使用机器学习去改善自己的搜索结果,寻找更好的组织信息的方式,等等。

我是国内当时最早翻译Google GFS、Mapreduce、Bigtable论文的人之一。Google公布这三篇论文后不久,Lucene的创造者Doug Cutting就领导创建了Hadoop社区,后来还创建了Mahout,这个当然后来不够火。但是我们的研究和对市场的分析都认可,我们的搜索服务未来 和机器学习服务是非常相配的,所以,我当时花了很大精力在学习机器学习和研究怎么把他们搞成服务。我们可能也是做搜索服务的公司,最早给用户提供搜索数据 分析服务,关键词提醒服务等等,这些都是从搜索服务延展到数据服务的例子。

后来,美国次贷危机造成我们A轮融资失败以后,我们被经济形势吓到了,公司关门了。后来,我们几个先后去了盛大。而当时盛大对iOS方面的人也很缺乏,所以,我暂时就放下了机器学习。

那个时候,深度学习还没有兴起。大概是12年的一次imagenet的比赛上,深度学习的结果夺冠,然后各种比赛和论文都表现出深度学习的效果和便利性以后,才大行其道起来。

自学机器学习暂时放下以后,在我自己的网站,还让我当时的下属,在我的指导下,搭了一个贝叶斯的文章分类器做自动抓取,自动分类,放了很多年。最近,关了上 一家公司,才又有时间和心思专心学了一段时间机器学习和深度学习。当然,有动力去好好学,也是跟深度学习最近有了非常多可惜的进展有关。

不得不告诉大家的是,AlphaGo真的不算里面多重要的一个。当然AlphaGo有其非常大的价值,因为它是外界最容易理解的,也是最容易被误解的。就跟 当年的深蓝一样,其实深蓝本身对这个世界的价值不大,但是深蓝引发了大家对机器智能的兴趣,激起很多相关的讨论和研究,这是它的价值。

原文发布时间为:2018-07-31
本文来自云栖社区合作伙伴“磐创AI”,了解相关信息可以关注“磐创AI”。

相关文章
|
6月前
|
人工智能 自然语言处理 云计算
软件开发的最新趋势和未来展望
软件开发领域正处于快速发展的阶段,不断涌现出新的技术和方法。从人工智能、云计算到低代码开发,这些趋势都在推动着软件开发的革新和创新。未来,随着技术的不断进步,我们可以期待更多令人激动的变革和机遇。无论是开发者还是业务,都应该保持敏锐的洞察力,及时采纳新技术,以适应不断变化的软件开发领域。
128 1
软件开发的最新趋势和未来展望
|
JavaScript 前端开发 API
原来我误会了 changeOrigin 那么多年
前端开发中经常要配置接口代理服务,用来解决开发阶段的跨域问题。有一个常用的 changeOrigin 配置项,它究竟配置了个啥?本文做了一个小小的探究。
414 0
|
SQL 存储 DataWorks
浅谈-大数据工程师面临的困境和要学习的技术
读书的时候,语文老师总会让同学看看作者的生平简介,谈谈作者为什么会写出这篇文章,文章诞生的背景是什么背景,一方面是让同学理解文章,另外一方面是让同学感同身受。 鄙人,不是大厂,也不算外包,算是靠在阿里系的一家创业公司的交付部门的小小大数据工程师,心比天高,命比纸薄。 当然,也和上学没有好好学习有关系,怨不得其他人。 回到正题,咋们先从我的个人经历聊一下大数据工程师现在面临的困境和我的一些解决思路。
240 0
|
移动开发 人工智能 前端开发
素人程序员:如何在技术浪潮更迭中保持较高成长速度?
  技术更迭是有加速度的,一个又一个风口,一波又一波浪潮,昨天火了人工智能,今天已经大谈区块链。普通程序员们在这个进程里,应该怎样找准自己的位置,获得持续的个人成长呢?   技术更迭是有加速度的   从 2010 年开始,被定义为移动互联网的元年,移动开发也是从这一年开始逐渐开始火爆的。笔者也是从毕业之后加入这个浪潮的。据说移动开发火爆之时,理发师通过几个月培训以后也可以拿到月薪 1,2W 的薪水,可见那个时候对移动人才的饥渴程度。但是到了 2014 年底开始,移动开发的入职要求回归理性,要求逐渐提高,到现在基本大公司社招也不再招高级以下的移动开发了。
149 0
|
开发框架 供应链 Oracle
不重视技术,何谈掌握核心技术?
不重视技术,何谈掌握核心技术?
|
Web App开发 缓存 Rust
前端技术未来三年前瞻性思考
从业务场景、用户体验、研发速度、维护成本四个维度来看框架等前端技术,分享对未来三年前瞻性的思考。
10146 0
前端技术未来三年前瞻性思考
|
新零售 中间件 测试技术

相关产品