谷歌收购的这家公司值多少钱?

简介:

垃圾邮件危机

20世纪90年代后期,网络逐渐变得拥堵起来。有人开发了一款名为“Spambots”的垃圾邮件程序软件,向成千上万名用户批量发送广告信息,淹没收件人的电子邮箱。他们会在各种网站上注册,然后在评论部分留下成百上千条广告。网络因此成了一个不守规矩、不受欢迎、不够友善的地方。而且,这种软件似乎打破了网络原有的开放性和易用性模式,要知道,正是这种模式向人们提供了各种便利,比如免费电子邮件。当票务公司根据“先到先服务”的原则提供演唱会门票网上订票服务时,作弊软件会偷偷摸摸跑到真正排队的人之前,将门票全部买下。


路易斯·冯·安的“验证码”解决方案


2000年,22岁大学刚毕业的路易斯·冯·安(Luis Von Ahn)提出了解决这个问题的想法:要求注册人提供真实身份证明。他试图找出一些人类容易辨别但对机器来说却很难的东西,最后他想到了一个办法,即在注册过程中显示一些波浪状、辨识度低的字母。人能够在几秒钟内识别并输入正确的文本信息,但电脑却可能会被难倒。


雅虎采用了这个方法以后,一夜之间就减轻了垃圾邮件带来的苦恼。冯·安将他的这一创作称为验证码(全称为“全自动区分计算机和人类的图灵测试”)。


五年后,每天约有2亿的验证码被用户输入。


这一切给冯·安这位家里经营糖果厂的危地马拉人带来了相当高的知名度,使他能够在取得博士学位后进入卡内基梅隆大学工作,教授计算机科学;也使他在27岁时获得了50万美元的麦克阿瑟基金会“天才奖”。


但是,当他意识到每天有这么多人要浪费10秒钟的时间输入这堆恼人的字母,而随后大量的信息被随意地丢弃时,他并没有感到自己很聪明。


改进——ReCaptcha

于是,他开始寻找能使人的计算能力得到更有效利用的方法。他想到了一个继任者,恰如其分地将其命名为ReCaptcha。和原有随机字母输入不同,人们需要从计算机光学字符识别程序无法识别的文本扫描项目中读出两个单词并输入。其中一个单词其他用户也识别过,从而可以从该用户的输入中判断注册者是人;另一个单词则是有待辨识和解疑的新词。为了保证准确度,系统会将同一个模糊单词发给五个不同的人,直到他们都输入正确后才确定这个单词是对的。



ReCaptcha值多少钱?

在这里,数据的主要用途是证明用户是人,但它也有第二个目的:破译数字化文本中不清的单词。与雇用人所需要花费的成本相比较,它释放出的价值是非常巨大的。


假设每天完成的ReCaptcha超过2亿次,平均每次输入要5秒,2012年美国的最低工资是每小时7.25美元,如果没有这套系统,每天开销:


7.25*(5*200,000,000/3600) = 201万美元


或者说每年需要花费 7.35亿多美元冯·安设计的这个系统做到了这一点,并且,没有花一分钱!


谷歌收购

ReCaptcha的作用得到了认可,2009年谷歌收购了冯·安的公司,并将这一技术用于图书扫描项目,在过去几年中,谷歌还开始使用reCAPTCHA 转录谷歌街景中的门牌号码。很可惜,我们在网上并没有查到具体的收购金额。


资料来源:http://zh.wikipedia.org/wiki/Google公司收購列表#cite_note-56


补充,其他形式的验证码

  • 图片验证码,电脑很难识别出图像内容

  • 问题验证码,用图片显示那你识别的数学题目,电脑难以计算答案

  • 3D 验证码,电脑难以识别出 3D 立体的图案

  • 广告验证码,例如给出可乐的标识,让你回答对应的品牌

  • Gif 验证码,多个图层的叠加在一起,电脑难以识别答案在哪个图层

  • 视频验证码,给出一段视频,要求识别出视频内播放出的字符


原文发布时间为:2015-03-05

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关文章
|
程序员
2020年全球程序员收入报告出炉,字节跳动成唯一上榜中国公司
Levels.fyi 网站于日前发布了一份 2020 年度程序员收入报告。报告中的薪酬数据反映的是在过去一年中收集的年度薪酬总额中位数,包括工资、股票和奖金。
2020年全球程序员收入报告出炉,字节跳动成唯一上榜中国公司