完全想不到,烦人的验证码,早期还被用来书籍电子化!

我们每天上网,浏览网页,登录app,购买车票,打开游戏......总是会填写一些验证码。这些验证码虽然耽误不了太多的时间,但是多多少少让人觉得讨厌。

要说这个验证码的作用,很多人都知道,这是为了区分用户是计算机还是人类行为的一种公共的全自动程序,可以防止刷票,灌水,恶意破解等行为的发生,当我们的账号处于异常的时候,验证码还能够起到保证个人信息安全的作用。

验证码这个名字最早是在2002年的时候被卡内基梅隆大学的路易斯·冯·安、Manuel Blum、Nicholas J.Hopper以及IBM的John Langford所提出的。他们对验证码做出了一些很深刻的研究,最后还顺利的将其程序化。从那以后,大量的验证码便开始被广泛的应用到了网站之中,由于当时图像的识别技术有限,简单的验证码就能够有效的阻止黄牛软件的肆意妄为,一直到今天,验证码的作用依然非常的明显,甚至验证码的作用还得到了进一步的拓展,每天全球有过亿数量级各式各样的验证码被人们填写。

每天这么多的验证码被填写,花费的时间平摊到每一个用户身上其实并没有多少。在2003年,路易斯认为既然计算机拥有着强大的数据计算能力,而人又有着很强的图像感知能力,那么为什么不利用填写验证码这一行为做点什么呢?

2007年,路易斯创立了reCAPTCHA工作室,他们要把海量的书籍和手稿转化为电子文本,可是由于质量太差,通过电脑扫描识别经常会出现错误。出于这个原因,他们首先提供一套新型的验证码服务,视觉单词识别系统。把一些古老的书籍或者手稿扫描成图片,在将这样的图片分割成了一小片一小片,把这些小片的图片和真的验证码绑定在一起,传给世界上各大网站。当用户填写验证码的时候,就会去识别这些图片,当同一幅图片被大多数人标记为某一个字母的时候,就会被记录下来并且传回。根据分发的规则,这些回收的数据经过处理很快就能够凑成一本完整的电子书。

现在还有很多的人气很高的网站都在采用reCAPTCHA验证码服务,以目前的速度,要电子化“互联网档案馆”提供的所有文本还有很长的路要走。

由于图片识别技术的成熟,简单的验证码很容易就能被机器辨认,因此越来越多的新型验证码被使用,比如滑动验证,问答验证,图片类型验证,点击验证,语音认证等等。同时由于日常生活场景也发生了巨大的变化,验证码也有了许多新的使命,有的时候遇到一些奇形怪状的验证码,还真的让人有些闹心。总而言之,验证码在网络秩序的维护上有着非常大的作用,说不定曾经的你就为某个古老文献的电子化做出过小小的贡献!