完全想不到,煩人的驗證碼,早期還被用來書籍電子化!

我們每天上網,瀏覽網頁,登錄app,購買車票,打開遊戲......總是會填寫一些驗證碼。這些驗證碼雖然耽誤不了太多的時間,但是多多少少讓人覺得討厭。

完全想不到,煩人的驗證碼,早期還被用來書籍電子化!

要說這個驗證碼的作用,很多人都知道,這是為了區分用戶是計算機還是人類行為的一種公共的全自動程序,可以防止刷票,灌水,惡意破解等行為的發生,當我們的賬號處於異常的時候,驗證碼還能夠起到保證個人信息安全的作用。

完全想不到,煩人的驗證碼,早期還被用來書籍電子化!

驗證碼這個名字最早是在2002年的時候被卡內基梅隆大學的路易斯·馮·安、Manuel Blum、Nicholas J.Hopper以及IBM的John Langford所提出的。他們對驗證碼做出了一些很深刻的研究,最後還順利的將其程序化。從那以後,大量的驗證碼便開始被廣泛的應用到了網站之中,由於當時圖像的識別技術有限,簡單的驗證碼就能夠有效的阻止黃牛軟件的肆意妄為,一直到今天,驗證碼的作用依然非常的明顯,甚至驗證碼的作用還得到了進一步的拓展,每天全球有過億數量級各式各樣的驗證碼被人們填寫。

完全想不到,煩人的驗證碼,早期還被用來書籍電子化!

每天這麼多的驗證碼被填寫,花費的時間平攤到每一個用戶身上其實並沒有多少。在2003年,路易斯認為既然計算機擁有著強大的數據計算能力,而人又有著很強的圖像感知能力,那麼為什麼不利用填寫驗證碼這一行為做點什麼呢?

2007年,路易斯創立了reCAPTCHA工作室,他們要把海量的書籍和手稿轉化為電子文本,可是由於質量太差,通過電腦掃描識別經常會出現錯誤。出於這個原因,他們首先提供一套新型的驗證碼服務,視覺單詞識別系統。把一些古老的書籍或者手稿掃描成圖片,在將這樣的圖片分割成了一小片一小片,把這些小片的圖片和真的驗證碼綁定在一起,傳給世界上各大網站。當用戶填寫驗證碼的時候,就會去識別這些圖片,當同一幅圖片被大多數人標記為某一個字母的時候,就會被記錄下來並且傳回。根據分發的規則,這些回收的數據經過處理很快就能夠湊成一本完整的電子書。

完全想不到,煩人的驗證碼,早期還被用來書籍電子化!

現在還有很多的人氣很高的網站都在採用reCAPTCHA驗證碼服務,以目前的速度,要電子化“互聯網檔案館”提供的所有文本還有很長的路要走。

完全想不到,煩人的驗證碼,早期還被用來書籍電子化!

由於圖片識別技術的成熟,簡單的驗證碼很容易就能被機器辨認,因此越來越多的新型驗證碼被使用,比如滑動驗證,問答驗證,圖片類型驗證,點擊驗證,語音認證等等。同時由於日常生活場景也發生了巨大的變化,驗證碼也有了許多新的使命,有的時候遇到一些奇形怪狀的驗證碼,還真的讓人有些鬧心。總而言之,驗證碼在網絡秩序的維護上有著非常大的作用,說不定曾經的你就為某個古老文獻的電子化做出過小小的貢獻!


分享到:


相關文章: