煩人的驗證碼怎麼還沒被淘汰?

驗證碼:互聯網極客善惡鬥爭的見證者。

首先我們需要區分一個概念。短信驗證碼和網站的圖形驗證碼並不是一回事。

當你在手機上註冊APP賬號,點擊獲取驗證碼,網站後臺會生成驗證碼內容,將你的手機號和驗證碼內容發送給短信服務商,他們會判斷驗證碼內容是否合規,手機號碼是否正確,然後將內容提交給短信運營商。最後以短信形式下發到你的手機。

煩人的驗證碼怎麼還沒被淘汰?

短信驗證碼,是在判斷你是不是你。

但互聯網上的網站驗證碼,則並沒有這麼簡單。

煩人的驗證碼怎麼還沒被淘汰?

先來說說為什麼要有驗證碼。

2000年啊。那會各種社交軟件都還沒出現,人類經常用伊妹兒溝通,真正做到海內存知己,天涯若比鄰。然而一幫好死不死的騙子,批量註冊郵箱,大規模群發詐騙郵件。試想一下,一打開郵箱,滿屏幕都是賣大力丸和壯陽藥的廣告,感覺很不爽吧?

煩人的驗證碼怎麼還沒被淘汰?

就連郵箱服務提供商,雅虎公司都莫得辦法分辨,註冊郵箱的是人還是鬼。


來自危地馬拉的計算機天才,路易斯·馮·安(Luis von Ahn)提出一個劃時代的解決方案,在註冊郵箱時,安排一個判定環節。也就是讓用戶輸入一串扭曲、重疊、蓋了油汙的字母或數字。

煩人的驗證碼怎麼還沒被淘汰?

這個工作,人類是很容易做到的,但對於當時的機器來說,根本辦不到。

這套系統,叫做CAPTCHA,即完全自動化的把機器和人類區分開的公共圖靈測試。嚴格來說,驗證碼應該叫“反向圖靈測試”,因為它的本質是由機器判斷你是不是人。

煩人的驗證碼怎麼還沒被淘汰?

阻止騙子惡意註冊的問題,暫時被解決了,但又帶了一個新問題,填驗證碼,太費時了。我們簡單算一筆賬。假設填一次驗證碼花10秒,加起來所有人每天就要浪費20多億秒,也就是63.4年。有這時間乾點什麼不好?

煩人的驗證碼怎麼還沒被淘汰?

安天才又開始思考,能不能讓這段時間被高效的利用?他把目光瞄準了那些亟待被電子化的海量圖書。如果人工輸入這些圖書,無疑,非常耗時,用電子掃描,也基本都是糊成一片。

煩人的驗證碼怎麼還沒被淘汰?

為了解決這個痛點,他又重新設計了名為reCAPTCHA的驗證碼系統。

這個系統由兩部分組成。

第一部分和之前一樣,是自動生成的內容,用來檢測你是不是人。而第二部分,就是機器無法識別的文本。如果第一部分你輸入正確了,機器就會假設第二部分也是正確的,通過驗證,然後把錄入結果返回到主機。

煩人的驗證碼怎麼還沒被淘汰?

別擔心,主機會把第二部分的內容發送給多個用戶,進行交叉驗證,確保不會出錯。

煩人的驗證碼怎麼還沒被淘汰?

所以說,其實我們不知不覺,為人類的文明做出了巨大貢獻!自推出至今,reCAPTCHA系統已經數字化了1300萬篇文章,2500萬本圖書。今天,全世界每天約有2億個字符被reCAPTCHA錄入,這相當於一個高級打字員,上24小時的班,連上2年半的工作量。

然而,在人類通過驗證碼創造價值的同時,騙子也沒閒著,他們想出各種辦法對付驗證碼。

第一個辦法,就是把填驗證碼的工作外包給大量的人類勞工。比如說在印度,每填寫1000個驗證碼可獲得0.8-1.2美元的收入。如果你一天能填3000個,報酬就差不多和印度南部一些流水線加工廠的日薪持平了。

煩人的驗證碼怎麼還沒被淘汰?

而更為高級的辦法,就是使用人工智能。

2017年,美國人工智能公司Vicarious就提出用人工智能技術,破解驗證碼。這套方法,也叫遞歸皮質網絡。翻譯為人話,就是給機器看一定數量的圖片,它就可以自己總結出規律,識別驗證碼中變形的圖案。

煩人的驗證碼怎麼還沒被淘汰?

所以,極客們不得不再想出更厲害的驗證碼。

在谷歌收購了reCAPTCHA系統後,他們推出了一種沒有驗證碼的驗證碼,即“I'm not a robot”。

煩人的驗證碼怎麼還沒被淘汰?

這套驗證碼背後,同樣有強大的人工智能做支撐。當你在移動鼠標的時候,它們會收集大量的信息,包括IP地址,來判斷你平時的瀏覽習慣,包括反應時間、拖拽鼠標的速度和軌跡等等。

以此來判斷你到底是不是人。

那你一定要問了,既然技術這麼厲害了,為什麼還會碰上下圖這些驗證碼呢?

煩人的驗證碼怎麼還沒被淘汰?

其實,這是為了訓練人工智能。

人類識別的這些圖片,會變成標註好的數據,用來給人工智能用作訓練算法模型。數據標註越準確、數量越多、模型的效果也就越好。所以,人工智能需要海量的標註數據,最好的辦法,自然是讓人類一起參與這一工作,也叫“眾包”。

比如給車輛、摩托車、自行車打邊框,這類圖片就是用來訓練智能攝像頭的識別能力。

煩人的驗證碼怎麼還沒被淘汰?

再比如分辨建築物的邊緣,就是用來提升自動駕駛系統對周邊環境的認知能力。

煩人的驗證碼怎麼還沒被淘汰?

任何一種天才的設想,都代表著人類無窮無盡的創意和智慧。技術給了我們新的便利和可能,卻也會讓惡者破壞生態和美好。但人類總是能用創造性的手段,把文明拉回正確的賽道。這才是我們生而為人的驕傲。

煩人的驗證碼怎麼還沒被淘汰?

編輯:張語格

編導:基德A

排版:新桐

煩人的驗證碼怎麼還沒被淘汰?

參考資料:

1:新聞實驗室:《驗證碼的故事:互聯網的一個縮影》;

2:硅星人:《你以為自己在填驗證碼,其實是在給谷歌做義務勞動》,2018年;

3:造就Talk:《人人都討厭驗證碼,但我們為什麼離不開它》,2019年;

4:新浪科技:《是誰設計了讓人亦愛亦恨的驗證碼》,2015年;

5:新浪科技:《人工智能:真的需要不少“人工”》,2017年;

6:CAPTCHA - Wikipedia;

7:The Surprisingly Devious History of CAPTCHA | Mental Floss;

8:CAPTCHA: The story behind those squiggly computer letters;

9:CAPTCHA: A brief history - HeX Productions。


分享到:


相關文章: