
驗證碼(CAPTCHA)是“Completely Automated Public Turing test to tell Computers and Humans Apart”(全自動區(qū)分計算機和人類的圖靈測試)的縮寫。它是一種區(qū)分用戶是計算機和人的公共全自動程序,被廣泛應(yīng)用于垃圾郵件過濾、在社交網(wǎng)絡(luò)上,識別并防止機器人賬號發(fā)布冒充真人的內(nèi)容(這些內(nèi)容很可能包含垃圾或欺詐信息)。然而現(xiàn)如今,在像Facebook這樣的社交媒體平臺上仍然存在規(guī)模龐大的虛假賬戶,這也清楚地表明這種機制并非萬無一失。
最近,在有關(guān)圖像識別機制和機器學(xué)習(xí)的一篇題為《又一個文本驗證碼解算器:基于生成對抗網(wǎng)絡(luò)(GAN)的方法》的研究論文中指出,設(shè)計出能夠更為精確地檢測計算機和人類的自動化程序非常重要,為了實現(xiàn)這一目的,研究人員使用基于深度學(xué)習(xí)方法的人工智能技術(shù)開發(fā)了一套新的算法。
這個新系統(tǒng)非常有效地解決了驗證碼安全和身份驗證系統(tǒng)存在的不足之處。此外,它還可以大大提升現(xiàn)行識別器對各網(wǎng)站驗證碼的識別準(zhǔn)確率,以確保實現(xiàn)最佳防護。
據(jù)悉,這種新算法是由中國西北大學(xué)、英國蘭卡斯特大學(xué)以及北京大學(xué)的計算機科學(xué)家們共同開發(fā)的。該論文聲稱,這種新型解算器(solver)將能夠提供比基于文本的方法更高的準(zhǔn)確率。它可以輕松地破解以前的攻擊系統(tǒng)無法破解的驗證碼版本。此外,該解算器的速度也是無與倫比的,能夠在短短0.5秒內(nèi)識別出多種驗證碼。
早期基于文本的驗證碼是該技術(shù)的第一次迭代,目前在網(wǎng)絡(luò)安全性方面已經(jīng)不再適應(yīng)時代發(fā)展需求。這種驗證碼涉及使用字母和數(shù)字的混合,以及其他諸如遮擋線之類的特征,以此來區(qū)分計算機和人類。歸根結(jié)底,基于文本的驗證碼背后的基本思想是,人類可以輕松地識別出字母和數(shù)字,而計算機不可以。
據(jù)了解,這項最新成果的新穎之處在于,它使用了生成對抗網(wǎng)絡(luò)(GAN)技術(shù)來創(chuàng)建訓(xùn)練數(shù)據(jù)。該技術(shù)涉及教授驗證碼生成程序以創(chuàng)建大量與原始驗證碼無法區(qū)分的訓(xùn)練驗證碼。然后,這些數(shù)據(jù)就可以被用于快速地訓(xùn)練解算器,再針對真正的驗證碼進行測試。如此一來,使用機器學(xué)習(xí)的自動化驗證碼技術(shù)就能夠減少識別和手動標(biāo)記驗證碼以訓(xùn)練軟件所涉及的時間和精力。

該研究的發(fā)起人之一、蘭卡斯特大學(xué)計算與通信學(xué)院副教授Zheng Wang表示:
“
這是第一次使用基于生成對抗網(wǎng)絡(luò)(GAN)的方法來構(gòu)建解算器。我們的工作成果表明,當(dāng)前這種基于文本的驗證碼方案所采用的安全功能在深度學(xué)習(xí)方法下特別容易受到攻擊。惡意行為者可以毫不費力地針對基于文本的驗證碼方案發(fā)動攻擊。
論文介紹稱,雖然深度神經(jīng)網(wǎng)絡(luò)在圖像識別方面表現(xiàn)出驚人的性能。但是,想要構(gòu)建成功的模型,通常需要數(shù)百萬個手動標(biāo)記的圖像才能實現(xiàn)順利學(xué)習(xí)。而這套系統(tǒng)不需要收集和標(biāo)記數(shù)以百萬計的驗證碼文本數(shù)據(jù),只需要500組數(shù)據(jù)就可以成功學(xué)習(xí)。
由于新的解算器需要最少的人為參與,因此很容易重建它以適應(yīng)新的或修改的驗證碼方案。目前,該系統(tǒng)已在33個不同的驗證碼系統(tǒng)中進行了成功測試,其中11個來自世界上最受歡迎的一些網(wǎng)站,包括eBay和維基百科等。

圖中數(shù)據(jù)為該系統(tǒng)與現(xiàn)行識別器對各網(wǎng)站驗證碼識別準(zhǔn)確率的對比,可以看到,大部分測試中的成功識別率都得到了大幅度提升
該研究的主要學(xué)生作者Guixin先生表示:鑒于實驗的方法對大多數(shù)文本驗證碼方案都取得了很高的識別成功率,因此建議網(wǎng)站應(yīng)該棄用驗證碼。
研究人員還認(rèn)為,對于網(wǎng)站而言,是時候開始尋找其他驗證方法了!此外,研究人員還建議網(wǎng)站應(yīng)該考慮使用擁有多層安全性(例如用戶的使用模式、設(shè)備位置甚至生物識別信息)的替代檢測措施。
完整論文地址:
本文轉(zhuǎn)自安全牛,jasmine
原文鏈接:https://mp.weixin.qq.com/s/lENUmyuCxhYcwE17-otUTQ