首頁|滾動|國內|國際|運營|制造|監管|原創|業務|技術|報告|測試|博客|特約記者
手機|互聯網|IT|5G|光通信|LTE|云計算|芯片|電源|虛擬運營商|移動互聯網|會展
首頁 >> 熱點應用[圖320*120] >> 正文

亞馬遜研究新的文字識別技術,沒想到先干掉了驗證碼

2019年12月31日 07:27  愛范兒  

不管你有沒有聽過,OCR 技術已經滲入到我們生活中的方方面面。

不妨回想一下,汽車出入停車場時的車牌識別、金融業務開戶時的銀行卡識別、身份證識別、甚至是很多商務應用中的名片識別等,其實都是基于 OCR 技術的。

OCR 的發展可以追溯到 70 年代初,在數十年的發展中,OCR 的識別速度和識別成功率在不斷地提高,應用場景也在不斷地拓展。

從復雜背景中提取出文字、多種混合字體識別、低分辨率圖像中識別、多語言混合是被、錯行識別甚至是復雜多行板式識別等對于現今的 OCR 技術來說其實都已經不算什么問題。

但發展到現在,對于 OCR 技術來說依舊有一個瓶頸沒有突破,那就是彎曲文字。

什么是彎曲文字?

像這樣,

這樣,

還有這樣的。

實際上,Captcha & reCAPTCHA,也就是你登錄網站常常輸入錯的歪歪扭扭的文字驗證碼,也是基于 OCR 的這個弱點,來防止被攻擊的。

過去的 OCR 大多是解決水平文字的檢測或者傾斜文字的檢測,但其實像上圖的彎曲在生活中十分常見。

近日,亞馬遜的研究人員就開發出了一項名為‘TextTubes’來 OCR 識別算法來解決這個問題。

簡單來說,該算法首先會對目標圖像進行建模,建立一個曲線函數,然后再分析出出半徑以及中間軸,繼而生成一個文本選取分區。

效果怎么樣?

論文展示了三種不同 OCR 技術針對同一個含有彎曲字體的廣告牌的識別效果。

結果顯示,(b)和(c)會出現識別框重復的現象,(b)當中還出現了彎曲識別框未能完全覆蓋文字的情況。

這樣會帶來什么結果呢,一就是會出現導出的文字結果會有重復,而二就是會導致識別結果錯誤。

至于 TextTubes 所識別出來的效果則很完美地對廣告牌上的每一個文字區域進行分區,既不會出現重疊區域,而每一個分區也都很好地覆蓋所有文字。

為了更好地測試 TextTubes 的性能,亞馬遜在 CTW- 1500 以及 Total-Text 兩個訓練系統上進行評估。當中 CTW- 1500 含有 1500 張圖像、超過 10000 個文本實體,每張圖像至少還有一個彎曲文本,而 Total-Text 則共有 1255 個訓練圖像、300 個測試圖像,每張圖片也是含有一個或多個彎曲文本。

那么成績如何?TextTubes 在兩個測試中都獲得了優秀的成績,在 CTW- 1500 則更為突出,準確率為 83.65%,相比之下,排第二名的那位學生,準確率只有 75.6%。

亞馬遜表示,當 TextTubes 正式投入使用之后,對于那些高度依賴 OCR 技術展開業務的企業來說,是一個福音。根據 Grand View Research 的數據,市場對于 OCR 的需求仍在不斷增大,預計到 2025 年 OCR 解決方案市場規模將達到 133.8 億美元。

等等,不是說文字驗證碼是基于 OCR 的這個弱點的嗎?如果突破了,驗證碼還安全嗎?

這不所以推出了從一堆劉翔中找出王自如的驗證碼嗎?

編 輯:章芳
免責聲明:刊載本文目的在于傳播更多行業信息,不代表本站對讀者構成任何其它建議,請讀者僅作參考,更不能作為投資使用依據,請自行核實相關內容。
相關新聞              
 
人物
聞庫:5G按下快進鍵 開始走近大家的生活
精彩專題
MWC19 上海 - 智聯萬物
2019年世界電信和信息社會日大會
中國電信5G創新合作大會
2019年世界移動大會
CCTIME推薦
關于我們 | 廣告報價 | 聯系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網 CopyRight © 2007-2017 By CCTIME.COM
京ICP備08004280號  電信與信息服務業務經營許可證080234號 京公網安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經書面許可,禁止轉載、摘編、人工智能、復制、鏡像
十一选五走势图江苏 陕福彩快乐十分走势图 股票配资找小王 快乐十分前三组走势图 白姐资料公开一码一肖 秒速赛车技巧心得必胜 广西快三分析软件 江苏快3两码遗漏 股票配资平台是合法的么重生回古代小说 辽宁福彩快乐12走势图 内蒙古快三预测号码