
一位女士在演示虹膜識別。(資料圖片)

模式識別國家重點實驗室的研究者們在認真研究模式識別的機理,力圖讓電腦像人腦那樣分析和識別文字、圖像、視頻、音頻等。經濟日報記者 沈 慧攝
模式識別國家重點實驗室以模式識別基礎理論、圖像處理與計算機視覺以及語音語言信息處理為主要研究方向,為開發智能系統提供關鍵技術,科研成果大量應用于國防建設、社會安全保障和國民經濟發展領域
打開天天P圖,選擇“變臉”之如花美眷模式,來張自拍,原本有些“樸素”的面孔瞬間“美若天仙”——這種看起來不可思議的“魔法”,其背后是人臉檢測和人臉配準技術的應用,而這只是中國科學院自動化研究所模式識別國家重點實驗室頗具代表性的研究成果之一。
眼睛的“臉”、步態的“臉”、聲音的“臉”、大腦的“臉”……模式識別國家重點實驗室是一個一本正經看“臉”的地方。在這里,研究者們行走在電腦與人腦之間,專注研究各類“臉”,科研成果大量應用于國防建設、社會安全保障和國民經濟發展領域。
一個眼神“確定”你
北京北四環,模式識別國家重點實驗室內,一臺白色機器前一位女士緩緩走來。機器發出悅耳的聲音:“請靠近。”女士聽從指令向前挪了挪,眼睛對準機器。“王雅麗。”聲音再次響起,身份確認完成。
這個鑒別身份的技術就是虹膜識別。虹膜是位于人眼表面黑色瞳孔和白色鞏膜之間的圓環狀薄膜,在近紅外光下呈現出豐富的視覺紋理特征,如斑點、條紋、細絲、冠狀、隱窩等。“虹膜是唯一、穩定、安全的人體生物特征,在常見的生物特征模態中身份識別精度最高、比對速度最快、安全防偽最強,適合于大規模人群的身份認證應用。”中科院自動化所工程師黃晨告訴經濟日報記者。
據介紹,傷痕、干燥、油膩、污漬等,都會影響指紋識別的效果;人臉識別則容易受到光線、年齡、膚色、姿態、表情、妝容等多種因素的影響。
虹膜識別要實現應用并非易事。虹膜圖像獲取是虹膜識別的第一個關鍵步驟。中國科學院院士譚鐵牛回憶說,上世紀90年代末我國虹膜識別研究剛剛起步,那時國外不僅不提供用于算法研究的數據庫,就連虹膜采集設備也不賣。
實驗室從零開始,通過自主創新,打破國際上的虹膜識別技術壟斷,完成了從跟跑者到領跑者角色的轉變。如今,在虹膜圖像獲取方面,實驗室實現了從單目到雙目、由近及遠以及從固定到移動狀態的圖像獲取。與此同時,團隊自主建設的CASIA虹膜圖像數據庫成為目前國際上使用最廣泛的虹膜圖像數據庫,有來自170多個國家和地區的3萬多個科研團隊申請使用。
在完成基礎研究的同時,實驗室的虹膜識別技術也從實驗室走向了市場。去年,虹星科技有限公司研發的“駕駛員生物特征識別一體機”正式投產,將虹膜識別距離從40厘米拓展到了1.2米,僅需兩秒鐘即可完成身份確認。該設備的核心技術與團隊正是來自模式識別國家重點實驗室。
“虹膜識別技術被普遍認為是最具有發展前景的生物認證技術,具有高安全性,可用于安防、國防、電子商務等多個領域。目前,我國已形成以北京為主的虹膜研發和生產聚集地。”虹星科技有限公司創始人侯廣琦說。
一個步態“鎖定”你
與侯廣琦不同,模式識別國家重點實驗室副主任王亮這些年一直在跟蹤研究另一種生物特征識別——步態識別。
何謂步態識別?即根據一個人走路的姿態和人體信息進行身份鑒定。“比如,你平日熟悉的朋友,有一天走在街上,只憑背影你就能知道是他。”王亮說,雖然相對于人臉識別,步態識別的準確率還較低,影響識別效果的因素還很多,但在安防等一些特殊應用領域,步態識別有遠距離識別這一特定優勢。
遠距離識別能相隔多遠?按照實驗室目前的水平,只看走路的姿態,50米外,眨兩下眼睛的時間,攝像頭就可以準確辨識出特定對象。“人臉識別準確率雖高,但太遠了看不清。虹膜識別的采集距離目前最遠可以達到1.2米至1.8米。”王亮說。
步態識別以其遠距離、難隱藏性、非接觸性和非侵入性等特點從眾多生物特征識別中脫穎而出,大量應用于各個行業。以實驗室孵化的銀河水滴科技有限公司為例,一些石油企業開始引入其步態識別技術完善防控網絡,防范非法闖入者對油田安全的威脅和對油田經濟利益的損害;在智能家居領域,該公司的技術可以很好地區分用戶屬性,替代遙控器等傳統操作工具,讓家電感知更加智能化。
銀河水滴公司還與公安系統合作,首次利用步態識別技術搜索到犯罪嫌疑人。現有的公安系統缺乏有效的視頻分析和檢索工具,平均每個現發案件需要人工審核數百甚至上千小時的視頻資料。利用步態識別技術,對真實監控攝像頭拍錄的數小時視頻進行搜索比對,最終警方在近千人的目標人群中成功確認嫌疑人范圍,完成國內首次步態識別辦案工作。
“不同人的運動神經敏感度、肌肉力量特點、身體結構不同,這決定了步態的唯一性和穩定性,可以滿足特殊領域的應用需求。”黃晨表示。
計算機學會決策
虹膜、人臉、指紋、掌紋、掌靜脈、筆跡、步態……事實上,各種生物特征識別只是模式識別國家重點實驗室眾多研究方向中的一個。
究竟什么是模式識別?模式識別是對表征物體或現象的各種形式數據(主要是感知數據,如圖像、視頻、語音等)進行處理和分析,進而對物體或現象進行描述、分類和解釋的過程,是信息科學和人工智能的重要組成部分。“通俗點說,就是讓計算機模擬人類去聽、去說、去看、去讀、去思考、去決策,讓電腦像人腦那樣分析和識別文字、圖像、視頻、音頻等。”王亮解釋說。
實驗室面向國家戰略需求和國際學科前沿,開展基礎性、前瞻性、戰略性和系統性的創新研究,已成為引領模式識別領域科學研究的重要基地。
實驗室研發的高性能機器翻譯系統,率先實現了漢語和蒙藏維等少數民族語言之間的自動翻譯,翻譯的準確率和速度均已達到國際先進水平,該系統廣泛應用于大型跨國公司、軍隊等部門,在保障國家信息安全方面發揮了重要作用。
針對各類文檔圖像,實驗室提出了有效的版面分析、文本行提取和識別方法,獲得了領先的性能,在金融和安全等領域實現了規模化應用。
實驗室研發的高性能多模態人機交互平臺,具有遠場語音識別和情感識別能力,以及個性化的語音合成系統,向眾多企業授權使用。
實驗室腦網絡組研究中心聯合陸軍總醫院和廣州總醫院組成聯合攻關團隊,在基于“植物人”病因、年齡和病程作為重要預測指標的基礎上,使用基于腦功能磁共振影像的患者腦功能網絡特征,結合機器學習相關算法,構建了一個計算模型預測患者一年之后恢復意識的可能性,準確率達到88%。
在研究計算機感知外部世界的同時,實驗室引入了腦連接信息對腦區進行精細劃分,成功繪制出全新的人類腦圖譜:腦網絡組圖譜包括246個精細腦區和亞區,比傳統的腦圖譜精細4至5倍,該項成果入選2016年“中國十大科技進展”“中國十大醫學進展”和改革開放40年中國科學院40項標志性重大科技成果之一。
“以模式識別基礎理論、圖像處理與計算機視覺以及語音語言信息處理為主要研究方向,研究人類模式識別的機理以及有效的計算方法,為開發智能系統提供關鍵技術,這是實驗室肩負的主要使命。”王亮說。