Resources

教學資源

認臉:腦有特別座

科學家經由猴子腦內神經活動,準確預測牠所看到的外界臉形模樣。這個研究照出一道曙光:有一天我們真的可能由腦神經活動的數位編碼,知道你正在想什麼?!


 

撰文/曾志朗

 

  無可否認,在數位時代,高科技的精巧應用,處處影響人們的日常生活,有形無聲或有聲無影的人工智慧,為我們提供許多便利。一個朋友最近買了一台機器人吸塵器,每晚就寢時,插上充電器,讓電池充飽,隔天出門前,叫醒小小機器人,任它在家中遊走,邊走邊吸塵,逢阻就轉彎,主動尋找活動空間,進退自如,等到他下班回家,地板果然清潔溜溜,把圓盤裡的集塵盒清理乾淨,隔天機器人又生龍活虎了。他滿意極了,總是拍拍圓盤的面,說聲謝謝!

 

  有一天,我和他到元智大學去參加會議,他自告奮勇要開車,我問他,路熟不熟?他指了指車上的衛星導航GPS裝置,胸有成竹的說:「有它就不怕迷路了!」他伸指觸動GPS,告訴它從哪裡出發,目的地是哪裡。原來,用說的也能通。不一會兒,GPS面板出現地圖,標示行駛路徑,並告知大約行車時間。一路上,上下交流道,向左向右出口,都提前幾百公尺就說得一清二楚;進入市區後,道路繁雜,左轉大街,右彎小巷,GPS裡那位出聲清脆的「女士」指揮若定,車子走過頭,還會叫你轉回來,真走錯路了,就重新設定路線,簡直是救命路神哪!

 

  開了一天會,回到台北,球友來訊,台大體育館當晚開放租用,邀大夥去運動一下筋骨。我開車前往球場,進入地下停車場,在柵欄前方停留數秒,柵欄自動升起,指示牌上顯示了一排字「車號已登錄」。原來是數位相機已將車號照相登錄,離去之前,到繳費機輸入車號,依停留時數繳納費用,到了出口處,再讓數位相機照相登錄,和入口時的影像兩相對照,號碼一致,柵欄就自動升起!

 

  對車牌號碼影像的辨識和比對,以現代技術而言,要處理10個數字加上26個字母的排列組合,簡直是易如反掌。但物件辨識的困難度,當然會隨著必須分析的不同向度的複雜性而增加。例如機場自動通關的設施,就是突破人臉辨識的高難度,讓機器比對護照上的照片和持照人的即時攝影影像,相似放行,不相似再以指紋補正,若兩者皆不吻合,當然就過不了關了。

 

  最近在去歐洲的飛機上看了一部電影,講述跨國合作殲滅恐怖份子的故事,從無人偵察機拍攝即時影像,到年輕的女性資訊設計工程師發展出一套尖端的人臉辨識系統,利用各城市街道攝影照片進行比對,只要一個畫面,就可以鎖定目標,還可以配合大數據裡的語音配對,確認身分,而坐鎮在各軍事基地的主角們,就透過這些「天眼」,研判形勢並決定行動的時機。有點科幻,但已經很接近現實了!無獨有偶,日本近日也有部以反恐為主題的電視影集,小組成員各懷絕技,同樣有名年輕的女性電腦高手,可以駭入任何有攝影鏡頭的地方取得影像,比對畫面,找到嫌犯的可能藏身地點、生平記錄,以及行為的獨特風格,即使變裝也能識破。但這已非科幻,而是先進國家刑事人員查案的基本配備了!

 

  這些在電影電視上非常純熟的人臉辨識技術,可能讓觀眾誤以為電腦的人臉辨識並不困難。其實不然,這個技術屬於人工智慧研發的一環,最少已有30年歷史,投進無數資金和機器學習相關的人力,才有今天的成就。它可以是警察捉拿壞人的利器,但如果落入獨裁政府手中,就變成濫捕好人的幫凶了。高科技介入生活,一則可喜,一則引憂,若遭誤用,侵犯個人隱私是輕而易舉的事,如何能不慎?

 

  機器辨識人臉,萬中取一,能耐高超。人類雖然也有不錯的人臉辨識能力,但和現今最好的電腦人臉辨識程式相較起來,卻有如小巫見大巫,既沒有廣大的記憶體去儲存永遠清晰而不會越來越模糊的影像,也缺乏快速強大的計算能力,可以平行比對所有儲存在記憶中的影像,更不可能利用序列回溯(backward sequential search)的方式,去一一比對視網膜上現有的影像和儲存在大腦的影像,所以人類的人臉辨識究竟如何完成,仍然是未解之謎。

 

  然而,最近神經科學有兩個研究發現,不但令人驚豔,也確實提供了讓人感動的新知識。首先是年初發表在《科學》雜誌上的一篇論文,由美國史丹佛大學神經科學家葛瑞–史派克特(Kalanit Grill-Spector) 針對人類對人臉辨識的獨特腦區(左右腦下顳葉靠近枕葉視覺區的梭狀回),做了22個兒童(5~12歲)及25個成人(22~28歲)的磁共振造影掃描,發現這一特定區域的神經細胞的成長和網絡連結,並沒有在兒童時期停止,而是不停擴大連結,長出更強有力的神經髓鞘,使神經之間的訊號傳遞更為迅速;其他有關辨識物件的視覺區,則是在兒童期完成連結之後就停止生長和連結。這個結果顯示,人臉辨識在社會化的過程上扮演著非常重要的角色,它是族群認同的基礎,而從社會生物演化的觀點,人臉辨識確實和一般物件知覺不同,真是妙不可言!

 

  另一個讓學界震撼的人臉辨識研究發現,也是來自美國西岸的科學家。由加州理工學院的曹(Doris Tsao)教授和同事共同完成,刊登在不久前的《細胞》期刊上。他們先把一張張人臉用點標示出來,再比對這幾千張點和點構築出來的臉形,找出25個可區分這些不同人臉的特徵指標。每一指標有如一個可以調整數量的旋鈕,例如一個數字表示兩眼之間的距離,另一數字表示前額的高度。利用這25個旋鈕,每一張臉都可以數位化,用25個數字做為代表。以相同方式,兩位科學家也設計出另外25個數位量表,分別代表人臉的其他特徵,如眼睛的顏色、肌肉的鬆緊,或皮膚的光滑度等。兩組數字所形成的組合,代表每一張不同臉形的編碼。

 

  接下來,他們讓兩隻猴子觀看一張張人臉,也在猴子腦部負責臉形辨識的區域安裝了將近100個電極,測量這100個神經細胞看到特定人臉時的反應,利用他們所設計的演算法,找出25乘25個指標相對應的神經活動。也就是說,他們可以把猴子對臉形的辨識,準確轉換成神經細胞活動的數位編碼,而且每一個臉形的編碼都有一致性。這個成就非同小可,是神經科學研究上的一大突破!

 

  最讓人大開眼界的是,他們可以利用電極調整神經細胞的活動量,整合出25乘25向量中的一組數位編碼的型態,看猴子是否對那編碼的原來臉形有所認識?答案是肯定的!科學家經由猴子腦內神經活動,準確預測牠所看到的外界臉形模樣。看完這篇石破天驚的報告,我除了感動,還是感動!這個研究照出一道曙光:有一天我們真的可能由腦神經活動的數位編碼,知道你在想什麼?回憶什麼?進一步,何謂一見鍾情?為什麼情人眼中出西施?可能都會有解!你會因為可能的科學突破感到興奮不已?還是因為浪漫和隱私橫遭科學剖析而感到沮喪惶恐?但無論如何,科學的進展總是不等人的!

 

【本文轉載自科學人2017年7月號】