科技日?qǐng)?bào)記者 張佳欣
人工智能(AI)“讀心術(shù)”可通過(guò)讀取大腦活動(dòng),“看懂”人腦中的畫面——這聽(tīng)起來(lái)像科幻小說(shuō),如今卻離現(xiàn)實(shí)更進(jìn)一步。日本NTT通信科學(xué)實(shí)驗(yàn)室研究團(tuán)隊(duì)開(kāi)發(fā)出一種名為“心智字幕”的新技術(shù),能利用AI模型,根據(jù)受試者大腦活動(dòng)生成其所見(jiàn)或腦中想象畫面的文字描述,準(zhǔn)確度非常高。研究成果發(fā)表于新一期《科學(xué)進(jìn)展》雜志。

這一技術(shù)不僅揭示了人腦如何在語(yǔ)言形成前表征外部世界,還有望幫助因中風(fēng)等原因?qū)е抡Z(yǔ)言障礙的患者,通過(guò)腦機(jī)接口更順暢地表達(dá)想法。
要解碼大腦對(duì)復(fù)雜內(nèi)容的理解,例如短視頻或抽象形狀,一直具有挑戰(zhàn)性。此前研究大多只能提取出關(guān)鍵詞,難以還原完整語(yǔ)境,例如視頻的主角是誰(shuí)、發(fā)生了什么動(dòng)作。
為突破這一瓶頸,研究團(tuán)隊(duì)設(shè)計(jì)了雙重AI模型。他們先利用深度語(yǔ)言AI模型分析了兩千多段視頻的文字說(shuō)明,并將每段說(shuō)明轉(zhuǎn)化為獨(dú)特的“意義特征”。隨后團(tuán)隊(duì)通過(guò)功能性磁共振成像記錄6名受試者觀看視頻時(shí)的大腦活動(dòng),并訓(xùn)練第二個(gè)AI系統(tǒng),學(xué)習(xí)將腦信號(hào)與這些意義特征對(duì)應(yīng)起來(lái)。
當(dāng)模型訓(xùn)練完成后,系統(tǒng)即可通過(guò)新的腦掃描數(shù)據(jù)預(yù)測(cè)受試者所看到內(nèi)容的意義特征,并生成最接近的句子描述。例如,一名受試者觀看了一個(gè)人從瀑布頂端跳下的視頻。AI模型通過(guò)其大腦活動(dòng),先后生成一系列詞串,從最初的“泉水流動(dòng)”,到第十次猜測(cè)的“在急速落下的瀑布上方”,最終在第100次猜測(cè)時(shí)生成句子:“一個(gè)人從山頂?shù)钠俨家卉S而下”。這幾乎完全還原了完整的視頻內(nèi)容。
更令人驚訝的是,當(dāng)受試者回憶先前看過(guò)的視頻片段時(shí),AI模型仍能根據(jù)大腦的回憶生成準(zhǔn)確的文字描述。這表明,人腦在觀看與回憶時(shí)使用了相似的內(nèi)部表征方式。
英國(guó)《自然》雜志評(píng)論稱,這項(xiàng)基于非侵入式功能性磁共振成像的技術(shù),未來(lái)有望推動(dòng)腦機(jī)接口的發(fā)展,使植入設(shè)備能更直接地將人的思維轉(zhuǎn)化為文字或語(yǔ)音,從而幫助語(yǔ)言受損者恢復(fù)交流能力。
總編輯圈點(diǎn)
當(dāng)腦機(jī)接口遇上人工智能,“心有靈犀”正從浪漫想象步入現(xiàn)實(shí)。其原理是,當(dāng)我們看視頻或畫面時(shí),大腦會(huì)發(fā)出各種各樣的神經(jīng)信號(hào),腦機(jī)接口技術(shù)負(fù)責(zé)捕捉這些信號(hào),而人工智能模型則負(fù)責(zé)解碼和重構(gòu)這些信號(hào),一場(chǎng)科幻般的“讀心術(shù)”便順利完成。這意味著,借助這種技術(shù),人類通過(guò)在大腦中想象畫面,就可以將所思所想傳遞給另一個(gè)人,從而實(shí)現(xiàn)真正意義上的“意念交流”。