為了理解實現(xiàn)讓機(jī)器人做夢的重要性,先要理解做夢對哺乳動物(例如我們自己的)大腦是幫助的??茖W(xué)家試著從神經(jīng)科學(xué)的角度理解做夢的作用時,發(fā)現(xiàn)做夢的大部分內(nèi)容都是消極或有威脅感的,可以嘗試做一個月的做夢日記,你會發(fā)現(xiàn)這是真的。

事實證明,當(dāng)人類夢到尷尬的事情或有威脅出現(xiàn)時,AI夢到的卻還是重新排列游戲的各個章節(jié),過程往復(fù),但引導(dǎo)機(jī)器人做夢實質(zhì)是讓AI像人類那樣可以通過實驗不斷學(xué)習(xí)。利用AI技術(shù)引導(dǎo)機(jī)器人做實驗并分析不同的行為過程,以及對結(jié)果產(chǎn)生的影響。

robodreams
通過AI“做夢”的方法快照(圖片由Deepmind提供)

那么機(jī)器人可能面臨的挑戰(zhàn)是什么?目前,世界上最先進(jìn)的AI也只停留在主攻復(fù)雜的視頻游戲,如星際爭霸II和迷宮。通過“做夢”,AI能突出游戲某些特別有挑戰(zhàn)性的部分,循環(huán)往復(fù)直到獲得專業(yè)知識,而不是毫無意義地排練游戲的整個過程卻對玩家的分?jǐn)?shù)沒有絲毫影響。使用這種技術(shù),DeepMind研究人員能夠?qū)崿F(xiàn)以10倍的速度加快的學(xué)習(xí)效率。隨著AI技術(shù)的提升,這個速度可能會更快。

你可能還會問,為什么AI“做夢”很有必要。因為機(jī)器人已經(jīng)在大多數(shù)游戲中(如國際象棋和圍棋游戲)掌控人類行為。要掌握這一點,有必要區(qū)分使用監(jiān)督學(xué)習(xí)(通過AI分析數(shù)據(jù)并尋找相應(yīng)模式)與無監(jiān)督學(xué)習(xí)的方法。迄今為止,通過AI實現(xiàn)且令人印象深刻的技術(shù),大部分是使用監(jiān)督學(xué)習(xí)法來實現(xiàn)的,由程序員提供“訓(xùn)練數(shù)據(jù)”,AI學(xué)習(xí)檢測數(shù)據(jù)模式。這是一個相當(dāng)簡單的訓(xùn)練機(jī)器人的方法,但決不是人類學(xué)習(xí)的方法。而是使用一種更類似于程序員所說的無監(jiān)督學(xué)習(xí)法,這種類型的學(xué)習(xí)比監(jiān)督學(xué)習(xí)要花費更多的時間,因為它涉及實驗等一系列變量的存在。

分享到

zhangnn

相關(guān)推薦