受人腦神經調節機制啟發的人工智慧新穎演算法

近年來，人工智慧推動了高效能自動學習技術的發展。但是，這些技術通常是基於逐個專項任務要求而應用的，這意味著為某一專門任務訓練的智慧體在面對其它任務，甚至是非常相似的任務時，的執行效果會很差。

儘管近年來人工智慧領域取得了巨大進步，但我們離人類智慧還很遠。當前的人工智慧技術允許訓練計算機智慧體可以專門有針性地對它們進行人工訓練，以更好地執行某項特定任務。但是，一旦這些智慧體處於與經歷過的條件（甚至略有不同）的條件下時，它們的效能在訓練中通常非常令人失望。

透過使用一生中獲得的技能，人類能夠非常有效地適應新情況。例如，一個學會在客廳裡走路的孩子也會很快學會在花園裡走路。因為所學習得的走路的技能與大腦突觸的可塑性有關，突觸可塑性改變了神經元之間的聯絡，而在客廳學習到的行走技能與在花園中行走所需的快速適應技能則與神經調節過程相關。神經調節透過化學神經調節介質調整神經元本身的輸入-輸出特性。

模擬人腦神經突觸的可塑性是當今人工智慧所有最新進展的基礎。然而，到目前為止，還沒有科學研究成果提出將神經調節機制引入到人工神經網路的方法。

為了攻克這個難題，一個由人工智慧專家和神經科學家組成的科學團隊的研究人員，開發了一種基於人腦功能機制的新演算法，稱為神經調節演算法。這個新穎而卓越的演算法可以建立能夠執行訓練期間未遇到的任務的智慧體，使智慧主體能夠自動適應未知情況。

在神經科學中，神經調節（Neuromodulation）指一種神經傳導過程。在此過程中，一個特定神經元使用一個或多個神經傳導物質來控制一系列神經元。被一小群神經元覆蓋住的神經傳遞介質會在神經系統中大範圍地被釋放出來，進而影響到許多的神經元。在中樞神經系統中，神經傳遞介質包括如多巴胺。神經調節與傳統突觸傳導過程不同。傳統突觸傳導描述神經傳導過程為一個突觸前神經元直接影響另一個突觸後神經元。

研究人員開發出了完全原始的人工神經調節網路體系結構，引入了兩個子網之間的互動作用。第一個網路考慮與要解決的任務有關的所有處境場合資訊，並在此資訊的基礎上以大腦化學神經調節介質的方式對第二個子網進行神經模組化。由於神經調節，第二個子網決定了智慧體要執行的動作，因此可以非常迅速地適應當前任務，這使智慧體可以有效地面對與解決新任務。

神經調節由處理某些處境場合資訊訊號的神經調節神經網路（上圖頂部）和塑造某些輸入輸出功能的主神經網路（上圖底部）的相互作用組成。下圖為神經調節的啟用函式σNMN的計算圖，其中ws和wb是分別控制啟用函式σ的比例因子和偏移的引數，z是由神經調節網路計算的處境場合資訊上下文（context）相關變數。

這種創新的架構已經成功地針對需要適應環境的導航問題進行了模擬測試。尤其是，訓練有素的智慧體，能夠適應因風向變化極大干擾其運動的情況下，自適應避開障礙物朝目標移動。

論文作者之一、人工智慧專家、達米恩·恩斯特（Damien Ernst）教授說：“這項研究的新穎性是，神經科學領域所發現的認知機理首次在多工環境下發現了新的演算法應用。這項研究為利用人工智慧更好地模擬人腦神經調節功能機制的關鍵打開了新視野。”