等離子體|谷歌人工智能團隊的最新成果: 控制聚變反應堆

等離子體|谷歌人工智能團隊的最新成果: 控制聚變反應堆

文章圖片



托卡馬克裝置內的等離子體
在世界等待建造迄今為止最大的核聚變反應堆(ITER)的同時 , 類似設計的小型反應堆仍在運行 。 這些被稱為托卡馬克裝置的反應堆 , 可以幫助我們測試硬件和軟件 。 硬件測試可以幫助我們改進一些東西 , 比如用于托卡馬克裝置內壁的材料 , 或者約束等離子體的磁鐵的形狀和位置 。
但一定程度上軟件是更重要的 。 為了實現核聚變 , 托卡馬克裝置的控制軟件必須監測它所包含等離子體的狀態 , 并通過實時調整系統的磁鐵來應對等離子體的任何變化 。 如果不這樣做 , 可能會導致能量下降這將導致任何聚變的失敗 , 或者看到等離子體溢出容器并損壞裝置內壁 。 要想獲得正確的控制軟件 , 需要對等離子體和用于約束等離子體的磁鐵有詳細的了解 , 或者更準確地說正確的控制軟件是必需的 。 因為今天 , 谷歌的DeepMind人工智能團隊宣布 , 他們的軟件已經成功訓練如何控制托卡馬克裝置 。
失控
核聚變的托卡馬克裝置控制軟件開發是一個復雜的過程 。 根據過去類似設計的經驗 , 工程師可以提取軟件運行所需的一些基本原則 , 比如要讀取哪些傳感器輸入 , 以及如何應對它們的變化 。 但是基于硬件的設計和等離子體的能量 , 總是會有一些差異 。 因此 , 通常會有一個測量-建模-改進的迭代過程 , 然后對控制過程進行調整 , 同時保持足夠的性能 。 最終的控制軟件趨向于定制化 , 如果研究人員想要在托卡馬克實驗中使用非常不同的等離子體幾何形狀 , 可能需要對軟件進行重大的版本調整 。 該領域的研究人員已經確定 , 人工智能是一種可能的解決方案 。 給人工智能足夠多的例子 , 它就能找出在等離子體中產生理想性能的控制配置 。 這可以研究人員專注于他們想要的最終狀態 , 然后讓人工智能自己去思考如何達到這種結果 , 這樣研究人員就可以專注于研究而不是頻繁更新軟件 。 為了實踐這個想法 , 我們需要人工智能專家和托卡馬克裝置 。 在這篇新論文中 , 人工智能團隊來自谷歌的DeepMind部門 , 該部門以開發能夠處理從蛋白質折疊到《星際爭霸》等的人工智能而聞名 , 而托卡馬克裝置由洛桑的瑞士等離子中心提供 。
核聚變訓練
由于在訓練過程中 , 將人工智能置于實際的硬件上可能會造成巨大災難 , 因此團隊首先根據瑞士等離子中心的硬件設計了一個托卡馬克模擬器 。 這在很大程度上是準確的 , 他們在人工智能中設定了限制 , 如果不能為等離子體制造出準確的結果 , 那么訓練出的控制參數將不會引導到真正的托卡馬克裝置中 。 DeepMind團隊隨后訓練了一個深度強化學習程序 , 通過讓它控制模擬器探索各種等離子體配置 。 在訓練過程中一個中間的軟件層提供了一個獎勵功能 , 指示等離子體的特性與期望狀態有多接近 。 另一種被稱為“批評者”的算法 , 學習托卡馬克裝置控制磁鐵的各種變化所帶來的預期回報 。 這些都被一套神經網絡控制用來學習它應該采取的行動 。 標準的控制軟件將被用來激活托卡馬克 , 并將等離子體提升到高能量 。 一旦等離子體穩定下來 , 它就把控制權交給人工智能 。 成功了當在實際的托卡馬克裝置上運行時 , 人工智能軟件的表現與期望的差不多 , 隨著時間的推移它可以控制不同條件的實驗運行 。 在一個測試案例中 , 它增加了能量 , 保持等離子體穩定 , 然后改變等離子體的幾何形狀 , 然后在能量下降之前將等離子體重新成功定位;而在另一個實驗中 , 它在同一個托卡馬克上同時運行了兩個不同的等離子體 。

相關經驗推薦