|21世紀的我們能夠制造出哆啦A夢嗎?

|21世紀的我們能夠制造出哆啦A夢嗎?

文章圖片

|21世紀的我們能夠制造出哆啦A夢嗎?

文章圖片

|21世紀的我們能夠制造出哆啦A夢嗎?

文章圖片


哆啦A夢是日本漫畫家組合藤子·F·不二雄于1970年創作的科幻喜劇漫畫 。 在這部漫畫里 , 不二雄先生描繪了一個來自22世紀的貓型機器人——哆啦A夢 。 它有一個萬能口袋 , 里面的各種奇思妙想的道具讓人驚艷 。
我想眾多的80后90后小的時候都幻想能擁有屬于自己的哆啦A夢 , 在21世紀的如今 , 我們有辦法實現哆啦A夢嗎?

AGI是什么?根據斯坦福大學機器學習教授吳恩達(Andrew Ng)的說法 , 現在有兩種類型的人工智能 。 一種是用于特定目的的“專用型人工智能”(Narrow AI=ANI , 有時也被稱為狹義人工智能) , 以及“通用人工智能”(即人工通用智能AGI) 。
AGI(人工通用智能)被認為具有類似人類的認知能力 , 能夠根據過去的經驗和知識適應環境的變化 。 此外 , 據說它還能擁有想象力、表達能力、預測力和計劃能力 。
但是 , AGI的研究開發比ANI晚了很多 , 現在在商業現場應用的大部分人工智能都是ANI 。 ANI可以學習局部的任務和工作 , 并且非常順利地完成 , 因此它經常作為預測和處理的工具 , 以需求預測模型等形式被使用 。
例如 , 咨詢公司gartner在2021年曾發布過一個AI hype cycle周期 , 預測AGI還處于黎明期 , 預計技術成熟至少需要10年以上的時間 。 由此可見 , AGI的實現是在遙遠的未來了 。

AI hype cycle周期
到目前為止 , 在美國的IT業界 , 一提到AI , 很多人都默認是指ANI , 但最近越來越多的人開始談論AGI 。
谷歌旗下的人工智能公司DeepMind于2021年5月發布了一份名為“Reward is Enough(報酬足夠)”的職位報告 。 在這篇論文中 , DeepMind提出 , 在不遠的將來 , 我們就有可能接觸到AGI 。
定位論文與學術論文不同 , 是指“沒有基于數學證明或實驗證明假說 , 僅以文字形式提出假說的論文” 。
這篇論文的執筆者是人工智能研究的泰斗、被稱為“強化學習教父”的理查德·薩頓 , 以及薩頓的前弟子、AlphaGo開發的核心人物大衛·西爾弗 。
這篇轟動一時的論文在人工智能研究者之間引起了巨大的爭論 , 也為討論AGI創造了契機 。

打造通用人工智能只需要設計“報酬”就足夠了嗎?【|21世紀的我們能夠制造出哆啦A夢嗎?】在上述的那份職位表中 , DeepMind公司提出了一個假設 , 即為了實現AGI , “只要給(人工智能)報酬就足夠了” 。
獎勵是強化學習的核心概念 , 通過獎勵的最大化 , 人工智能可以學習到各種知識 。
例如“糖果和鞭子”中的“糖果” 。 如果知道采取特定的行動就能得到糖果 , 人工智能就會不斷重復同樣的行動 , 從而強化行動 , 心理學上稱之為強化學習 , 這也是人工智能強化學習的基本概念 。
再舉一個例子 , 論文中出現了廚房人工智能機器人的例子 。 通常來說 , 廚房機器人要想將廚房的清潔程度最大化 , 需要具備以下小技巧 。