
文章圖片



上周 , 谷歌高級(jí)深度思維神經(jīng)網(wǎng)絡(luò)背后的團(tuán)隊(duì)公開(kāi)發(fā)布了一項(xiàng)新功能 , 稱為Transframer , 這項(xiàng)功能允許人工智能從單個(gè)圖像輸入中生成一段30秒的視頻 。 乍一看 , 這是一個(gè)華而不實(shí)的小把戲 , 但其實(shí)際的含義遠(yuǎn)遠(yuǎn)大于一個(gè)有趣的.GIF文件 。
Transframer可以從一個(gè)圖像中想象周圍的環(huán)境
Transframer是一個(gè)通用生成框架 , 可以在概率設(shè)置中處理許多圖像和視頻任務(wù) 。 新的研究表明 , 它在視頻預(yù)測(cè)和視圖合成方面表現(xiàn)出色 , 可以從單個(gè)圖像生成30秒的視頻 。 谷歌高級(jí)深度思維神經(jīng)網(wǎng)絡(luò)團(tuán)隊(duì)透漏稱 。
google
“Transframer在各種視頻生成基準(zhǔn)上都是最先進(jìn)的 , 并且……可以從單個(gè)圖像生成連貫的30秒視頻 , 而無(wú)需任何明確的幾何信息 , ”DeepMind研究團(tuán)隊(duì)解釋道 。 基本上 , Transframer只需要一張照片 , 然后分析和識(shí)別照片的框架 , 即桌子、走廊或街道等線索 。 在使用這些“背景圖像”預(yù)測(cè)受試者的周圍環(huán)境后 , 它從各個(gè)角度設(shè)想(并隨后顯示)該目標(biāo)的外觀 。 DeepMind的團(tuán)隊(duì)用椅子、筆記本電腦、一杯水 , 甚至一本GRE教科書(shū)等目標(biāo)來(lái)說(shuō)明這個(gè)過(guò)程 。
谷歌的DeepMind AI可以將單個(gè)圖像“轉(zhuǎn)換”為視頻
“給定一組具有相關(guān)注釋(時(shí)間戳、攝像機(jī)視點(diǎn)等)的背景圖像和一個(gè)查詢注釋 , 任務(wù)是預(yù)測(cè)目標(biāo)圖像上的概率分布 , ”該團(tuán)隊(duì)繼續(xù)說(shuō)道 。 該框架支持一系列視覺(jué)預(yù)測(cè)任務(wù) , 包括視頻建模、新穎視圖合成和多任務(wù)視覺(jué) 。
AI
正如未來(lái)主義者所指出的 , Transframer有朝一日可以通過(guò)利用機(jī)器學(xué)習(xí)來(lái)構(gòu)建數(shù)字環(huán)境 , 而不是依賴更耗時(shí)的渲染方法 , 為視頻游戲行業(yè)提供一條全新的途徑 。 隨著技術(shù)的進(jìn)步 , DeepMind的Transframer培訓(xùn)可以為藝術(shù)、科學(xué)分析和人工智能的進(jìn)一步發(fā)展開(kāi)辟全新的途徑 。
人工智能
此外 , 一位Twitter用戶設(shè)想在Transframer程序的基礎(chǔ)上利用OpenAI的DALL-E圖片來(lái)創(chuàng)建堆疊的人工智能作品 , 就好像這些圖像無(wú)法變得更超現(xiàn)實(shí)一樣 。 OpenAI的DALL-E技術(shù)就是通過(guò)將文字描述轉(zhuǎn)換為圖片的技術(shù) , 通過(guò)這個(gè)程序 , 每個(gè)人都可以通過(guò)描述原創(chuàng)圖片 , 更多DALL-E的介紹可以看我前面的文章人均藝術(shù)家!文本轉(zhuǎn)換為圖像 , DALL-E程序創(chuàng)造新世界!TikTok日前也添加了這項(xiàng)功能 , 可以看我前幾天的文章了解更多TikTok提供了一個(gè)基本的文本到圖像的AI生成器 , 壓力來(lái)到了抖音!? 。
OpenAI
【deepmind|單個(gè)圖像“轉(zhuǎn)換”為視頻!谷歌的DeepMind人工智能團(tuán)隊(duì)發(fā)布新功能!】今天 , 關(guān)于谷歌人工智能團(tuán)隊(duì)發(fā)布的圖像轉(zhuǎn)視頻的新功能的介紹就到這里了 , 更多科技資訊請(qǐng)關(guān)注科技譯站! , 我是蟹家之寶樹(shù) , 歡迎大家評(píng)論區(qū)留言討論!
相關(guān)經(jīng)驗(yàn)推薦
- 圖像處理|當(dāng)然,如果仔細(xì)看的話,X60 Pro在圖像處理方面還有待改進(jìn)
- 圖像傳感器|插拔如此簡(jiǎn)單——航嘉SSH608單手智控插座
- 圖像處理|正式取代WIFI 6,WIFI 7已經(jīng)完成技術(shù)演示,比上代快3倍
- 小米12|小米 12S Ultra 的圖像傳感器沒(méi)有「一英寸」大,小米虛標(biāo)了嗎?
- deepmind|SA權(quán)威發(fā)布,全球前五品牌最新出爐
- deepmind|三星S23 Ultra曝光:屏下3D結(jié)構(gòu)光+200倍,科技與美的碰撞
- 格力電器|什么是 AVIF 圖像格式?
- 索尼|索尼將引入全新圖像傳感器技術(shù),目標(biāo)保持60%全球市場(chǎng)份額
- 圖像傳感器|安卓同質(zhì)化太明顯,群體發(fā)展受阻!蘋(píng)果iPhone銷量爆發(fā),已一騎絕塵!
- |電腦顯示屏(圖像)變小了,不知道如何恢復(fù)?文章中告訴你辦法
