|字節(jié)在玩兒上真不是蓋的,柯南般的AI變聲技術已實現(xiàn)

雖然從我個人感覺上 , 字節(jié)的產品不管是早期頭條還是現(xiàn)在抖音 , 從來都是推薦算法、投其所好、娛樂至上、沉迷哲學 , 不過有一說一 , 它的AI研發(fā)團隊的確有實力 , 在和音視頻有關的“玩兒”的視聽等領域 , 真不是蓋的 。 機智客雖然貴為門外漢 , 但也不知天高地厚稍微關注過國外權威技術平臺、開源技術平臺或者國內人工智能相關科技類的媒體報道 , 平臺時而有關于字節(jié)的公開發(fā)表的論文成果 , 媒體時常有字節(jié)的AI進展公布 。
此次帶來的AI技術進展是新一代的實時AI變聲技術 。 一說這個 , 你可能會第一想到的是名偵探柯南漫畫里主角專用的工具:變聲領結 。 沒錯 , 就是那個意思 。 可以實時將你的聲音變成另外一個人的聲音 。
【|字節(jié)在玩兒上真不是蓋的,柯南般的AI變聲技術已實現(xiàn)】新一代的AI變聲技術 , 采用了當前流行的深度學習技術的聲音轉換來實現(xiàn) 。 而談到深度學習技術 , 不免讓人覺得考驗硬件顯卡的時候到了 。 未必 , 字節(jié)是誰 , 能玩得如此嗨 , 還允許有這個問題?所以這個新技術方案的亮點之一就是可以在單CPU上做到低延遲、高還原的實時變聲 。 高還原是啥?是情感細節(jié)、口音特點、抑揚頓挫的情緒表達 , 甚至還有呼吸、咳嗽聲 。 看給出的測試效果 , 還是可以的 。
看資料顯示 , 聲音轉換的模型也由聲學模型(acoustic model)和聲碼器(vocoder)組成 。 當然 , 如果我們學過這些 , 或者你玩過GitHub上的一些項目 , 就會了解這些基本的知識 。 具體的技術實現(xiàn)就不介紹了 , 反正看了也等于沒看 。 而且看的這個是科技媒體的報道 , 和部分字節(jié)的其他技術項目一樣 , 并沒有發(fā)布在GitHub等平臺 。 所以報道的這個只是給出了demo , 以及商業(yè)應用的體驗鏈接 , 并沒有開源或純技術之類的項目倉庫 。
可能吧 , 也正因為字節(jié)在所謂的“玩兒”的領域玩得開 , 所以誕生的這個AI變聲的新技術 , 我們首先容易想象到的 , 更多更常見的應用場景就是 , 現(xiàn)在的短視頻玩法、直播玩法 , 當然還會應用于未來的元宇宙、虛擬人等各種技術 。
相關經驗推薦
- 蘋果|蘋果、三星都在增長,國產機則在下滑,日子不太好過
- 小米科技|微評OPPO Pad|定位卡在小米平板5和5Pro中間,價格中規(guī)中矩。
- 軟件|手機卸載軟件,很多人第一步就錯了, 并不是在桌面,漲知識了
- Windows11|IE瀏覽器永不消亡,我們找到了在Windows 11上啟動它的方法
- 路人甲|槍打出頭鳥!長江儲存在內存上表現(xiàn)出色,所以可能被禁售高端設備
- |如果現(xiàn)在有3000多塊預算去買手機,你會買什么呢?
- Windows7|Windows 7要小心了,Windows 11正在迎頭趕上
- iPhone|在“Extend the Omniverse”比賽中構建用于 3D 世界的工具
- 客服|重慶渝北,劉先生只花1072.9元,就在網上買到一臺70寸的巨大液晶電視
- 盧偉冰|在家也能擁有電影院般的觀影體驗?有飛利浦回音壁B8967就可以
