男女午夜视频免费网站-美女扒开双腿让男人捅个爽-人妻少妇看a片偷人精品视频-久久精品国产亚洲av黄站-日本网址免费中文在线-亚洲国产综合久久天堂-黄色无毒免费av网站-国产精品自拍35页-久久av精品一区二区三区

|字節(jié)在玩兒上真不是蓋的,柯南般的AI變聲技術已實現(xiàn)

|字節(jié)在玩兒上真不是蓋的,柯南般的AI變聲技術已實現(xiàn)

雖然從我個人感覺上 , 字節(jié)的產品不管是早期頭條還是現(xiàn)在抖音 , 從來都是推薦算法、投其所好、娛樂至上、沉迷哲學 , 不過有一說一 , 它的AI研發(fā)團隊的確有實力 , 在和音視頻有關的“玩兒”的視聽等領域 , 真不是蓋的 。 機智客雖然貴為門外漢 , 但也不知天高地厚稍微關注過國外權威技術平臺、開源技術平臺或者國內人工智能相關科技類的媒體報道 , 平臺時而有關于字節(jié)的公開發(fā)表的論文成果 , 媒體時常有字節(jié)的AI進展公布 。
此次帶來的AI技術進展是新一代的實時AI變聲技術 。 一說這個 , 你可能會第一想到的是名偵探柯南漫畫里主角專用的工具:變聲領結 。 沒錯 , 就是那個意思 。 可以實時將你的聲音變成另外一個人的聲音 。

【|字節(jié)在玩兒上真不是蓋的,柯南般的AI變聲技術已實現(xiàn)】新一代的AI變聲技術 , 采用了當前流行的深度學習技術的聲音轉換來實現(xiàn) 。 而談到深度學習技術 , 不免讓人覺得考驗硬件顯卡的時候到了 。 未必 , 字節(jié)是誰 , 能玩得如此嗨 , 還允許有這個問題?所以這個新技術方案的亮點之一就是可以在單CPU上做到低延遲、高還原的實時變聲 。 高還原是啥?是情感細節(jié)、口音特點、抑揚頓挫的情緒表達 , 甚至還有呼吸、咳嗽聲 。 看給出的測試效果 , 還是可以的 。
看資料顯示 , 聲音轉換的模型也由聲學模型(acoustic model)和聲碼器(vocoder)組成 。 當然 , 如果我們學過這些 , 或者你玩過GitHub上的一些項目 , 就會了解這些基本的知識 。 具體的技術實現(xiàn)就不介紹了 , 反正看了也等于沒看 。 而且看的這個是科技媒體的報道 , 和部分字節(jié)的其他技術項目一樣 , 并沒有發(fā)布在GitHub等平臺 。 所以報道的這個只是給出了demo , 以及商業(yè)應用的體驗鏈接 , 并沒有開源或純技術之類的項目倉庫 。
可能吧 , 也正因為字節(jié)在所謂的“玩兒”的領域玩得開 , 所以誕生的這個AI變聲的新技術 , 我們首先容易想象到的 , 更多更常見的應用場景就是 , 現(xiàn)在的短視頻玩法、直播玩法 , 當然還會應用于未來的元宇宙、虛擬人等各種技術 。

    相關經驗推薦