
文章圖片

文章圖片

文章圖片
機(jī)器學(xué)習(xí)目前廣泛應(yīng)用于現(xiàn)代人工智能應(yīng)用 。 計(jì)算能力的突破 , 使系統(tǒng)能夠在較短時間內(nèi)計(jì)算復(fù)雜的機(jī)器學(xué)習(xí)算法 。 在所有這些應(yīng)用中 , 高檢測精度需要復(fù)雜的機(jī)器學(xué)習(xí)計(jì)算 , 其代價是計(jì)算復(fù)雜度高 。 這就對硬件平臺提出了很高的要求 。 目前 , 大多數(shù)應(yīng)用程序都是在通用計(jì)算引擎上實(shí)現(xiàn)的 , 尤其是圖形處理單元 。
然而 , 最近工業(yè)界和學(xué)術(shù)界的正在為機(jī)器學(xué)習(xí)設(shè)計(jì)專用集成電路的趨勢 , 尤其是在深度神經(jīng)網(wǎng)絡(luò)領(lǐng)域 。 在過去的幾十年中 , 圖形處理單元在面部、對象識別、數(shù)據(jù)挖掘和其他人工智能應(yīng)用程序訓(xùn)練深度學(xué)習(xí)算法或卷積神經(jīng)網(wǎng)絡(luò)方面已經(jīng)變得流行和標(biāo)準(zhǔn) 。 處理單元提供廣泛的硬件選擇、高性能的吞吐量以及穩(wěn)定但不斷擴(kuò)展的生態(tài)系統(tǒng) 。 處理單元架構(gòu)通常使用幾個迷你圖形處理器來實(shí)現(xiàn) , 每個圖形處理器都有自己的計(jì)算單元和適合矩陣乘法的本地緩存 。
多個微型處理器中包含共享高速總線 , 以實(shí)現(xiàn)微型處理器之間的快速數(shù)據(jù)交換 。 此外 , 它還充當(dāng)連接主CPU和多個迷你圖形處理器的橋梁 。 由于大量并行處理內(nèi)核 , 處理單元提供了顯著的計(jì)算速度 。 然而 , 計(jì)算和數(shù)據(jù)移動也需要相對較大的功耗 。 此外 , 需要高速互連接口來支持快速數(shù)據(jù)交換 。 因此 , 與其他技術(shù)相比 , 處理單元以高設(shè)計(jì)成本和功耗為代價提供了強(qiáng)大的計(jì)算能力 。
隨著行業(yè)的成熟 , 可編程門陣列現(xiàn)在開始成為處理單元實(shí)施基于卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)算法的可靠競爭對手 。 微軟研究的彈射項(xiàng)目在業(yè)界引起了相當(dāng)多的關(guān)注 , 因?yàn)樗暦Q使用可編程門陣列的能效比處理單元高10倍 。 盡管單個可編程門陣列的性能遠(yuǎn)低于同等價格的處理單元 , 但功耗低得多的事實(shí)可能對許多高性能可能不是首要任務(wù)的應(yīng)用產(chǎn)生重大影響 。
【ai|計(jì)算能力的突破,使系統(tǒng)能夠在較短時間內(nèi)計(jì)算復(fù)雜的機(jī)器學(xué)習(xí)算法】
DRAM充當(dāng)存儲臨時數(shù)據(jù)的大緩沖區(qū) , 而CPU負(fù)責(zé)管理計(jì)算 , 包括向可編程門陣列發(fā)送指令 , 對可編程門陣列進(jìn)行編程以適應(yīng)機(jī)器學(xué)習(xí)算法 。 由于機(jī)器學(xué)習(xí)算法通過編程在硬件層面進(jìn)行了優(yōu)化 , 因此與常規(guī)處理單元計(jì)算相比 , 對相應(yīng)機(jī)器學(xué)習(xí)算法沒有任何硬件優(yōu)化 , 數(shù)據(jù)訪問效率更高 。 可編程門陣列雖然在硬件設(shè)計(jì)上通過優(yōu)化機(jī)器學(xué)習(xí)算法降低了計(jì)算功耗 , 但總體效率與單一算法的集成電路相比仍然低很多 。
與集成電路相比 , 可編程門陣列引入的可編程性也帶來了復(fù)雜的邏輯 , 增加了硬件設(shè)計(jì)成本 。 在數(shù)據(jù)中心 , 硬件加速器解決方案以處理單元和可編程門陣列解決方案為主 。 最先進(jìn)的機(jī)器學(xué)習(xí)計(jì)算主要依賴于云服務(wù)器 。 然而 , 高功耗使得這種方法在許多實(shí)際應(yīng)用場景中受到限制 。 由于便攜式設(shè)備上基于云的人工智能應(yīng)用程序需要網(wǎng)絡(luò)連接能力 , 網(wǎng)絡(luò)連接的質(zhì)量會影響用戶體驗(yàn) 。
此外 , 實(shí)時人工智能應(yīng)用程序無法接受網(wǎng)絡(luò)和通信延遲 。 此外 , 大多數(shù)物聯(lián)網(wǎng)人工智能應(yīng)用都有嚴(yán)格的功耗和成本約束 , 既不能支持大功率處理單元 , 也不能將大量數(shù)據(jù)傳輸?shù)皆品?wù)器 。 為了解決上述問題 , 科研人員引入了幾種基于邊緣的AI處理方案 , 旨在利用邊緣側(cè)的本地化數(shù)據(jù) , 避免網(wǎng)絡(luò)通信開銷 。 目前 , 大多數(shù)本地化的人工智能處理器都專注于處理卷積神經(jīng)網(wǎng)絡(luò) , 它被廣泛用于計(jì)算視覺算法 , 需要大量的計(jì)算資源 。
相關(guān)經(jīng)驗(yàn)推薦
- 蘋果|iPhone的充電,這次可能真的要變了
- 白金|5800X 3D我必得,奏響新銳龍的暢想曲
- 蘋果|自己人捧!被蘋果剔除供應(yīng)鏈后,這家中企進(jìn)入了更大的市場!
- 電池|用的手機(jī)是7p,買了2年電池實(shí)在不行,信號也不給力
- realme q5|realme真我Q5系列發(fā)布:全新的外觀設(shè)計(jì),主打性價比,1199元起
- 一加科技|升級版神U+不降級堆料!不吹硬件主打用戶體驗(yàn)的手機(jī)來了
- 硬盤|TCL T7E新品首發(fā)價3299元起!第一臺不忽悠年輕人的真高刷電視來了
- |今天的智能手機(jī)都走錯路了?
- ColorOS|盤點(diǎn)ColorOS 12不容錯過的實(shí)用小功能:輕松提升用機(jī)效率和幸福感
- 藍(lán)牙耳機(jī)|什么藍(lán)牙耳機(jī)舒適度最好?長久佩戴舒適的藍(lán)牙耳機(jī)
