商湯|亞洲最大!上海“巨無霸”AI計算中心投用,支持萬億參數大模型訓練( 二 )


比如商湯在上海做的一網統管 , 為上海政府的公共服務提供了涉及垃圾滿溢、井蓋丟失、燈箱損壞、自行車亂停亂放、違章占道等各種城市服務管理的約上百種AI算法應用 , 這些算法的迭代生產 , 依賴的即是AIDC這樣的基礎設施 。
“通過AIDC , 通過里面的軟件整合 , 我覺得我們有信心在未來的兩到三年之內 , 我們能夠實現在同等規模算力下 , 國產的軟硬一體的成本、對客戶的成本 , 降得更低 , 這個其實是一個我比較期待的目標 。 ”楊帆說 。
二、低算力成本 , 加速國產AI芯片市場化進程目前 , 商湯正在探索從國產芯片、國產服務器、自研訓練框架、算法和落地行業應用的AI大生態建設 。
在CAPEX投資成本方面 , AIDC可以降低自研國產芯片單位算力成本;在OPEX運營成本方面 , 得益于算法優化的優勢 , 訓練時長更短、效率更高、占用資源更小 。
“我們計劃是3740PetaFLOPS里面應該會不少于50%的國產芯片做核心AI芯片來使用 。 ”楊帆說 , 臨港AIDC只是一個 , 商湯還有更多區域的AIDC布局建設正在推進中 , AIDC整體會以訓練為主 , 也會有一些推理 , 但占比較低 。
他提到過去兩年 , 商湯與多家國內AI芯片廠商展開了大量合作 , 希望加快國產云端AI芯片及相應服務器在市場更大規模、更大范圍地使用 。
據悉 , AIDC當前試運營機器里已有一部分國產化比例 , 該比例的提升對于AI全產業鏈整體成本的下降、整體服務水平的提升、在硬件側形成更加良性的商業競爭環境等方面將帶來很大的價值 。

過去兩年 , 商湯在持續推動國產AI核心軟硬件之間的適配 。 為了促進這件事情 , 商湯在2021年7月上海世界人工智能大會上牽頭成立了“人工智能算力產業生態聯盟” , 簡稱“ICPA智算聯盟” 。
商湯將基于AIDC , 促進AI生態的構建 , 推動國產原創技術的落地應用 。
楊帆分享道 , 從成立ICPA算力聯盟開始 , 聯盟每一季度都會組織一到兩次的齊聚芯片設計專家、軟件設計專家、軟件設計專家、行業標準專家的深度閉門研討會 。
在前期 , 商湯希望形成一個足夠標準、通用的軟硬件接口層的定義 。
作為亞洲最大AI軟件平臺公司 , 商湯既有核心平臺層和操作系統層的軟件能力 , 又有大量下游應用 , 跟各個國產硬件、芯片廠商做核心軟件、系統的適配 , 能幫他們節省研發費用和時間成本 。
中期的工作是 , 商湯在臨港AIDC投入運營之后 , 會跟中國電子技術標準化研究院(工業和信息化部電子第四研究院)建立“CESI-SenseTime人工智能算力及芯片評測聯合實驗室” , 開展AI算力和芯片標準制定、AI芯片測評工具開發 , 提供AI計算中心、芯片測試驗證服務和人才培訓等支持 。
該實驗室未來將成為中立的第三方AI芯片、AI服務器測評機構 , 為產業提供參考標準 , 也促進每個硬件廠商更好地提升自家產品 。
面向長期 , 由于商湯自身有大量下游產業應用 , 商湯將不遺余力地把相對較好的國產AI芯片及其服務器 , 導入整合到自己及合作伙伴的解決方案 , 將它快速推向市場 。
三、六大技術亮點 , 解讀AIDC建設的硬實力商湯的AIDC通過其大規模數據處理及高性能計算的能力 , 為研發提供支持 。
楊帆強調說 , AIDC的算力并非堆砌 , 其中涉及許多通信側、存儲側的領先技術 。 在高性能計算、分布式調度、數據I/O、軟硬件協同以及系統安全方面 , AIDC均實現了多重突破 。

(1)高性能計算:商湯已開發一款高性能計算引擎 , 它包含豐富的高度優化的計算程序、編譯器及運行時環境 。 與芯片供應商提供的計算引擎相比 , 商湯的計算引擎通過優化的算子及全圖優化技術 , 顯著提高端到端的運行效率 , 不僅涵蓋神經網絡計算 , 亦涵蓋預處理及后處理階段 。

相關經驗推薦