2025年4月10日,華為云在安徽蕪湖舉行的生態(tài)大會(huì)上,正式發(fā)布了基于CloudMatrix架構(gòu)的384超節(jié)點(diǎn)AI集群。該集群采用對(duì)等架構(gòu)設(shè)計(jì),具備高密度、高速率和高效率的特點(diǎn),顯著提升了AI算力性能。據(jù)華為云介紹,CloudMatrix架構(gòu)通過資源池化和智能調(diào)度,實(shí)現(xiàn)了算力資源的靈活管理和動(dòng)態(tài)分配,單節(jié)點(diǎn)算力提升達(dá)50倍,NPU利用率提高至60%,大模型訓(xùn)練效率提升68%。
此次發(fā)布的384超節(jié)點(diǎn)AI集群已在蕪湖數(shù)據(jù)中心規(guī)模上線,并全面適配了包括DeepSeek在內(nèi)的160多個(gè)第三方大模型,支持復(fù)雜大模型的訓(xùn)練和推理需求。華為云還推出了瑤光智能云腦,實(shí)現(xiàn)資源的按需組合,滿足百億到萬(wàn)億級(jí)模型訓(xùn)練所需的資源,并通過智能調(diào)度,提升算力性價(jià)比和資產(chǎn)價(jià)值。
華為云的CloudMatrix架構(gòu)在AI應(yīng)用、高性能計(jì)算和通用計(jì)算等領(lǐng)域展示出卓越的性能。在AI應(yīng)用方面,CloudMatrix提升了訓(xùn)練效率和推理性能;在高性能計(jì)算領(lǐng)域,將原本需耗時(shí)兩個(gè)月的仿真時(shí)長(zhǎng)壓縮至30小時(shí),實(shí)現(xiàn)了效率50倍的飛躍;在通用計(jì)算場(chǎng)景中,計(jì)算IO的極限性能提升8倍,彰顯了其對(duì)資源的極致利用。