3月5日,在巴塞羅那舉辦的MWC25期間,華為正式發(fā)布了面向AI大模型場景的新一代AI存儲產(chǎn)品——OceanStor A800。該產(chǎn)品作為業(yè)界首款具備“長記憶”能力的存儲設備,采用多級KV緩存機制,將中間Token持久化保存,實現(xiàn)高速數(shù)據(jù)吞吐與毫秒級推理響應。
據(jù)悉,OceanStor A800單框可達2400萬IOPS與500GB/s帶寬,訓練集加載效率是業(yè)界8倍,斷點續(xù)訓速度提升4倍;長記憶功能使大模型推理時延降低78%,單卡吞吐量提升67%,有效提升AI訓練算力利用率,滿足金融、醫(yī)療、投研等多行業(yè)應用需求。
華為表示,憑借以存代算及內(nèi)生向量知識庫等創(chuàng)新技術,OceanStor A800將為AI大模型訓練和推理提供堅實數(shù)據(jù)支撐,助力企業(yè)跨越數(shù)據(jù)孤島,構建高效智能計算平臺,推動數(shù)智時代全面升級。