近日,杭州通用人工智能論壇在未來科技城順利舉辦,在論壇上,國家工業(yè)和信息化部重點實驗室發(fā)布2023可信AI案例大模型研發(fā)應(yīng)用和工具平臺優(yōu)秀案例,達觀數(shù)據(jù)自主研發(fā)的“曹植”大語言模型和“曹植”大模型金融領(lǐng)域應(yīng)用案例成功入選,并受邀參與了中國大模型應(yīng)用標(biāo)準(zhǔn)的編寫工作,達觀“曹植”大模型在預(yù)訓(xùn)練大模型技術(shù)及AI實踐領(lǐng)域再獲行業(yè)認可。
本次論壇由中國信息通信研究院(以下簡稱中國信通院)、浙江省經(jīng)濟和信息化廳、杭州市人民政府、中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟共同主辦,以“千模競帆 百態(tài)萌生”為主題,聚焦大模型、生成式AI、對話式AI、知識計算、智能決策等多個熱點技術(shù),深入探討相關(guān)技術(shù)、產(chǎn)品、生態(tài)等發(fā)展趨勢,共促大模型工程化進程,共助生成式AI、對話、搜索、智能決策等可信發(fā)展, 進一步支撐人工智能應(yīng)用創(chuàng)新與產(chǎn)業(yè)落地。
作為人工智能三大領(lǐng)域之一的智能文本處理領(lǐng)域的領(lǐng)軍企業(yè),達觀數(shù)據(jù)一直致力于推動智能文本處理技術(shù)的發(fā)展和應(yīng)用,受邀參與了中國大模型應(yīng)用體系2.0中的標(biāo)準(zhǔn)《大規(guī)模預(yù)訓(xùn)練模型技術(shù)和應(yīng)用評估方法 第4部分:模型應(yīng)用》的編寫工作。現(xiàn)場,中國信通院也對大模型標(biāo)準(zhǔn)貢獻單位頒發(fā)了證書。大模型應(yīng)用標(biāo)準(zhǔn)是人工智能領(lǐng)域中的重要指導(dǎo)性文件,對于推動行業(yè)規(guī)范化和標(biāo)準(zhǔn)化具有重要意義。達觀數(shù)據(jù)的參與將為中國大模型應(yīng)用標(biāo)準(zhǔn)的制定貢獻力量,推動人工智能行業(yè)的健康發(fā)展。
?
曹植大模型
“曹植”大語言模型系統(tǒng)是達觀自主研發(fā)的國產(chǎn)版GPT,具有垂直、專用、國產(chǎn)三個特性:
- “垂直”:針對金融、制造等垂直行業(yè)來開發(fā)特定應(yīng)用
- “專用”:系統(tǒng)可以為每個客戶量身定制、私有化部署,確保數(shù)據(jù)安全私密
- “國產(chǎn)”:堅持原創(chuàng)自主,訓(xùn)練數(shù)據(jù)和算法模型自主可控
該系統(tǒng)結(jié)合先進的自然語言處理(NLP)、智能文檔處理(IDP)、光學(xué)字符識別(OCR)、機器人流程自動化(RPA)、知識圖譜等技術(shù),不僅能實現(xiàn)專業(yè)領(lǐng)域的AIGC智能化應(yīng)用,且可內(nèi)置在客戶各類業(yè)務(wù)系統(tǒng)中提供專用服務(wù),目前已獲得重要技術(shù)突破,以大量通用數(shù)據(jù)和領(lǐng)域數(shù)據(jù)自監(jiān)督訓(xùn)練的LLM為基座模型,通過大量通用任務(wù)數(shù)據(jù)和領(lǐng)域任務(wù)數(shù)據(jù)進行Prompt Learning微調(diào),在垂直領(lǐng)域內(nèi)的理解和生成的任務(wù)上都達到了很好的效果。未來,達觀將繼續(xù)致力于人工智能技術(shù)與產(chǎn)品的研究與落地。隨著技術(shù)和產(chǎn)品的發(fā)展,人工智能技術(shù)與產(chǎn)品將應(yīng)用到銀行、證券、政務(wù)、制造等各行業(yè)更廣更深的工作場景,達觀數(shù)據(jù)也會持續(xù)投入相關(guān)產(chǎn)品技術(shù)研發(fā),深耕行業(yè)場景應(yīng)用,為眾多行業(yè)持續(xù)創(chuàng)造更大的價值。