自達(dá)觀數(shù)據(jù)2023年3月宣布研發(fā)大語言模型以來,一直積極探索大語言模型的專業(yè)化、特長化和產(chǎn)品化,并在7月7日世界人工智能大會上,正式推出具有長文本、多語言、垂直化三大特點的專用國產(chǎn)“曹植”大語言模型,并創(chuàng)新性地采用了多模型并聯(lián)(Ensemble)架構(gòu),可以通過將不同參數(shù)規(guī)模和不同類型的模型相結(jié)合,更好地解決垂直行業(yè)的問題。在這個基礎(chǔ)上,為促使“曹植”大模型在各垂直領(lǐng)域中可以進(jìn)行基于專有數(shù)據(jù)的模型微調(diào),并得到更低成本、更高效能的落地與應(yīng)用,達(dá)觀數(shù)據(jù)正式推出全新一站式企業(yè)級大模型生產(chǎn)平臺——“曹植”大模型管理平臺。
“曹植”大模型管理平臺
作為一款面向企業(yè)開發(fā)者的一站式大模型開發(fā)及服務(wù)管理平臺,本次推出的大模型管理平臺,內(nèi)置達(dá)觀數(shù)據(jù)全棧自主研發(fā)的“曹植”大模型,并兼容外部LLaMA2、ChatGLM2、Baichuan、InternLM等多種開源模型,實現(xiàn)各類模型fine-tuning微調(diào),方便客戶快速上手、輕松使用,上線開發(fā)者所需專業(yè)領(lǐng)域服務(wù),實現(xiàn)智能知識管理、知識搜索與問答、文檔智能寫作、素材生成等智能化應(yīng)用。
大模型管理平臺核心功能
一、數(shù)據(jù)管理
訓(xùn)練數(shù)據(jù)的質(zhì)量對模型訓(xùn)練效果及模型輸出內(nèi)容的影響是決定性的,正向好的訓(xùn)練數(shù)據(jù)可以讓模型的生成內(nèi)容“圍繞問題,思路清晰”、“妙筆生花”,因此對訓(xùn)練數(shù)據(jù)體系化的管理至關(guān)重要?!安苤病贝竽P凸芾砥脚_提供了完善的數(shù)據(jù)標(biāo)注、數(shù)據(jù)清洗、數(shù)據(jù)增強(qiáng)、數(shù)據(jù)集版本迭代等數(shù)據(jù)相關(guān)維護(hù)功能。
二、模型管理
大模型管理平臺構(gòu)建了完善的模型訓(xùn)練流程,根據(jù)垂直業(yè)務(wù)場景需求,建立針對性的模型組,選取合適的數(shù)據(jù)集進(jìn)行模型訓(xùn)練、版本迭代,為服務(wù)上線提供模型選擇。
平臺內(nèi)置自研多種大語言模型,增加用戶模型選擇維度,除了預(yù)置模型外,平臺同樣支持適配其他開源模型,能夠?qū)崿F(xiàn)快速上線模型倉庫。
模型管理功能
三、服務(wù)管理
大模型管理平臺提供了簡單易上手的場景服務(wù)上線流程,簡單快捷選取微調(diào)模型上線服務(wù),可以根據(jù)垂直場景業(yè)務(wù)需求,構(gòu)建統(tǒng)一應(yīng)用服務(wù),只需更換底層微調(diào)模型版本即可完成熱切換。
基于獨創(chuàng)技術(shù)平臺支持異構(gòu)硬件統(tǒng)一管理調(diào)度,廣泛支持國內(nèi)主流的NPU芯片、GPU加速芯片,支持集群化分組管理,支持底層資源監(jiān)測、調(diào)度,最大化利用計算資源。
四、指令管理
指令即通常所說的Prompt,Prompt質(zhì)量對模型輸出文本質(zhì)量影響重大,全面、完善的Prompt可以使得模型生成更優(yōu)的內(nèi)容。大模型管理平臺深度適配不同行業(yè)、不同細(xì)分領(lǐng)域的指令需求,提供清晰和具體的指令,引導(dǎo)模型輸出生成高相關(guān)、高準(zhǔn)確且高質(zhì)量的文本內(nèi)容。
翻譯場景下不同Prompt的差異
大模型管理平臺提供了定制Prompt模板功能,用戶可以根據(jù)業(yè)務(wù)垂直場景需求參照內(nèi)置Prompt樣例,自定義編寫業(yè)務(wù)側(cè)需要的Prompt內(nèi)容,自主、靈活配置Prompt模板中需要引用的參數(shù),在調(diào)用時,傳遞相應(yīng)參數(shù)即可調(diào)用全部Prompt全部內(nèi)容。
此外,達(dá)觀數(shù)據(jù)也使用海量訓(xùn)練數(shù)據(jù)對“曹植”大模型進(jìn)行預(yù)訓(xùn)練,生成具備基礎(chǔ)語言能力和垂直應(yīng)用能力的模型;獨家提供定制化精調(diào)服務(wù),以加強(qiáng)垂直領(lǐng)域?qū)S萌蝿?wù)的能力;堅持訓(xùn)練數(shù)據(jù)與算法模型自主可控,與國產(chǎn)GPU合作伙伴開展長期合作,不斷優(yōu)化高質(zhì)量硬件設(shè)備,以適應(yīng)市場需求和技術(shù)發(fā)展。未來,達(dá)觀數(shù)據(jù)也將在自研的先進(jìn)人工智能技術(shù)和豐富的應(yīng)用經(jīng)驗之上,不斷提升大模型管理平臺的功能和性能邊界;平臺的廣泛兼容性、可擴(kuò)展性和操作便利性,為各行業(yè)提供提供更好、更快、更安全的解決方案,為客戶提供更好的服務(wù)和支持,讓大模型賦能百業(yè),促進(jìn)科技進(jìn)步和社會發(fā)展。