自達(dá)觀數(shù)據(jù)23年3月宣布研發(fā)大語言模型以來,一直積極探索大語言模型的專業(yè)化、特長化和產(chǎn)品化,并在7月7日世界人工智能大會上,正式推出具有長文本、多語言、垂直化三大特點(diǎn)的專用國產(chǎn)“曹植”大語言模型。為促使“曹植”大模型在各垂直領(lǐng)域中可以更低成本高效能地落地與應(yīng)用,達(dá)觀數(shù)據(jù)正式推出私有化大模型一體機(jī)。
“曹植”大模型一體機(jī)作為一家智能文本處理領(lǐng)域的領(lǐng)軍企業(yè),達(dá)觀數(shù)據(jù)本次推出的私有化“曹植”大模型一體機(jī),內(nèi)置達(dá)觀數(shù)據(jù)全棧自主研發(fā)的“曹植”大模型,支持三方開源模型庫,可在企業(yè)內(nèi)部一鍵部署大模型應(yīng)用,能同時(shí)為多種垂直大模型業(yè)務(wù)提供文檔智能審閱、智能知識管理、知識搜索與問答、文檔智能寫作、智能推薦等智能化服務(wù),支持和具備安全便捷的AI訓(xùn)練、推理、長文檔寫作、機(jī)器翻譯、語義分析審核、知識問答、text-to-SQL等場景功能應(yīng)用。
“曹植”大模型一體機(jī)特色應(yīng)用
一、智能知識管理
近日,達(dá)觀數(shù)據(jù)發(fā)布新一代的知識管理系統(tǒng)也應(yīng)用在“曹植”大模型中。達(dá)觀新一代智能知識管理系統(tǒng),以“曹植”大語言模型為基座,結(jié)合知識圖譜、自然語言處理、多模態(tài)知識挖掘等人工智能核心技術(shù),提供知識生產(chǎn)、知識組織、知識搜索、知識問答、知識圖譜、知識社區(qū)6大能力,并能將企業(yè)積累的海量結(jié)構(gòu)化和非結(jié)構(gòu)化文檔經(jīng)過自然語言技術(shù)處理和提煉,搭建更加智能化、人性化的知識管理系統(tǒng),廣泛應(yīng)用于企業(yè)文檔管理、研發(fā)知識管理、制度管理、合同管理等場景,幫助企業(yè)用戶更加快速、高效、便捷地實(shí)現(xiàn)知識獲取、共享、應(yīng)用和創(chuàng)新。
二、智能知識搜索
為了提供更好的用戶體驗(yàn),“曹植”大模型也內(nèi)嵌了達(dá)觀智能搜索平臺。達(dá)觀智能搜索平臺能采集、匯聚各個(gè)業(yè)務(wù)系統(tǒng)的結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù),配備強(qiáng)大的可視化配置后臺,輕松實(shí)現(xiàn)搜索平臺的配置與運(yùn)營,基于曹植大模型、自然語言處理和知識圖諾等技術(shù)的支撐,提供全文搜索、智能搜索提示、智能搜索糾錯(cuò)、熱門搜索、推薦搜索、相關(guān)搜索、搜索結(jié)果智能高亮、歷史搜索、語義標(biāo)簽(關(guān)鍵詞標(biāo)簽、自動化摘要)、長文本搜索(意圖識別、內(nèi)容定位)、相關(guān)推薦、圖譜搜索與智能卡片等更加智能化、個(gè)性化的搜索服務(wù),實(shí)現(xiàn)全業(yè)務(wù)系統(tǒng)、全數(shù)據(jù)的智能精準(zhǔn)搜索,提升企業(yè)全方位效率。
三、智能知識推薦
為了幫助企業(yè)用戶從海量信息中快速找到最感興趣的內(nèi)容,也將達(dá)觀智能推薦平臺集成到了“曹植”大模型中,平臺基于前沿的人工智能算法和大數(shù)據(jù)挖掘技術(shù),能結(jié)合對行業(yè)場景的深度理解,通過對海量數(shù)據(jù)進(jìn)行分析挖掘,識別用戶興趣偏好,進(jìn)行智能地精準(zhǔn)推薦,有效緩解“信息過載”和“物品長尾”問題,使得用戶體驗(yàn)和核心經(jīng)濟(jì)收益指標(biāo)得到大幅度提升。
四、文檔智能寫作
達(dá)觀數(shù)據(jù)在長文本處理領(lǐng)域深耕多年,研發(fā)的“曹植”大模型特別擅長做長文檔的寫作、審核、潤色、翻譯等。“曹植”大模型通過其卓越的自動化寫作能力,可準(zhǔn)確完成多類型、復(fù)雜結(jié)構(gòu)的長文本寫作,自動起草多種類型的文檔,輕松應(yīng)對長篇大論的要求。為提升長文本寫作專業(yè)性,達(dá)觀專門訓(xùn)練了多模態(tài)AIGC生成能力,可自動生成表格、圖表、數(shù)據(jù)等元素。“曹植”同時(shí)擁有其杰出的多語言寫作和翻譯能力,可以對原文的標(biāo)題、段落等內(nèi)容實(shí)現(xiàn) 1:1版式還原,無需更改格式,提供實(shí)時(shí)的翻譯體驗(yàn),使得用戶在不同語言環(huán)境下都能得到高質(zhì)量的文案服務(wù)。無論是白皮書、技術(shù)報(bào)告還是品牌故事,“曹植”大模型都能為客戶提供高質(zhì)量、流暢的文案撰寫服務(wù)。
五、文檔智能審閱
“曹植”大模型集成了達(dá)觀自研的IDP文檔智能審閱平臺,該平臺基于原創(chuàng)的OCR識別技術(shù)能全面覆蓋各種復(fù)雜、特殊場景的結(jié)構(gòu)化和非結(jié)構(gòu)化文檔解析,并利用NLP語義分析技術(shù)理解文檔含義,提取關(guān)鍵信息后標(biāo)準(zhǔn)化處理,通過識別、抽取、比對、審核等模塊實(shí)現(xiàn)文檔的規(guī)范化審核、各文檔間的信息的比對校驗(yàn),及時(shí)發(fā)現(xiàn)異常和風(fēng)險(xiǎn)并通過人工輔助復(fù)審,便捷化修改,提升項(xiàng)目文檔審核的效率。
“曹植”大模型一體機(jī)四大優(yōu)勢
“曹植”大模型一體機(jī)是構(gòu)建企業(yè)自主創(chuàng)新大模型應(yīng)用的基石,具有功能全面、技術(shù)領(lǐng)先、開箱即用等優(yōu)勢:
1.輕量可控,開箱即用,零周期快速構(gòu)建
軟硬一體機(jī)交付,開箱即用,零周期快速構(gòu)建AI能力,與華為、燧原等國內(nèi)芯片深度適配,支持多場景高效應(yīng)用與推理服務(wù),減少軟硬件適配調(diào)優(yōu)、系統(tǒng)搭建及運(yùn)維成本,支持模型端到端部署能力,在更短時(shí)間內(nèi)提升大模型價(jià)值。
2.提供5大版本高性能GPU服務(wù)器
10B大模型一體機(jī)標(biāo)準(zhǔn)版匹配英偉達(dá)A100顯卡。10B大模型信創(chuàng)一體機(jī)、50B大模型一體、100B大模型一體機(jī)、文檔智能解析一體機(jī)等信創(chuàng)版配置華為昇騰910、華為昇騰310、燧原-云燧T20加速卡,同時(shí)擴(kuò)展寒武紀(jì)、沐曦等國內(nèi)主流AI加速卡和GPU。從芯片、操作系統(tǒng)、AI軟件平臺、算法、數(shù)據(jù)等多維度滿足大模型應(yīng)用需求。
3.內(nèi)置大模型管理平臺
內(nèi)置自主研發(fā)、內(nèi)置“曹植”大模型并支持Alpaca-LoRA、ChatGLM、T5、MiniGPT-4、Stable Diffusion、LLaMA2及Milvus向量數(shù)據(jù)庫等三方開源模型庫,提供模型開發(fā)與推理預(yù)測的全流程功能。
4.自主可控安全可靠,支持私域數(shù)據(jù)對接
兼容x86和國產(chǎn)化信創(chuàng)服務(wù)器,從芯片到應(yīng)用全面適配信創(chuàng)體系,可支持x86、ARM及GPU等異構(gòu)算力統(tǒng)一管理和調(diào)度,保證大模型和信息數(shù)據(jù)安全,滿足金融、政府、運(yùn)營商及更多傳統(tǒng)企業(yè)的國產(chǎn)化需求。平臺還對信創(chuàng)生態(tài)的CPU、服務(wù)器及操作系統(tǒng)進(jìn)行全面適配,形成信創(chuàng)一體機(jī)交付模式,使大模型可以和國產(chǎn)CPU相兼容并進(jìn)行統(tǒng)一調(diào)度管理,支持?jǐn)?shù)據(jù)庫、批量文檔等多類型私域數(shù)據(jù)對接,支持智能分析與問答,并對用戶數(shù)據(jù)和敏感信息提供安全性保護(hù)。
此外,達(dá)觀數(shù)據(jù)也使用海量訓(xùn)練數(shù)據(jù)對“曹植”大模型進(jìn)行預(yù)訓(xùn)練,生成具備基礎(chǔ)語言能力和垂直應(yīng)用能力的模型;獨(dú)家提供精調(diào)服務(wù),以加強(qiáng)垂直領(lǐng)域?qū)S萌蝿?wù)的能力;堅(jiān)持訓(xùn)練數(shù)據(jù)與算法模型自主可控,與國產(chǎn)GPU合作伙伴開展長期合作,不斷優(yōu)化高質(zhì)量硬件設(shè)備,以適應(yīng)市場需求和技術(shù)發(fā)展。未來,達(dá)觀數(shù)據(jù)也將在自研的的先進(jìn)人工智能技術(shù)和豐富的應(yīng)用經(jīng)驗(yàn)之上,不斷提升“曹植”大模型一體機(jī)的性能和應(yīng)用范圍,為各行業(yè)提供提供更好、更快、更安全的解決方案,為客戶提供更好的服務(wù)和支持,讓大模型賦能百業(yè),促進(jìn)科技進(jìn)步和社會發(fā)展。