4月21日,由上海市數(shù)據(jù)科學(xué)重點實驗室攜手達觀數(shù)據(jù)、上海浦東軟件園聯(lián)合舉辦的“大模型產(chǎn)業(yè)發(fā)展研討會”圓滿落幕。本次研討會是繼達觀數(shù)據(jù)在北京、成都順利舉辦“ChatGPT及大模型專題研討會”后的又一場科技盛會,當(dāng)天大會匯聚了大模型產(chǎn)業(yè)國際和國內(nèi)頂尖的工業(yè)界與學(xué)術(shù)界專家學(xué)者,分享他們在大模型產(chǎn)業(yè)發(fā)展方面的最新進展與未來規(guī)劃,并共同探討大模型產(chǎn)業(yè)的未來發(fā)展趨勢和挑戰(zhàn)。
上海浦東軟件園創(chuàng)業(yè)投資管理有限公司董事、總經(jīng)理郭斌致辭
上海浦東軟件園創(chuàng)業(yè)投資管理有限公司董事、總經(jīng)理郭斌在致辭中表示,上海浦東軟件園作為“一核三園兩港”的重要組成部分,一直秉承“科技創(chuàng)新、產(chǎn)業(yè)發(fā)展”的核心理念,積極布局新一代信息技術(shù)產(chǎn)業(yè)發(fā)展,努力搭建產(chǎn)業(yè)生態(tài)圈,打造數(shù)據(jù)技術(shù)策源與專業(yè)服務(wù)高地,推動產(chǎn)業(yè)智能化升級。相信通過本次會議的交流和研討,能夠深入理解大模型的概念和應(yīng)用,掌握”大模型”+”產(chǎn)業(yè)”時代的發(fā)展規(guī)律和趨勢,為企業(yè)創(chuàng)新、產(chǎn)業(yè)升級和社會進步注入新動力。
上海市數(shù)據(jù)科學(xué)重點實驗室主任肖仰華引導(dǎo)發(fā)言
上海市數(shù)據(jù)科學(xué)重點實驗室主任肖仰華教授,作為主辦方代表以《對于我國大模型產(chǎn)業(yè)發(fā)展的一些思考》為題進行引導(dǎo)發(fā)言。肖仰華教授提到,通用人工智能時代已然來臨,它將帶來前所未有的產(chǎn)業(yè)變革。國際上大模型產(chǎn)業(yè)生態(tài)發(fā)展迅速,但是我國尚處于起步階段,各自為政,大模型林立,缺乏統(tǒng)一規(guī)劃、合作協(xié)同和立法保障,并存在同質(zhì)化現(xiàn)象嚴(yán)重、對國外大模型存在嚴(yán)重依賴、國產(chǎn)算力生態(tài)尚不完善、中文數(shù)據(jù)質(zhì)量較差且規(guī)模不大、大模型人才匱乏、落地成本高等問題。肖仰華教授表示希望大家都可以積極參與思考“大模型產(chǎn)業(yè)應(yīng)如何發(fā)展”。
在主題分享環(huán)節(jié),達觀數(shù)據(jù)董事長兼CEO陳運文、中國信息通信研究院云計算與大數(shù)據(jù)研究所人工智能部副主任董曉飛、愛數(shù)研發(fā)副總裁楊宇、超對稱創(chuàng)始人,首席科學(xué)家吳恒魁、智譜AI大模型事業(yè)部VP薛宇飛、文因互聯(lián)創(chuàng)始人鮑捷等多位人工智能領(lǐng)域?qū)<?,針對肖仰華教授提出的問題各抒己見,并從大規(guī)模語言模型的技術(shù)發(fā)展、應(yīng)用落地與未來前景等多個維度進行了分享。
達觀數(shù)據(jù)董事長兼CEO陳運文演講《探索大語言模型的垂直化訓(xùn)練技術(shù)和應(yīng)用》
達觀數(shù)據(jù)董事長兼CEO、復(fù)旦大學(xué)計算機博士陳運文以探索大語言模型的垂直化訓(xùn)練技術(shù)和應(yīng)用為主題,細致分享了達觀數(shù)據(jù)在垂直領(lǐng)域的語言模型方面的工程化探索,包括:參數(shù)規(guī)模和語言模型的參數(shù)規(guī)模探討、通用大模型的預(yù)訓(xùn)練數(shù)據(jù)集研究?、垂直領(lǐng)域的提示工程、達觀“曹植”系統(tǒng)、達觀數(shù)據(jù)的AIGC應(yīng)用等,還介紹了金融專用大模型BloombergGPT的發(fā)展與應(yīng)用。他認為深化大模型和AIGC在垂直領(lǐng)域的應(yīng)用,真正把大模型和AIGC融入到企業(yè)的實際業(yè)務(wù)中,對于商業(yè)化和大語言模型研究都具有重要意義。達觀數(shù)據(jù)正在研發(fā)的垂直領(lǐng)域模型“曹植”系統(tǒng)和AIGC應(yīng)用,未來將會在各行各業(yè)里落地應(yīng)用,為每個行業(yè)賦能。其中,“曹植”大模型,引自曹植七步成詩的典故,希望它作為垂直、專用、國產(chǎn)的GPT模型。
中國信息通信研究院云計算與大數(shù)據(jù)研究所人工智能部副主任董曉飛演講《中國信通院大模型標(biāo)準(zhǔn)及評測介紹》
中國信息通信研究院云計算與大數(shù)據(jù)研究所人工智能部副主任董曉飛詳細的介紹了中國信通院當(dāng)前的標(biāo)準(zhǔn)研制情況、評估測試情況和下一步工作規(guī)劃。他分享到信通院正在建立大模型標(biāo)準(zhǔn)體系2.0,適配產(chǎn)業(yè)發(fā)展趨勢,并且編制工作穩(wěn)步推進,已發(fā)布和定稿多項標(biāo)準(zhǔn),如:面向大模型“建、用、管”產(chǎn)業(yè)需求,形成《大規(guī)模預(yù)訓(xùn)練模型技術(shù)和應(yīng)用評估方法》系列標(biāo)準(zhǔn)。評估測試全面推進,同時,結(jié)合《大規(guī)模預(yù)訓(xùn)練模型技術(shù)和產(chǎn)品評估方法》、《自然語言處理技術(shù)及產(chǎn)品評估方法》《生成式人工智能技術(shù)及產(chǎn)品評估方法》等系列標(biāo)準(zhǔn),推出大模型專項評測工作,引導(dǎo)大細分領(lǐng)域落地。信通院會夯實大模型全棧評測能力,構(gòu)建協(xié)同共贏評測生態(tài)。
愛數(shù)研發(fā)副總裁楊宇演講《大語言模型釋放全域數(shù)據(jù)價值》
愛數(shù)研發(fā)副總裁楊宇以大語言模型釋放全域數(shù)據(jù)價值為題,介紹了領(lǐng)域大模型和領(lǐng)域知識,并表示通用大模型將會分裂為垂直行業(yè)的領(lǐng)域大模型,如化工、證券、政府等領(lǐng)域,并且大模型能夠降低領(lǐng)域知識網(wǎng)絡(luò)的構(gòu)建成本、提升質(zhì)量。
超對稱創(chuàng)始人,首席科學(xué)家吳恒魁以語言模型在以科學(xué)發(fā)現(xiàn)上的應(yīng)用為主題的演講中,詳細地介紹了Big Bang Transformer Model(BBT模型)。他提到,BBT-Science大模型是基于千億參數(shù)BBT通用大模型在科學(xué)語料繼續(xù)訓(xùn)練構(gòu)建的大模型,可應(yīng)用于物理、化學(xué)、生物、數(shù)學(xué)等不同學(xué)科的知識問答,可以為科研人員提供快速精準(zhǔn)的知識檢索,針對所研究領(lǐng)域的前沿問題提供新的Ideas,利用多學(xué)科知識訓(xùn)練出的能力提供跨學(xué)科的建議和洞見。
智譜AI大模型事業(yè)部VP薛宇飛和文因互聯(lián)創(chuàng)始人鮑捷通過線上連線的方式參與分享。薛宇飛介紹到,CodeGeeX是開源的大規(guī)模多語言代碼生成模型,目前總計有23種編程語言, 涵蓋Python, Java, C++, JavaScript, C, Go, HTML等主流語言,可以更好輔助程序員寫代碼。鮑捷在分享中表示,企業(yè)自有大模型是必不可少的,因為它可以幫助企業(yè)更加深入地了解自身的業(yè)務(wù)模式和運營機制,從而更好地制定戰(zhàn)略和決策,更加有效地提高企業(yè)的運營效率和競爭力。
在圓桌對話環(huán)節(jié),復(fù)旦大學(xué)計算機學(xué)院研究員、博導(dǎo)李直旭,上海交通大學(xué)人工智能研究院總工程師金耀輝,復(fù)旦大學(xué)人工智能創(chuàng)新與產(chǎn)業(yè)研究院研究員程遠,貝爾實驗室研究員林侃,復(fù)星集團AI業(yè)務(wù)負責(zé)人邵浩,小i機器人副總裁、研究院院長陳成才,壹沓科技聯(lián)合創(chuàng)始人肖鳴林圍繞“國產(chǎn)“ChatGPT”和大模型研究現(xiàn)狀與未來發(fā)展”的主題展開了深度探討和交流,現(xiàn)場氛圍熱烈。
圓桌對話:國產(chǎn)“chatGPT”和大模型研究現(xiàn)狀與未來發(fā)展
專家們在討論中對于“國產(chǎn)‘ChatGPT’和大模型的發(fā)展方向”達成共識:自然語言處理這一方向比起其他領(lǐng)域,跟海外先進企業(yè)的差距要小很多。要平視OpenAI而非神話它,我們面臨的是一個代溝,但不是跨越不了的鴻溝,在追趕到超越的過程中需要給國產(chǎn)模型一些時間。
在技術(shù)與落地層面,與會專家們認為,ChatGPT帶動了自然語言處理整體上下游以及芯片的思考和發(fā)展,某種程度上大模型可能將成為下一代的基礎(chǔ)設(shè)施,中國需要有自己的基礎(chǔ)模型體系,來保證安全性、并發(fā)性、穩(wěn)定性等問題。投資界、學(xué)術(shù)界、產(chǎn)業(yè)界要沉住氣,遠離概念炒作,扎扎實實做出成績。
最后,由上海市數(shù)據(jù)科學(xué)重點實驗室與達觀數(shù)據(jù)、優(yōu)刻得擬聯(lián)合發(fā)起的大模型創(chuàng)新創(chuàng)意應(yīng)用大賽正在火熱報名征集中。大賽也正式公布本次大賽獎金池,總金額達7萬元。該賽事旨在激發(fā)各類公司、技術(shù)團體、技術(shù)愛好者與高校同學(xué)們的想象力與創(chuàng)造力,將最新的大模型技術(shù)應(yīng)用到更多的領(lǐng)域場景與任務(wù)當(dāng)中,讓一些有價值的創(chuàng)意得到落地實現(xiàn)的機會。同時,也希望通過這個比賽搭建一個平臺,讓各個領(lǐng)域的專業(yè)人士、技術(shù)團隊和公司有機會交流和合作,共同推動人工智能技術(shù)的進步??靵砑尤氡荣惏蓗
https://www.wjx.top/vm/r3Is5S9.aspx(復(fù)制打開鏈接即可報名)