12月8日,鵬城實驗室與百度聯(lián)合發(fā)布全球首個知識增強千億大模型——鵬城-百度·文心。
為什么大模型在產(chǎn)學界持續(xù)走熱,越來越多的技術(shù)公司入場?
如中國工程院院士、鵬程實驗室主任高文所言,預訓練模型賦能人工智能衍生更多的應(yīng)用,而不局限于某個領(lǐng)域,是人工智能自身發(fā)展并作用于社會及科學創(chuàng)新的重要工具。
當人工智能的需求呈現(xiàn)出碎片化、多樣化的特點,人工智能模型卻存在很多挑戰(zhàn),通用性低是首要問題。也就是說,A模型往往專用于特定A領(lǐng)域,應(yīng)用到B領(lǐng)域便差強人意。
百度首席技術(shù)官王海峰介紹,鵬城-百度·文心是全球首個知識增強千億大模型,參數(shù)規(guī)模達2600億。在機器閱讀理解、文本分類、語義相似度計算等60多項任務(wù)上取得最好效果,并在30余項小樣本和零樣本任務(wù)上刷新基準。
百度集團副總裁、深度學習技術(shù)及應(yīng)用國家工程實驗室副主任吳甜說:“60多項不同的任務(wù),說明大模型的通用性很強,30余項小樣本和零樣本任務(wù)刷新基準,則意味著大模型泛化能力更強,對支撐各行各業(yè)非常重要。”
鵬城-百度·文心希望解決的是,傳統(tǒng)人工智能模型泛化性差、強依賴昂貴人工標注數(shù)據(jù)、落地成本高等應(yīng)用問題,希望成為千行百業(yè)人工智能開發(fā)的首選基座大模型。
而鵬城實驗室的算力系統(tǒng)“鵬城云腦Ⅱ”和飛槳深度學習平臺就是鵬城-百度·文心理想實現(xiàn)的關(guān)鍵支撐,解決了超大模型訓練的多個公認技術(shù)難題。
同日,百度產(chǎn)業(yè)級知識增強大模型“文心”全景圖首次亮相。
作為產(chǎn)業(yè)級知識增強大模型,百度文心大模型包含自然語言理解大模型、計算機視覺大模型和跨模態(tài)大模型,既指向基礎(chǔ)通用的,也面向重點領(lǐng)域和重點任務(wù),還有豐富的工具與平臺。“知識增強”是它的核心特色。
知識是人類智慧的結(jié)晶,是人類進步的重要推動力。通過知識增強,計算機有了學習并運用知識,像人一樣理解和認知世界的可能。
吳甜強調(diào):“我們希望人工智能系統(tǒng)通過對知識的學習,能夠提升學習效率,具有更好的可解釋性,更符合人對事物的理解。”
百度文心正通過百度飛槳平臺陸續(xù)對外開源開放,已大規(guī)模應(yīng)用于百度搜索、信息流、智能音箱等互聯(lián)網(wǎng)產(chǎn)品,并賦能工業(yè)、能源、金融、通信、媒體、教育等各行業(yè)。
責任編輯:Rex_08