中國消費者報報道(記者武曉莉)百“?!贝髴?zhàn)哪家強?IT市場研究和咨詢公司IDC最新發(fā)布的《AI大模型技術(shù)能力評估報告,2023》(以下簡稱IDC評估報告)給出了答案。IDC評估報告顯示,百度文心大模型3.5拿下12項指標的7個滿分,其中綜合評分、算法模型和行業(yè)覆蓋3個第一,體現(xiàn)了百度文心大模型的基礎(chǔ)技術(shù)深度和產(chǎn)業(yè)應(yīng)用覆蓋廣度。
IDC《AI大模型技術(shù)能力評估報告,2023》:百度7項滿分、綜合評分第一。資料圖片
三大維度考驗大模型應(yīng)用能力
據(jù)介紹,IDC評估報告圍繞產(chǎn)品技術(shù)、服務(wù)生態(tài)以及行業(yè)應(yīng)用三大維度,考察大模型的10余項指標,其中“算法模型”和“行業(yè)覆蓋”成為衡量大模型能力極其重要的兩個指標。
產(chǎn)品技術(shù)能力中,“算法模型”是大模型能力最核心的要素,也是決定大模型應(yīng)用效果的根本。只有通過算法模型技術(shù)的突破,實現(xiàn)具有通用效果優(yōu)勢的大模型底座,才能支撐更廣泛的行業(yè)覆蓋。
在行業(yè)應(yīng)用能力中,應(yīng)用覆蓋的廣度是當(dāng)下大模型廠商最為關(guān)注的指標?!靶袠I(yè)覆蓋”通過企業(yè)級客戶數(shù)量和落地行業(yè)數(shù),體現(xiàn)了大模型在產(chǎn)業(yè)落地上的實力,是大模型效果通用領(lǐng)先性、行業(yè)結(jié)合能力兩方面的綜合體現(xiàn)。
“算法模型”“行業(yè)覆蓋”兩個核心指標有其內(nèi)在的關(guān)聯(lián)性,行業(yè)覆蓋的廣度是算法模型通用領(lǐng)先性的集中體現(xiàn),也將為算法模型能力持續(xù)提升提供源源不斷的正向反饋,形成持續(xù)迭代提升的飛輪。
本次評估中,百度文心大模型兩項指標在眾多廠商中均獲得唯一滿分,充分體現(xiàn)了文心大模型產(chǎn)品技術(shù)領(lǐng)先、行業(yè)應(yīng)用廣泛深入。
確立行業(yè)首個大模型評估框架
這是IDC首次提出AI大模型技術(shù)能力評估框架,國內(nèi)主流大模型,包括百度、阿里、騰訊、華為、科大訊飛、360、商湯等14家廠商參與了本次評估。結(jié)果顯示,百度AI大模型整體競爭力位于領(lǐng)先水平,百度文心在模型能力、工具平臺、生態(tài)布局以及行業(yè)覆蓋上優(yōu)勢明顯,并已提前進入商業(yè)化落地探索階段。
IDC《AI大模型技術(shù)能力評估報告,2023》:百度獲算法模型、行業(yè)覆蓋唯一滿分。資料圖片
文心大模型在此次IDC評估中獲得了算法模型維度的唯一一個滿分,充分體現(xiàn)了百度在大模型核心技術(shù)上的領(lǐng)先優(yōu)勢。百度自2019年開始深耕預(yù)訓(xùn)練模型研發(fā),先后發(fā)布知識增強文心系列模型。前不久,百度正式發(fā)布文心大模型3.5版本,實現(xiàn)了基礎(chǔ)模型升級、精調(diào)技術(shù)創(chuàng)新、知識點增強、邏輯推理增強等,新版本在效果、功能、性能上進行了全面提升。
據(jù)介紹,上述結(jié)果得益于百度“芯片-框架-模型-應(yīng)用”四層技術(shù)棧優(yōu)勢、知識增強的核心特色和繁榮的大模型生態(tài)三大優(yōu)勢。百度擁有自研的深度學(xué)習(xí)平臺飛槳有力支撐了大模型的高效訓(xùn)練和推理。飛槳與文心的協(xié)同優(yōu)化,讓文心大模型3.5最新版本的模型效果提升50%,訓(xùn)練速度提升2倍,推理速度提升30倍。知識增強作為文心大模型的核心特色之一,實現(xiàn)了更高的效率、更好的效果、更強的可解釋性。
在大模型生態(tài)方面,百度文心已形成企業(yè)、教育、社區(qū)三位一體的生態(tài)體系。最新數(shù)據(jù)顯示,百度有超過750萬開發(fā)者基礎(chǔ),20萬企業(yè)生態(tài)基礎(chǔ),多層次開展大模型人才培訓(xùn)、企業(yè)賦能、開發(fā)者運營。百度還設(shè)立了10億創(chuàng)投基金鼓勵大模型創(chuàng)意、繁榮大模型生態(tài)。
文心的行業(yè)覆蓋獲評唯一滿分
AI大模型已經(jīng)從拼參數(shù)發(fā)展到拼應(yīng)用,進入大規(guī)??蓮?fù)制的產(chǎn)業(yè)落地階段。百度文心大模型在業(yè)內(nèi)首次提出了行業(yè)大模型的落地思路,聯(lián)合國家電網(wǎng)、上海辭書出版社等企業(yè)單位,合作發(fā)布了11個行業(yè)大模型,是業(yè)內(nèi)最早和廣泛深入推動行業(yè)大模型的廠商。
百度文心大模型全景圖。資料圖片
IDC評估結(jié)果顯示,百度文心大模型在行業(yè)覆蓋上獲得唯一滿分成績,在能源、金融、教育、醫(yī)療等領(lǐng)域已經(jīng)實現(xiàn)廣泛業(yè)務(wù)布局和落地場景探索。
據(jù)介紹,文心大模型已經(jīng)擁有中國最大的產(chǎn)業(yè)應(yīng)用規(guī)模,目前有15萬家企業(yè)申請接入文心一言測試。百度智能云與300多家生態(tài)伙伴,在超過400個場景中已取得相當(dāng)不錯的測試效果。
未來,所有的企業(yè)都會強依賴大模型,所有的產(chǎn)品都會基于大模型來開發(fā)。百度文心大模型將持續(xù)發(fā)揮算法模型基礎(chǔ)技術(shù)優(yōu)勢,助力千行百業(yè)將大模型內(nèi)化為自身的生產(chǎn)力工具,走上智能化轉(zhuǎn)型升級的快車道,構(gòu)建面向全球的強大競爭力。
官方微信公眾號
官方微博