1月22日,百度正式發(fā)布并上線原生全模態(tài)大模型“文心大模型5.0”。該模型參數(shù)規(guī)模達(dá)到2.4萬億,采用原生全模態(tài)統(tǒng)一建模技術(shù),具備跨文本、圖像、音頻、視頻等多種模態(tài)的理解與生成能力。目前,個(gè)人用戶可通過文心APP、文心一言官網(wǎng)體驗(yàn),企業(yè)與開發(fā)者可通過百度千帆平臺(tái)調(diào)用。
根據(jù)百度公布的信息,在涵蓋語(yǔ)言與多模態(tài)理解的40余項(xiàng)權(quán)威基準(zhǔn)綜合評(píng)測(cè)中,文心5.0正式版的能力已超越Gemini-2.5-Pro、GPT-5-High等國(guó)際先進(jìn)模型,穩(wěn)居全球第一梯隊(duì);其圖像與視頻生成能力亦達(dá)到垂直領(lǐng)域?qū)>P退,整體處于全球領(lǐng)先地位。此前,百度文心助手月活躍用戶已突破2億。

技術(shù)突破:原生全模態(tài)與高效架構(gòu)
百度集團(tuán)副總裁、深度學(xué)習(xí)技術(shù)及應(yīng)用國(guó)家工程研究中心副主任吳甜在發(fā)布會(huì)上強(qiáng)調(diào),文心5.0采用了與業(yè)界常見的“后期融合”不同的技術(shù)路線。其通過統(tǒng)一的自回歸架構(gòu),對(duì)文本、圖像、視頻、音頻等多源數(shù)據(jù)進(jìn)行原生全模態(tài)聯(lián)合訓(xùn)練,實(shí)現(xiàn)了多模態(tài)特征在統(tǒng)一框架下的深度融合與協(xié)同優(yōu)化,從而支持原生的統(tǒng)一理解與生成。
在模型結(jié)構(gòu)上,文心5.0采用了超大規(guī);旌蠈<遥∕oE)結(jié)構(gòu),并具備超稀疏激活特性,激活參數(shù)比例低于3%。這一設(shè)計(jì)在保持模型強(qiáng)大能力的同時(shí),顯著提升了推理效率。此外,模型通過基于大規(guī)模工具環(huán)境合成長(zhǎng)程任務(wù)軌跡數(shù)據(jù),并采用端到端多輪強(qiáng)化學(xué)習(xí)訓(xùn)練,進(jìn)一步提升了其智能體與工具調(diào)用能力。
應(yīng)用落地:讓模型在真實(shí)場(chǎng)景中創(chuàng)造價(jià)值
百度應(yīng)用模型研發(fā)部負(fù)責(zé)人賈磊指出:“應(yīng)用模型的價(jià)值不在模型里,而在應(yīng)用里!卑俣然谖男幕A(chǔ)大模型,構(gòu)建了面向產(chǎn)品級(jí)快速落地的矩陣模型(如文心Lite模型、視頻大模型、語(yǔ)音大模型)以及面向垂直場(chǎng)景的專精模型(如搜索、電商、數(shù)字人及行業(yè)大模型)。
賈磊重點(diǎn)介紹了三項(xiàng)前沿應(yīng)用技術(shù)突破:
基于聲音Token的端到端合成大模型:通過創(chuàng)新的聲音表征與建模方式,實(shí)現(xiàn)高質(zhì)量語(yǔ)音合成。
5分鐘超越真人的直播技術(shù):僅需目標(biāo)音色的少量樣本,即可合成出富有情緒、節(jié)奏與感染力的帶貨語(yǔ)音,效果超越真人。
實(shí)時(shí)交互數(shù)字人技術(shù):采用文本、語(yǔ)音、視頻三態(tài)Token聯(lián)動(dòng)架構(gòu),實(shí)現(xiàn)流式控制與低延遲、高表現(xiàn)力的實(shí)時(shí)交互。此前引發(fā)關(guān)注的“百度羅永浩數(shù)字人”即基于此技術(shù)開發(fā)。
平臺(tái)支撐:千帆助力產(chǎn)業(yè)高效集成
為加速大模型在產(chǎn)業(yè)中的落地,百度千帆平臺(tái)提供了全面支持。據(jù)平臺(tái)產(chǎn)品負(fù)責(zé)人張婷介紹,千帆不僅提供文心5.0及超過150種全場(chǎng)景先進(jìn)模型服務(wù),還集成了包括百度AI搜索在內(nèi)的眾多工具與完整Agent開發(fā)工具鏈,結(jié)合企業(yè)級(jí)數(shù)據(jù)管理與服務(wù),為企業(yè)打造全周期、多場(chǎng)景的穩(wěn)定運(yùn)行環(huán)境,大幅降低Agent應(yīng)用創(chuàng)新門檻。目前,千帆平臺(tái)上已累計(jì)開發(fā)超過130萬個(gè)Agents,其特色工具“百度AI搜索”日均調(diào)用量已突破千萬次。
全棧布局:深化“芯云模體”生態(tài)閉環(huán)
此次文心5.0的發(fā)布,標(biāo)志著百度在推進(jìn)AI技術(shù)深入真實(shí)行業(yè)與復(fù)雜場(chǎng)景方面邁出關(guān)鍵一步。作為國(guó)內(nèi)大模型領(lǐng)域的先行者,百度已形成從“芯”(自研AI芯片)到“云”(百度智能云),再到“!保ù竽P停┖汀绑w”(智能體應(yīng)用)的全棧自研技術(shù)生態(tài)閉環(huán),持續(xù)探索并輸出賦能千行百業(yè)的AI解決方案。
在全球AI行業(yè)從技術(shù)快速發(fā)展轉(zhuǎn)向深度應(yīng)用的關(guān)鍵階段,百度憑借文心大模型5.0在原生全模態(tài)與超大規(guī)模參數(shù)上的突破,正致力于推動(dòng)AI超越以對(duì)話為主的形式,更深入地融入現(xiàn)實(shí)世界,創(chuàng)造實(shí)際價(jià)值。(來源:百度)
(注:此文屬于央廣網(wǎng)登載的商業(yè)信息,文章內(nèi)容不代表本網(wǎng)觀點(diǎn),僅供參考。)
長(zhǎng)按二維碼關(guān)注精彩內(nèi)容





