文心輕量化思考模型登頂HuggingFace全球熱度榜榜首
2025-09-11 18:07   
來(lái)源: 云財(cái)經(jīng)   
影響力評(píng)估指數(shù):24.2  
相關(guān)股票:
云財(cái)經(jīng)訊,據(jù)HuggingFace官網(wǎng)數(shù)據(jù),截至2025年9月11日,百度最新開(kāi)源(300109)的文心思考模型ERNIE-4.5-21B-A3B-Thinking,在HuggingFace文本模型趨勢(shì)榜上排名第一,模型總榜排名第三。ERNIE-4.5-21B-A3B-Thinking 作為一款 21B 總參數(shù)量,激活僅 3B 的輕量級(jí)模型,在各項(xiàng)測(cè)試中的表現(xiàn)緊追業(yè)界頂級(jí)大尺寸模型,以輕量級(jí)規(guī)模實(shí)現(xiàn)了接近 SOTA 的智能表現(xiàn)。ERNIE-4.5-21B-A3B-Thinking 采用了混合專(zhuān)家(MoE) 架構(gòu),總參數(shù)規(guī)模達(dá)21B,每個(gè) token 激活 3B參數(shù),通過(guò)指令微調(diào)及強(qiáng)化學(xué)習(xí)訓(xùn)練。ERNIE-4.5-21B-A3B-Thinking 是在 ERNIE-4.5-21B-A3B 基礎(chǔ)上訓(xùn)練的深度思考模型,支持 128K 的上下文窗口,適用于需要長(zhǎng)上下文的復(fù)雜推理任務(wù)。該模型不僅在邏輯推理、數(shù)學(xué)、科學(xué),代碼與文本生成等需要人類(lèi)專(zhuān)家的任務(wù)上實(shí)現(xiàn)了顯著提升,還具備高效的工具調(diào)用能力,能夠支持復(fù)雜任務(wù)的自動(dòng)化處理。
| 新聞標(biāo)題 | 時(shí)間 | 消息來(lái)源 | 新聞熱度 |
|---|---|---|---|
| 經(jīng)濟(jì)日?qǐng)?bào):考公放寬限齡是大勢(shì)所趨 | 今天 07:49 | 云財(cái)經(jīng) |
|
| 印尼亞齊特區(qū)發(fā)生5.0級(jí)地震 | 10-25 14:08 | 云財(cái)經(jīng) |
|
| 駐港國(guó)家安全公署:絕不允許內(nèi)外任何勢(shì)力干擾破壞香港立法會(huì)選舉秩序 | 10-24 12:56 | 云財(cái)經(jīng) |
|
| 長(zhǎng)虹華意:第三季度凈利潤(rùn)為1.23億元,下降17.77% | 10-22 16:06 | 云財(cái)經(jīng) |
|
| RoboSense速騰聚創(chuàng)發(fā)布Active Camera新品AC2 | 10-21 20:31 | 云財(cái)經(jīng) |
|
| 河南港航集團(tuán)有限公司正式揭牌 | 10-21 13:58 | 云財(cái)經(jīng) |
|