重磅發(fā)布!剛剛,全線大漲!
來(lái)源:券商中國(guó) 作者:周樂(lè) 2025-04-30 15:23
Aa 大號(hào)字

一則消息突然引爆。

今日,小米系集體爆發(fā),小米集團(tuán)一度大漲超5%,金山云一度大漲超18%。消息面上,小米大模型微信公眾號(hào)稱,小米開(kāi)源首個(gè)為推理(Reasoning)而生的大模型“Xiaomi MiMo”,聯(lián)動(dòng)預(yù)訓(xùn)練到后訓(xùn)練,全面提升推理能力。

當(dāng)前,AI大模型競(jìng)爭(zhēng)再度進(jìn)入白熱化。4月29日,阿里巴巴通義千問(wèn)發(fā)布了新版Qwen3系列模型。同一天,世界首富馬斯克也宣布,下周Grok 3.5早期測(cè)試版將向SuperGrok訂閱者發(fā)布。

券商機(jī)構(gòu)分析認(rèn)為,國(guó)內(nèi)外大模型能力差距縮小,國(guó)產(chǎn)算力芯片持續(xù)進(jìn)化,國(guó)內(nèi)頭部互聯(lián)網(wǎng)廠商加大Capex投入,為國(guó)內(nèi)AI突圍之路奠定了基石。伴隨國(guó)內(nèi)外巨頭大模型持續(xù)迭代,C端或有望迎來(lái)殺手級(jí)應(yīng)用。

全線大漲

4月30日,小米系全線拉升,小米集團(tuán)盤中一度大漲超5%,金山云一度大漲超18%,金山軟件最高漲超6%。

與此同時(shí),港股云計(jì)算板塊持續(xù)拉升,截至午間收盤,金蝶國(guó)際漲4.7%,中國(guó)軟件國(guó)際漲2.72%,阿里巴巴-W漲1.48%?

據(jù)“小米大模型”公眾號(hào)消息,今日,小米開(kāi)源首個(gè)為推理(Reasoning)而生的大模型“Xiaomi MiMo”,聯(lián)動(dòng)預(yù)訓(xùn)練到后訓(xùn)練,全面提升推理能力。

據(jù)介紹,在數(shù)學(xué)推理(AIME 24-25)和代碼競(jìng)賽(LiveCodeBench v5)公開(kāi)測(cè)評(píng)集上,MiMo以7B的參數(shù)規(guī)模,超越了OpenAI的閉源推理模型o1-mini和阿里Qwen更大規(guī)模的開(kāi)源推理模型QwQ-32B-Preview。

官方稱,在相同RL訓(xùn)練數(shù)據(jù)情況下,MiMo-7B的數(shù)學(xué)&代碼領(lǐng)域的強(qiáng)化學(xué)習(xí)潛力顯著領(lǐng)先。iMo-7B全系列模型均已開(kāi)源。

小米技術(shù)團(tuán)隊(duì)表示,MiMo的核心突破在于預(yù)訓(xùn)練與后訓(xùn)練階段的協(xié)同優(yōu)化。在預(yù)訓(xùn)練階段,模型通過(guò)挖掘高質(zhì)量推理語(yǔ)料并合成約2000億tokens專項(xiàng)數(shù)據(jù),采用三階段漸進(jìn)訓(xùn)練策略,累計(jì)訓(xùn)練量達(dá)25萬(wàn)億tokens。

后訓(xùn)練階段則引入創(chuàng)新強(qiáng)化學(xué)習(xí)技術(shù),包括自研的“Test Difficulty Driven Reward”算法和“Easy Data Re-Sampling”策略,有效提升模型在復(fù)雜任務(wù)中的穩(wěn)定性。技術(shù)團(tuán)隊(duì)還開(kāi)發(fā)了“Seamless Rollout”系統(tǒng),使訓(xùn)練效率提升2.29倍,驗(yàn)證速度加快1.96倍。

值得注意的是,小米官方表示,MiMo-7B在相同強(qiáng)化學(xué)習(xí)訓(xùn)練數(shù)據(jù)下,數(shù)學(xué)與代碼領(lǐng)域的表現(xiàn)顯著優(yōu)于當(dāng)前業(yè)界廣泛使用的DeepSeek-R1-Distill-7B和Qwen2.5-32B模型。

目前,小米已在HuggingFace平臺(tái)開(kāi)源MiMo-7B全系列4個(gè)模型,并發(fā)布詳細(xì)技術(shù)報(bào)告。

值得一提的是,就在小米宣布“Xiaomi Mimo”開(kāi)源前,阿里巴巴通義千問(wèn)于4月29日凌晨發(fā)布了新版Qwen3系列模型,包括2個(gè)MoE模型和6個(gè)dense模型。

通義千問(wèn)表示,作為Qwen系列全新一代的混合推理模型,Qwen 3在GPQA、AIME24/25、LiveCodeBench等多個(gè)權(quán)威評(píng)測(cè)中表現(xiàn)出極具競(jìng)爭(zhēng)力的結(jié)果。在相同計(jì)算資源下,Qwen 3模型以更小的規(guī)模實(shí)現(xiàn)了對(duì)更大體量上一代模型的超越,真正做到了“小而強(qiáng)大”。

Qwen 3融合了推理與非推理能力,在邏輯分析和創(chuàng)意生成等任務(wù)中表現(xiàn)卓越。預(yù)訓(xùn)練數(shù)據(jù)量達(dá)到約36萬(wàn)億 tokens,并通過(guò)多輪大規(guī)模強(qiáng)化學(xué)習(xí)與精細(xì)優(yōu)化,在推理、工具調(diào)用、指令遵循及多語(yǔ)言能力等方面顯著提升。

“AI大模型大戰(zhàn)”再起

值得注意的是,AI大模型競(jìng)爭(zhēng)再度進(jìn)入白熱化。

4月29日,馬斯克在社交平臺(tái)上宣布,下周,Grok 3.5早期測(cè)試版將向SuperGrok訂閱者發(fā)布,它是第一個(gè)能夠準(zhǔn)確回答有關(guān)火箭發(fā)動(dòng)機(jī)或電化學(xué)技術(shù)問(wèn)題的人工智能。馬斯克稱,Grok是從第一原理推理并得出互聯(lián)網(wǎng)上根本不存在的答案。

2025年以來(lái),全球AI大模型的競(jìng)爭(zhēng)愈發(fā)激烈,據(jù)不完全統(tǒng)計(jì),在過(guò)去119天內(nèi),中美十家主要大模型公司就發(fā)布或更新了14款基礎(chǔ)大模型。

國(guó)際市場(chǎng)調(diào)研機(jī)構(gòu)Artificial Analysis發(fā)布的報(bào)告顯示,美國(guó)大模型雖然目前還領(lǐng)先,但中國(guó)的差距在不斷縮小。

西部證券指出,AI大模型能力提升和使用成本下降是主旋律,多模態(tài)或逐步成為未來(lái)基礎(chǔ)模型的標(biāo)配,進(jìn)一步拉動(dòng)算力需求。國(guó)內(nèi)外大模型能力差距縮小,國(guó)產(chǎn)算力芯片持續(xù)進(jìn)化,國(guó)內(nèi)頭部互聯(lián)網(wǎng)廠商加大Capex投入,為國(guó)內(nèi)AI突圍之路奠定了基石。

開(kāi)源證券認(rèn)為,AI Agent為以大語(yǔ)言模型(LLM)為驅(qū)動(dòng),具有自主理解、感知、規(guī)劃、記憶和使用工具的能力,能自動(dòng)執(zhí)行復(fù)雜任務(wù)的系統(tǒng)。不同于傳統(tǒng)人工智能,AI Agent具備通過(guò)獨(dú)立思考、調(diào)用工具逐步完成給定目標(biāo)的能力??春肁I Agent應(yīng)用將在2025年多點(diǎn)開(kāi)花,其中AI Agent有望在B端率先商業(yè)化,電商、營(yíng)銷、CRM、金融、法律等場(chǎng)景加速落地。伴隨國(guó)內(nèi)外巨頭大模型持續(xù)迭代,C端或有望迎來(lái)殺手級(jí)應(yīng)用。

天風(fēng)證券表示,通義千問(wèn)體系在模型能力、硬件能力及生態(tài)建設(shè)上保持領(lǐng)先,已實(shí)現(xiàn)全模態(tài)覆蓋,成為全球最大模型開(kāi)源生態(tài)。其自主算力體系較強(qiáng),覆蓋通用計(jì)算與智算需求,在自主可控行業(yè)具有優(yōu)勢(shì)。AI Agent市場(chǎng)規(guī)模有望超萬(wàn)億,通義千問(wèn)憑借在B端資源稟賦及深厚技術(shù)積淀,已發(fā)布多行業(yè)垂直生態(tài)體系,有望成為B端Agent鏈主,相關(guān)生態(tài)體系公司或?qū)⑹芤妗?/p>

責(zé)任編輯: 戎艾茵
e公司聲明:文章提及個(gè)股及內(nèi)容僅供參考,不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
更多相關(guān)文章
熱門解讀 更多
視頻推薦 更多
熱門股票 更多
股票名稱 最新價(jià)
漲跌幅