123,123

重磅發(fā)布！剛剛，全線大漲！

來(lái)源：券商中國(guó) 作者：周樂(lè) 2025-04-30 15:23

Aa 大號(hào)字

一則消息突然引爆。

今日，小米系集體爆發(fā)，小米集團(tuán)一度大漲超5%，金山云一度大漲超18%。消息面上，小米大模型微信公眾號(hào)稱，小米開(kāi)源首個(gè)為推理（Reasoning）而生的大模型“Xiaomi MiMo”，聯(lián)動(dòng)預(yù)訓(xùn)練到后訓(xùn)練，全面提升推理能力。

當(dāng)前，AI大模型競(jìng)爭(zhēng)再度進(jìn)入白熱化。4月29日，阿里巴巴通義千問(wèn)發(fā)布了新版Qwen3系列模型。同一天，世界首富馬斯克也宣布，下周Grok 3.5早期測(cè)試版將向SuperGrok訂閱者發(fā)布。

券商機(jī)構(gòu)分析認(rèn)為，國(guó)內(nèi)外大模型能力差距縮小，國(guó)產(chǎn)算力芯片持續(xù)進(jìn)化，國(guó)內(nèi)頭部互聯(lián)網(wǎng)廠商加大Capex投入，為國(guó)內(nèi)AI突圍之路奠定了基石。伴隨國(guó)內(nèi)外巨頭大模型持續(xù)迭代，C端或有望迎來(lái)殺手級(jí)應(yīng)用。

全線大漲

4月30日，小米系全線拉升，小米集團(tuán)盤中一度大漲超5%，金山云一度大漲超18%，金山軟件最高漲超6%。

與此同時(shí)，港股云計(jì)算板塊持續(xù)拉升，截至午間收盤，金蝶國(guó)際漲4.7%，中國(guó)軟件國(guó)際漲2.72%，阿里巴巴-W漲1.48%?

據(jù)“小米大模型”公眾號(hào)消息，今日，小米開(kāi)源首個(gè)為推理（Reasoning）而生的大模型“Xiaomi MiMo”，聯(lián)動(dòng)預(yù)訓(xùn)練到后訓(xùn)練，全面提升推理能力。

據(jù)介紹，在數(shù)學(xué)推理（AIME 24-25）和代碼競(jìng)賽（LiveCodeBench v5）公開(kāi)測(cè)評(píng)集上，MiMo以7B的參數(shù)規(guī)模，超越了OpenAI的閉源推理模型o1-mini和阿里Qwen更大規(guī)模的開(kāi)源推理模型QwQ-32B-Preview。

官方稱，在相同RL訓(xùn)練數(shù)據(jù)情況下，MiMo-7B的數(shù)學(xué)&代碼領(lǐng)域的強(qiáng)化學(xué)習(xí)潛力顯著領(lǐng)先。iMo-7B全系列模型均已開(kāi)源。

小米技術(shù)團(tuán)隊(duì)表示，MiMo的核心突破在于預(yù)訓(xùn)練與后訓(xùn)練階段的協(xié)同優(yōu)化。在預(yù)訓(xùn)練階段，模型通過(guò)挖掘高質(zhì)量推理語(yǔ)料并合成約2000億tokens專項(xiàng)數(shù)據(jù)，采用三階段漸進(jìn)訓(xùn)練策略，累計(jì)訓(xùn)練量達(dá)25萬(wàn)億tokens。

后訓(xùn)練階段則引入創(chuàng)新強(qiáng)化學(xué)習(xí)技術(shù)，包括自研的“Test Difficulty Driven Reward”算法和“Easy Data Re-Sampling”策略，有效提升模型在復(fù)雜任務(wù)中的穩(wěn)定性。技術(shù)團(tuán)隊(duì)還開(kāi)發(fā)了“Seamless Rollout”系統(tǒng)，使訓(xùn)練效率提升2.29倍，驗(yàn)證速度加快1.96倍。

值得注意的是，小米官方表示，MiMo-7B在相同強(qiáng)化學(xué)習(xí)訓(xùn)練數(shù)據(jù)下，數(shù)學(xué)與代碼領(lǐng)域的表現(xiàn)顯著優(yōu)于當(dāng)前業(yè)界廣泛使用的DeepSeek-R1-Distill-7B和Qwen2.5-32B模型。

目前，小米已在HuggingFace平臺(tái)開(kāi)源MiMo-7B全系列4個(gè)模型，并發(fā)布詳細(xì)技術(shù)報(bào)告。

值得一提的是，就在小米宣布“Xiaomi Mimo”開(kāi)源前，阿里巴巴通義千問(wèn)于4月29日凌晨發(fā)布了新版Qwen3系列模型，包括2個(gè)MoE模型和6個(gè)dense模型。

通義千問(wèn)表示，作為Qwen系列全新一代的混合推理模型，Qwen 3在GPQA、AIME24/25、LiveCodeBench等多個(gè)權(quán)威評(píng)測(cè)中表現(xiàn)出極具競(jìng)爭(zhēng)力的結(jié)果。在相同計(jì)算資源下，Qwen 3模型以更小的規(guī)模實(shí)現(xiàn)了對(duì)更大體量上一代模型的超越，真正做到了“小而強(qiáng)大”。

Qwen 3融合了推理與非推理能力，在邏輯分析和創(chuàng)意生成等任務(wù)中表現(xiàn)卓越。預(yù)訓(xùn)練數(shù)據(jù)量達(dá)到約36萬(wàn)億 tokens，并通過(guò)多輪大規(guī)模強(qiáng)化學(xué)習(xí)與精細(xì)優(yōu)化，在推理、工具調(diào)用、指令遵循及多語(yǔ)言能力等方面顯著提升。

“AI大模型大戰(zhàn)”再起

值得注意的是，AI大模型競(jìng)爭(zhēng)再度進(jìn)入白熱化。

4月29日，馬斯克在社交平臺(tái)上宣布，下周，Grok 3.5早期測(cè)試版將向SuperGrok訂閱者發(fā)布，它是第一個(gè)能夠準(zhǔn)確回答有關(guān)火箭發(fā)動(dòng)機(jī)或電化學(xué)技術(shù)問(wèn)題的人工智能。馬斯克稱，Grok是從第一原理推理并得出互聯(lián)網(wǎng)上根本不存在的答案。

2025年以來(lái)，全球AI大模型的競(jìng)爭(zhēng)愈發(fā)激烈，據(jù)不完全統(tǒng)計(jì)，在過(guò)去119天內(nèi)，中美十家主要大模型公司就發(fā)布或更新了14款基礎(chǔ)大模型。

國(guó)際市場(chǎng)調(diào)研機(jī)構(gòu)Artificial Analysis發(fā)布的報(bào)告顯示，美國(guó)大模型雖然目前還領(lǐng)先，但中國(guó)的差距在不斷縮小。

西部證券指出，AI大模型能力提升和使用成本下降是主旋律，多模態(tài)或逐步成為未來(lái)基礎(chǔ)模型的標(biāo)配，進(jìn)一步拉動(dòng)算力需求。國(guó)內(nèi)外大模型能力差距縮小，國(guó)產(chǎn)算力芯片持續(xù)進(jìn)化，國(guó)內(nèi)頭部互聯(lián)網(wǎng)廠商加大Capex投入，為國(guó)內(nèi)AI突圍之路奠定了基石。

開(kāi)源證券認(rèn)為，AI Agent為以大語(yǔ)言模型（LLM）為驅(qū)動(dòng)，具有自主理解、感知、規(guī)劃、記憶和使用工具的能力，能自動(dòng)執(zhí)行復(fù)雜任務(wù)的系統(tǒng)。不同于傳統(tǒng)人工智能，AI Agent具備通過(guò)獨(dú)立思考、調(diào)用工具逐步完成給定目標(biāo)的能力?？春肁I Agent應(yīng)用將在2025年多點(diǎn)開(kāi)花，其中AI Agent有望在B端率先商業(yè)化，電商、營(yíng)銷、CRM、金融、法律等場(chǎng)景加速落地。伴隨國(guó)內(nèi)外巨頭大模型持續(xù)迭代，C端或有望迎來(lái)殺手級(jí)應(yīng)用。

天風(fēng)證券表示，通義千問(wèn)體系在模型能力、硬件能力及生態(tài)建設(shè)上保持領(lǐng)先，已實(shí)現(xiàn)全模態(tài)覆蓋，成為全球最大模型開(kāi)源生態(tài)。其自主算力體系較強(qiáng)，覆蓋通用計(jì)算與智算需求，在自主可控行業(yè)具有優(yōu)勢(shì)。AI Agent市場(chǎng)規(guī)模有望超萬(wàn)億，通義千問(wèn)憑借在B端資源稟賦及深厚技術(shù)積淀，已發(fā)布多行業(yè)垂直生態(tài)體系，有望成為B端Agent鏈主，相關(guān)生態(tài)體系公司或?qū)⑹芤妗?/p>

責(zé)任編輯：戎艾茵