📰 本频道不定期推送科技数码类新资讯,欢迎关注!
©️ 发布的内容不代表本频道立场,和你意见不一样的话欢迎在评论区留言表达,但请注意言辞,面斥不雅。
🔗 博客: https://yummy.best
💬 群组: @GodlyGroup
📬 投稿: @GodlyNewsBot
🪧 广告合作: @yummybest_bot.
©️ 发布的内容不代表本频道立场,和你意见不一样的话欢迎在评论区留言表达,但请注意言辞,面斥不雅。
🔗 博客: https://yummy.best
💬 群组: @GodlyGroup
📬 投稿: @GodlyNewsBot
🪧 广告合作: @yummybest_bot.
小米正式宣布推出并开源旗下首个专为推理任务打造的大语言模型—— Xiaomi MiMo。
该模型由小米新成立的「大模型Core 团队」研发,聚焦数学与代码领域的逻辑推理能力,强调从预训练到后训练的完整推理能力提升。
根据官方介绍,MiMo 采用仅7B(70 亿)参数规模,在两大公开测评数据集中表现亮眼,包括:
- AIME 24/25(数学推理)
- LiveCodeBench v5(代码生成与推理)
在这些测评中,MiMo-7B 不仅超越了OpenAI 的闭源推理模型o1-mini,也击败了阿里巴巴规模更大的开源推理模型QwQ-32B-Preview,展现出小参数模型在推理能力上的极高潜力。
MiMo-7B 与近来受到瞩目的DeepSeek-R1-Distill-7B及Qwen2.5-32B进行同等条件下的比较。结果显示,MiMo 在数学与代码任务的强化学习潜力明显领先对手,即使在仅7B 的参数下仍具备高效训练价值。
小米表示,MiMo 全系列模型已全面开源,期望能促进AI 推理领域的技术共创与应用推进。这也是小米首次对外公开自研大模型,象征其在生成式AI 战略上迈出关键一步。
目前,小米尚未透露MiMo 是否将整合至旗下产品(如HyperOS、智慧手机或智慧家居装置)中,但业界推测,MiMo 将成为其AI 策略的重要基础模型平台。
via ZiRCON