开源新王Mistral Small4来了,三大能力合一,支持中文、25万上下文

2026-03-17

关注CAIE,国内头部AI人才认证、培训体系,助你在职场升职加薪。
CAIE注册人工智能工程师
CAIE注册人工智能工程师
公众号作者
CAIE,全称 Certifed Artifcial Intelligence Engineer(人工智能工程师),简称 CAIE(赛一) ,是人工智能领域的技能等级认证。旨在评估和培养具备人工智能理论基础与实战能力的职业人士。

法国著名开源平台Mistral AI刚刚开源了最新模型Mistral Small 4-119B-2603

这个模型最大亮点是把指令对话、深度推理、代码开发三大能力揉在了一起,相当于把三款优质模型的优势整合到一个模型里,用户不用来回切换,一个就能搞定多种任务。

同时支持中文、英文、韩文等10种主流语言,上下文窗口达到了25万,主打能耗低性能强。

开源地址:https://huggingface.co/collections/mistralai/mistral-small-4

这款模型的底子很扎实,底层用的是Mistral 3框架,主打FP8浮点精度,权重存储用的是安全张量格式,稳定性和兼容性都很靠谱。

在本地部署时,咱们最怕大模型跑不动、响应慢,这款模型刚好解决了这个痛点,靠的是精巧的混合专家架构。

Mistral Small 4内置了128个专家网络,每次推理只激活4个,总参数虽然有1190亿,但实际单次调用的激活参数只有65亿,既保住了算力,又不浪费资源。

实际表现也很亮眼,延迟优化模式下,端到端生成速度比上一代快了四成,要是追求吞吐量,每秒处理的请求量更是前代的三倍,对于需要批量处理任务的场景来说,效率直接拉满。

除此之外,它还支持256k的超长上下文,处理长文档、多轮对话都不会断片。

多模态能力也没落下,文本和图像都能识别,输出结果都是文本形式,分析图片内容、提取图文信息都很顺手。

还自带强悍的智能体能力,原生支持函数调用和JSON格式输出,做自动化工具、开发助手都很合适,不管是写代码、改bug,还是梳理代码库,对开发人员来说都很省心。

根据Mistral AI公开测试数据显示,Mistral Small 4在主流测试平台中相当能打。

开启深度推理模式后,它在AA LCRLiveCodeBenchAIME25这三大核心测试集上,成绩直接持平甚至超越GPT-OSS 120B

最绝的是它的输出效率,AA LCR测试里仅用1600个字符就斩获0.72的高分,而同类型竞品往往需要生成58006100字符,足足是3.54倍的长度才能追平分数

LiveCodeBench代码测试中,它不仅性能超越GPT-OSS 120B,输出内容长度还减少了20%,短篇幅就能给出精准结果,既降低了推理延迟,又能省下不少算力成本。

除此之外,核心实测参数也很接地气,256k的超长上下文,处理长文档、多轮对话压根不会丢关键信息,推理采用FP8浮点精度,还支持英伟达NVFP4 4位量化,普通显卡也能低成本部署。

再加上轻量极速、深度推理双模式可灵活切换,日常闲聊用轻量模式够快,解难题、做推理切深度模式够稳。

全程使用稳定不卡顿,不管是简单指令执行还是复杂的函数调用、视觉推理,表现都很在线。

很多朋友觉得大模型部署很难,这款模型其实很友好,推荐用vLLM框架部署,这也是目前最稳定、效率最高的方式,就算是新手,跟着步骤操作也能成功。

除了vLLM,它还适配Transformers等框架,虽然现阶段Transformers暂不支持FP8精度,但可以通过BF16量化实现正常运行,后续官方更新后会更完善。

最省事的方式是用定制Docker镜像,直接拉取镜像运行即可,省去了繁琐的环境配置。

想手动安装的话,克隆指定代码仓库,一步步安装依赖、验证版本,就能完成环境搭建。

想系统掌握AI核心技能、获取行业认可资质?

CAIE注册人工智能工程师认证

助你拓宽职业赛道,成为AI领域持证实力派

微信小程序
CAIE 认证
CAIE 认证
CAIE认证
以上内容来自微信小程序

企业、高校及渠道合作

请联系微信:FYLlaoshi

图片
点击下方
阅读原文
即刻跳转至CAIE官网,了解更多AI相关信息

完 谢谢观看

确定要退出登录吗?
确定 取消
推广有奖