Mistral 3发布,14B多模态小模型表现优异
Mistral AI发布第三代模型Mistral 3,含14B/8B/3B小模型及675B参数的Mistral Large 3,均采用Apache 2.0许可。技术亮点包括14B模型GPQA测试准确率85%、Large 3为MoE架构且LMArena开源非推理类排名第二、原生多模态支持(图像+40+语言)、256K上下文。部署支持Ollama、Unsloth、vLLM,14B模型需24GB内存,8B可在16GB消费级GPU运行,RTX 3090上14B推理达42token/s,官方给出指令/推理版本推荐参数。
发布日期:
2025-12-04 08:01:45