首先是物理手感。一般的大模型写重力感应,往往就是简单的把传感器数值赋给位置,导致操作起来生硬得很,要不就是移动的非常慢,要不就是移动不顺畅,要不手抖一下飞机就乱跳。
此外,为了考察模型“从零到一”构建完整、可运行应用程序的全栈能力,MiniMax构建并开源了全新基准测试VIBE。MiniMax-M2.1在VIBE综合榜单中拿到 88.6的平均分 ,得分接近Claude Opus 4.5, 并在几乎所有子集上都显著优于Claude Sonnet 4.5。