近日,昆仑万维正式发布了其全新开源模型 Skywork-R1V3.0,宣称在多模态推理方面达到了前所未有的高度,甚至与人类初级专家的水平不相上下。该模型在训练过程中采用了强化学习策略,使得其在复杂逻辑建模与跨学科知识泛化方面取得了显著进展。

Skywork-R1V3.0是基于上一代 Skywork-R1V2.0进行 “冷启动”,利用高质量的蒸馏数据和拒绝采样技术,成功构建了一个强大的多模态推理训练集。这一模型的设计不仅仅局限于文本,还涵盖了图像处理,使得其在图像与文本之间的推理能力得到了显著提升。

image.png

据介绍,Skywork-R1V3.0的训练依赖于仅约1.2万条监督微调样本和1.3万条强化学习样本,展现了 “小数据激发大能力” 的独特优势。在权威的综合性多模态评测 MMMU 中,Skywork-R1V3.0以76.0分的成绩领先,超越了 Claude-3.7-Sonnet(75.0分)和 GPT-4.5(74.4分)等闭源模型,证明了其卓越的跨模态理解能力。

在具体的应用场景中,Skywork-R1V3.0在物理、逻辑和数学推理等多个领域均表现出色。例如,在物理推理的评测中,该模型分别取得了52.8分和31.5分的最佳开源成绩,显示出其对复杂物理问题的理解能力。此外,在逻辑推理测试中,Skywork-R1V3.0也取得了59.7分的佳绩。

image.png

该模型在数学推理方面同样不容小觑,在 MathVista、MathVerse 和 MathVision 等评测中分别获得77.1分、59.6分和52.6分的优异成绩,明显优于其他开源模型。这些出色的表现使得 Skywork-R1V3.0在当前的开源多模态推理领域中成为了一个强有力的竞争者。

image.png

Skywork-R1V3.0的发布标志着多模态推理技术的一个新高峰,它的强大性能和开源特性将极大促进 AI 技术的进一步发展。