昆仑万维重磅发布 Skywork-R1V 3.0：跨模态推理能力直逼人类专家！

近日，昆仑万维正式发布了其全新开源模型 Skywork-R1V3.0，宣称在多模态推理方面达到了前所未有的高度，甚至与人类初级专家的水平不相上下。该模型在训练过程中采用了强化学习策略，使得其在复杂逻辑建模与跨学科知识泛化方面取得了显著进展。

Skywork-R1V3.0是基于上一代 Skywork-R1V2.0进行 “冷启动”，利用高质量的蒸馏数据和拒绝采样技术，成功构建了一个强大的多模态推理训练集。这一模型的设计不仅仅局限于文本，还涵盖了图像处理，使得其在图像与文本之间的推理能力得到了显著提升。

据介绍，Skywork-R1V3.0的训练依赖于仅约1.2万条监督微调样本和1.3万条强化学习样本，展现了 “小数据激发大能力” 的独特优势。在权威的综合性多模态评测 MMMU 中，Skywork-R1V3.0以76.0分的成绩领先，超越了 Claude-3.7-Sonnet（75.0分）和 GPT-4.5(74.4分)等闭源模型，证明了其卓越的跨模态理解能力。

在具体的应用场景中，Skywork-R1V3.0在物理、逻辑和数学推理等多个领域均表现出色。例如，在物理推理的评测中，该模型分别取得了52.8分和31.5分的最佳开源成绩，显示出其对复杂物理问题的理解能力。此外，在逻辑推理测试中，Skywork-R1V3.0也取得了59.7分的佳绩。

该模型在数学推理方面同样不容小觑，在 MathVista、MathVerse 和 MathVision 等评测中分别获得77.1分、59.6分和52.6分的优异成绩，明显优于其他开源模型。这些出色的表现使得 Skywork-R1V3.0在当前的开源多模态推理领域中成为了一个强有力的竞争者。

Skywork-R1V3.0的发布标志着多模态推理技术的一个新高峰，它的强大性能和开源特性将极大促进 AI 技术的进一步发展。