著名数学家陶哲轩表示,尽管人工智能在许多领域展现出惊人能力,但在数学领域,它仍然缺乏一种关键的“嗅觉”——即辨别错误方向和错误证明的人类直觉。他认为,这种直觉是人工智能目前无法复制的,也因此,人类在数学判断中依然扮演着不可替代的角色。

陶哲轩指出,生成式人工智能在生成数学证明时,即使存在缺陷,表面上看起来也往往“完美无缺”。然而,这些错误通常“非常微妙”,而且在发现时会显得“非常愚蠢”,是人类在实际操作中不会犯的低级错误。他将这种人类独有的能力称为“隐喻性的数学气味”,它能在某件事情不对劲时立刻发出警告。陶哲轩强调:“目前还不清楚如何让人工智能最终复制这种能力。”

机器人比赛 答题 数学

他进一步解释说,当前人工智能,特别是生成模型,在采用错误方法时往往会陷入困境。他认为,人工智能目前真正难以解决的问题在于“它何时走错了方向”。这与将神经网络与符号推理相结合的混合人工智能系统有所不同。

尽管如此,陶哲轩也承认,像 AlphaZero 这样的系统在围棋和国际象棋等领域已经取得了显著进步。他认为,这些系统在某种意义上已经发展出了对棋局的“嗅觉”,能够判断某个局面是否对一方有利。虽然它们无法推断出具体原因,但这种“嗅觉”足以让它们制定策略。陶哲轩设想,如果人工智能能够获得这种感知某些证明策略可行性的能力,它就能在分解问题时给出建设性建议,例如:“嗯,这看起来不错;这两个任务看起来比你的主要任务简单,而且它们仍然很有可能是正确的。”

据悉,AlphaZero 在游戏和训练过程中通过蒙特卡洛树搜索(MCTS)作为“符号框架”来选择走法,将可能的游戏路径探索为符号状态。但其本质上仍是由神经网络驱动的深度强化学习系统,通过自我对弈并从数百万个参数中学习。

一些研究人员认为,将大型语言模型与符号推理的优势相结合,有望推动人工智能在数学领域取得重大突破,因为纯粹的 LLM(即使具有一定推理能力)也可能会在复杂的数学问题上走进死胡同。陶哲轩此前曾将 OpenAI 的推理模型 o1描述为“平庸,但并非完全无能”,认为它就像一个能够处理日常任务的研究助理,但仍然缺乏创造力和灵活性。他还参与了 FrontierMath 基准的开发,该基准为人工智能系统设定了极具挑战性的数学问题,以期推动该领域的发展。