北京1月26日传来消息,中国科研团队在通用人工智能逻辑推理这块有了重大突破。这事儿还得从北京通用人工智能研究院、北京大学心理与认知科学学院,还有北大多个学院机构一起搞的联合团队说起。他们自主研发了个叫“通矩模型”的系统,26号晚上就在国际顶级期刊《自然-机器智能》上发表了。大家都觉得这成果挺厉害,说它是第一个既会自己生成好题目、又能自动解难题的通用人工智能系统。 逻辑推理,尤其是几何证明,本来就挺难搞的。因为存在“组合爆炸”和“高质量数据匮乏”这两个难题,传统方法很难对付。为了破局,科研团队换了个思路,没去盲目追求大数据量,而是模仿人类数学家的思维过程。他们开发了一套精密的搜索架构,给AI建模让它像专家一样推理。 最关键的是引入了“规范化表示”技术。不管图形怎么旋转、缩放或者镜像,“通矩模型”都能看出内在的本质关系。比如不管三角形怎么放,系统都能精准识别几何关系。这种能力让原本复杂的搜索空间压缩了好几个数量级。 在解题的同时,团队还想让AI具备创造力。他们借鉴人类数学家的直觉和审美,搞了个价值模型来评估推理步骤是否简洁优美。当发现某个命题证明难度超过表面构造时,模型就能识别出好的题目。 论文第一作者、北京通用人工智能研究院研究员张驰说,“价值引导”机制让模型能从海量可能性中筛选出符合人类审美的问题。“这实现了从模仿解题到自主创造的转变。” 实验数据也证明了系统的厉害。单张消费级显卡就能在38分钟内解出从2000年到现在所有IMO的几何难题,速度和准确率都达到了顶尖水平。 北京大学心理与认知科学学院助理教授朱毅鑫强调,“通矩模型”探索出了一条“小数据、大任务”的新路子。不靠海量标注数据,靠内部逻辑自我强化驱动学习和创造。“这种通过模拟人类直觉、依靠内部逻辑自我强化的路径,正是通向通用人工智能的关键。” 这个成果的成功不仅展示了理论上的突破,还展示了未来应用的前景。它能帮我们做自动化数学证明、搞个性化教育、甚至用来找大的科学规律。“通矩模型”的研发是我国坚持搞基础研究的一个例子,它为未来的复杂领域创新提供了基础。“我们希望能助力教育资源普惠化,为培养青少年科学素养提供工具。” 张驰还说,“我们还会继续深耕通用智能模型,推动中国在更多需要深度逻辑和科学发现的领域实现创新引领。” 朱毅鑫最后表示,“我们的系统不仅能解题,在理解底层逻辑美学和自主发现科学规律潜力方面也迈出了一步。”