关闭广告

香港科技大学团队发现形式化验证如何让AI推理更聪明

科技行者22人阅读


这是一个关于人工智能如何学会更好地思考的故事。想象一下,你在教一个聪明但有点"散漫"的孩子做数学题。这个孩子通常能猜对答案,但他的推理过程常常有漏洞——他会说"因为看起来对所以就对了",而不是真正理解为什么。如今,来自香港科技大学、上海人工智能实验室、浙江大学和香港浸会大学的研究团队发现了一个巧妙的办法,让这个"散漫的孩子"学会了像数学家一样严谨地思考。这项研究发表于2026年1月,论文编号为arXiv:2601.22642。

这个故事的核心很有趣:当今最强大的语言模型,比如ChatGPT和Claude,在处理复杂推理问题时,常常会犯一个致命的错误。它们会生成看似合理但逻辑上存在严重漏洞的答案。研究人员的发现更是令人担忧——即使在最终答案是对的情况下,推理过程中有39.3%的步骤在形式化验证中被"驳回"了。而当答案错误时,这个比例甚至高达52.4%。这就像一个学生虽然最后得到了正确答案,但他的计算过程完全是错的——纯粹是靠运气或者模式识别碰巧得对了。

研究团队的创新之处在于,他们不是简单地让AI生成答案就完事,而是在推理的每一步都加入了一个"严厉的数学老师"——形式化验证系统。这个"老师"会实时检查每

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

高德拿了谷歌剧本,餐饮商家想当主角

蓝鲸新闻 浏览 2119

买黄金,要大变了!

深蓝财经 浏览 1361

意媒:尤文有意引进拜仁小将利契纳,但尚未与拜仁接触

懂球帝 浏览 1674

最圆最近!年度超级月亮今晚登场

封面新闻 浏览 1327

名宿:拜仁选孔帕尼,如同中了头奖

体坛周报 浏览 1476

真爱大牌返场|| 每次分享都秒没!真不愧是我爱了十年的牌子

黎贝卡的异想世界 浏览 2912

足总杯117年最大冷门!卫冕冠军首战出局,被业余球队淘汰

奥拜尔 浏览 501

女子家门口遇害案被告家属首发声:女儿带刀是为"防身"

南方都市报 浏览 17115

零跑汽车10月销量破7万台

三言科技 浏览 1241

全球首个海上千方 PEM 槽及制氢系统的全功率测试启动

IT之家 浏览 1452

长城汽车发布归元平台,穆峰称坚决不做增程式

贝壳财经 浏览 380

中央一号文件来了!今年有哪些“新表述”?

农民日报 浏览 21

马塞利诺:虽然很困难,但我们想要击败尤文图斯

懂球帝 浏览 2149

库克直播间带货 苹果换了打法

北京商报 浏览 1765

阿尔巴:对我帮助最关键的是埃梅里;我心中梅西就是历史最佳

懂球帝 浏览 1468

连续被血洗!今年前十个月的涨幅,币圈一个月跌完了

华尔街见闻官方 浏览 1316

日本宣布从南鸟岛海域采掘到含稀土的淤泥 外交部回应

环球网资讯 浏览 3520

高市早苗自嘲:有人说我是当不上首相的可怜女人

澎湃新闻 浏览 5108

周杰伦蹭霉霉热度翻车!又被质疑崇洋媚外,近些年口碑越来越差

萌神木木 浏览 1546

乖宝宠物三季报后股价大跌,市值一天缩水近50亿

国际金融报 浏览 1541

大兵压境时忽启谈判 特朗普“葫芦里卖的什么药”

看看新闻Knews 浏览 59
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1