关闭广告

香港科技大学团队发现形式化验证如何让AI推理更聪明

科技行者50人阅读


这是一个关于人工智能如何学会更好地思考的故事。想象一下,你在教一个聪明但有点"散漫"的孩子做数学题。这个孩子通常能猜对答案,但他的推理过程常常有漏洞——他会说"因为看起来对所以就对了",而不是真正理解为什么。如今,来自香港科技大学、上海人工智能实验室、浙江大学和香港浸会大学的研究团队发现了一个巧妙的办法,让这个"散漫的孩子"学会了像数学家一样严谨地思考。这项研究发表于2026年1月,论文编号为arXiv:2601.22642。

这个故事的核心很有趣:当今最强大的语言模型,比如ChatGPT和Claude,在处理复杂推理问题时,常常会犯一个致命的错误。它们会生成看似合理但逻辑上存在严重漏洞的答案。研究人员的发现更是令人担忧——即使在最终答案是对的情况下,推理过程中有39.3%的步骤在形式化验证中被"驳回"了。而当答案错误时,这个比例甚至高达52.4%。这就像一个学生虽然最后得到了正确答案,但他的计算过程完全是错的——纯粹是靠运气或者模式识别碰巧得对了。

研究团队的创新之处在于,他们不是简单地让AI生成答案就完事,而是在推理的每一步都加入了一个"严厉的数学老师"——形式化验证系统。这个"老师"会实时检查每

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中国海警:菲方侵闯中国领海 故意冲撞中国海警船

央视新闻客户端 浏览 2387

郭磊:三季度经济数据——哪些线索需要关注

首席经济学家论坛 浏览 1559

尤文旧将阿莫鲁索:不能让伊尔迪兹独自承担赢球责任

懂球帝 浏览 2131

王牌4年3冠!威尔逊单年包揽MVP+DPOY+FMVP全满贯

体坛周报 浏览 1780

汽车之家官宣冬季测试真要来了:杜绝充值 喊话陈震愿意来吗

快科技 浏览 1347

古二录音被忽略的细节!秦雯闺蜜歧视妇女,业内编剧还在嫌弃观众

萌神木木 浏览 1320

优必选联手云智汇科技 加速人形机器人全球布局

财闻 浏览 2322

美防长突然召回全球数百名美军将领开会 细节披露

环球网资讯 浏览 2233

首席炒黄金期货大赚14亿?国海证券前固收首席靳毅辟谣称已报警

深蓝财经 浏览 1448

美国抓走马杜罗计划曾外泄 美媒收到计划后未公布

新京报 浏览 556

“工业机器人曾是日本的堡垒,但中国已开始在新轨道上竞争”

观察者网 浏览 900

松弛感穿搭太适合秋冬了,减龄又好看

LinkFashion 浏览 1376

天籁出新款,鸿蒙座舱+燃油车,合资新出路来了?

Nice好车 浏览 2250

华硕灵耀14双屏2026来袭:酷睿Ultra X9加持,移动办公集大成者

IT之家 浏览 77

清华大学团队发明"聪明偷懒"的AI:让人工智能只在难题上深度思考

科技行者 浏览 368

俄称击退乌军解围行动 乌称击退俄军进攻

国际在线 浏览 1262

亚马逊将对意大利反垄断罚款提出上诉:一分钱都不该罚

IT之家 浏览 426

媒体:马杜罗大难临头仍相信"不至于" 但美却赶尽杀绝

文汇报 浏览 6577

牛弹琴:180度转弯 和特朗普"你死我活"的狠人去了白宫

北京日报客户端 浏览 2192

44岁阿娇自曝手抖出肝不太好,已戒酒一年多

小咪侃娱圈 浏览 1471

美军在高速公路实弹军演 万斯安保车遭炮弹碎片击中

红星新闻 浏览 7077
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1