关闭广告

香港科技大学团队发现形式化验证如何让AI推理更聪明

科技行者784人阅读


这是一个关于人工智能如何学会更好地思考的故事。想象一下,你在教一个聪明但有点"散漫"的孩子做数学题。这个孩子通常能猜对答案,但他的推理过程常常有漏洞——他会说"因为看起来对所以就对了",而不是真正理解为什么。如今,来自香港科技大学、上海人工智能实验室、浙江大学和香港浸会大学的研究团队发现了一个巧妙的办法,让这个"散漫的孩子"学会了像数学家一样严谨地思考。这项研究发表于2026年1月,论文编号为arXiv:2601.22642。

这个故事的核心很有趣:当今最强大的语言模型,比如ChatGPT和Claude,在处理复杂推理问题时,常常会犯一个致命的错误。它们会生成看似合理但逻辑上存在严重漏洞的答案。研究人员的发现更是令人担忧——即使在最终答案是对的情况下,推理过程中有39.3%的步骤在形式化验证中被"驳回"了。而当答案错误时,这个比例甚至高达52.4%。这就像一个学生虽然最后得到了正确答案,但他的计算过程完全是错的——纯粹是靠运气或者模式识别碰巧得对了。

研究团队的创新之处在于,他们不是简单地让AI生成答案就完事,而是在推理的每一步都加入了一个"严厉的数学老师"——形式化验证系统。这个"老师"会实时检查每

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

赵少康为何不参选国民党主席 陈文茜:他怕妻女怕得要死

海峡导报社 浏览 7113

股市:更大的想象空间来了

小白读财经 浏览 822

前10月规模以上高技术制造业利润同比增长8.0%

北京商报 浏览 1628

突然拉升!加密货币超6万人爆仓,发生了什么?

每日经济新闻 浏览 1360

杨振宁逝世:改变了中国人觉得不如人的心理/库克:苹果AI正努力入华/GPT-5攻克「百年数学难题」遭反转|Hunt Good周报

爱范儿 浏览 2182

联合国对达成加沙地带停火协议表示欢迎

极目新闻 浏览 2255

中航大学:AI聊天机器人的"假身份证"攻击如何骗过智能助手

科技行者 浏览 2108

开撕了!亲爹是首富,嫡长公主租房住?

Yuki女人故事 浏览 3595

AI代写论文公司曾申请精英人才商标

大象新闻 浏览 1941

颠覆认知!用这8把“尺子”重新丈量中国餐饮未来!

餐饮老板内参 浏览 2856

笔在手中,镜头是新墨水

上观新闻 浏览 1582

勇士124-106鹈鹕 球员评价:穆迪满分,5人良好,3人低迷

篮球资讯达人 浏览 1827

吉利11月销量破31万辆 连续9个月同环比双增长 再刷历史新高

网易汽车 浏览 1611

全运男足U20:浙江、新疆成绩完全相同,需抽签决定晋级球队

懂球帝 浏览 1861

1万亿订单再加3500-5000亿美元!OpenAI“停不下来”,“当你欠每家数千亿美元,钱的问题自己会解决”?

华尔街见闻官方 浏览 2302

男子租车遇划痕被车主索赔900元 报警后赔偿立减400元

大风新闻 浏览 34453

产品力再提升 全新雪佛兰Bolt EV新车图解

车质网 浏览 1966

黎以停火协议生效一年 以军称打死370余名武装人员

国际在线 浏览 1548

现场:马竞绝杀国米6连胜!甘当替补的格子同样出色

体坛周报 浏览 1728

伊朗称美国在伊核问题上“没有认真的谈判态度”

国际在线 浏览 1668

美国仿制伊朗的自杀式无人机 开始在中东部署

红星新闻 浏览 1453
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1