关闭广告

复旦大学等顶尖高校联手研发:AI模型学会像侦探一样使用工具

科技行者177人阅读


这项由复旦大学、同济大学、新加坡国立大学、华盛顿大学、电子科技大学以及香港中文大学联合开展的研究发表于2026年1月,论文编号为arXiv:2601.18631v1,为多模态大语言模型的工具使用能力带来了重大突破。

现代人工智能模型就像是刚学会看图识字的学生,虽然能够理解图像内容,但在面对需要多步推理的复杂视觉任务时往往力不从心。比如让AI规划一条从起点到终点的安全路径,既要避开障碍物,又要找到最短路线,或者让AI完成拼图游戏,需要理解图像的整体结构和局部细节。这些任务对人类来说相对简单,但对AI来说却是巨大挑战。

正如人类在遇到超出自身能力的问题时会借助工具一样,研究团队提出了一个革命性的想法:让AI模型学会主动使用各种视觉工具来解决复杂问题。这就好比教会一个学生不仅要会做题,还要知道什么时候该用计算器,什么时候该用尺子,什么时候该用放大镜。

研究团队开发的AdaReasoner系统就像是培养了一位经验丰富的侦探。这位AI侦探不仅具备基本的观察能力,更重要的是,它学会了在破案过程中灵活运用各种侦查工具。当遇到需要精确定位的线索时,它会使用"放大镜工具";当需

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

拥抱AI 沃尔玛跻身“万亿美元俱乐部”

北京商报 浏览 18

男子疑心梗住院被急诊医生误诊 转入普通病房后身亡

大风新闻 浏览 11202

全运会男足U20半决赛对阵:广东vs上海,湖北vs山东

懂球帝 浏览 1332

插混车纯电续航超过210km,增程车怎么办?

汽车公社 浏览 530

国常会重磅部署!

数据宝 浏览 1553

理发店主阻拦城管撕广告 冲突中被1名胖城管咬伤手指

大风新闻 浏览 2799

杨振宁逝世:改变了中国人觉得不如人的心理/库克:苹果AI正努力入华/GPT-5攻克「百年数学难题」遭反转|Hunt Good周报

爱范儿 浏览 1628

涨工资,落地!

国是直通车 浏览 1321

加沙停火协议文件在埃及签署

鲁中晨报 浏览 1666

特朗普:加沙"和平委员会"已成立

新京报 浏览 402

何炅51岁无妻无子,且不再隐瞒身体状况了?

艳儿说电影 浏览 1556

新东方员工再出新歌"骂"公司 俞敏洪曾奖励12万

界面新闻 浏览 6812

微软豪掷79亿美元投资阿联酋AI企业G42,加速中东AI设施建设

IT之家 浏览 1460

超越纯视觉模型!不改VLM标准架构,实现像素级深度预测

新智元 浏览 1644

小维阿:马赛的压力不让我意外,我在尤文效力过

懂球帝 浏览 1369

特朗普称美将管理委直至安全过渡

新华社 浏览 457

利雅得胜利客战利雅得体育:C罗缺阵,菲利克斯、马内先发

懂球帝 浏览 73

40+女人冬季穿衣,质感优先、简约配色、扬长避短,优雅高级

静儿时尚达人 浏览 430

帕多瓦诺:我为图多尔感到遗憾;让我选新帅绝对是曼奇尼

懂球帝 浏览 1400

雷军直播四小时回应质疑

大象新闻 浏览 572

遇到家境好的领导是什么体验?

识局 浏览 1507
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1