关闭广告

复旦大学等顶尖高校联手研发:AI模型学会像侦探一样使用工具

科技行者1916人阅读


这项由复旦大学、同济大学、新加坡国立大学、华盛顿大学、电子科技大学以及香港中文大学联合开展的研究发表于2026年1月,论文编号为arXiv:2601.18631v1,为多模态大语言模型的工具使用能力带来了重大突破。

现代人工智能模型就像是刚学会看图识字的学生,虽然能够理解图像内容,但在面对需要多步推理的复杂视觉任务时往往力不从心。比如让AI规划一条从起点到终点的安全路径,既要避开障碍物,又要找到最短路线,或者让AI完成拼图游戏,需要理解图像的整体结构和局部细节。这些任务对人类来说相对简单,但对AI来说却是巨大挑战。

正如人类在遇到超出自身能力的问题时会借助工具一样,研究团队提出了一个革命性的想法:让AI模型学会主动使用各种视觉工具来解决复杂问题。这就好比教会一个学生不仅要会做题,还要知道什么时候该用计算器,什么时候该用尺子,什么时候该用放大镜。

研究团队开发的AdaReasoner系统就像是培养了一位经验丰富的侦探。这位AI侦探不仅具备基本的观察能力,更重要的是,它学会了在破案过程中灵活运用各种侦查工具。当遇到需要精确定位的线索时,它会使用"放大镜工具";当需

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

特朗普称让美国大型石油公司进入委内瑞拉

界面新闻 浏览 2168

奚梦瑶为女儿庆生,4岁Romee长腿抢镜

扒虾侃娱 浏览 3081

他被谢霆锋打成重伤,如今怎么样了?

卷史 浏览 3083

CBA常规赛第26轮最佳阵:周琦阿不都沙拉木领衔,姜伟泽在列

懂球帝 浏览 1064

恩里克:我们在23分钟内丢了3个球?那是对手球员的实力所致

懂球帝 浏览 3189

孙颖莎脚踝伤势或不严重!行走自如+下蹲轻松 回京养伤坐等乒超?

颜小白的篮球梦 浏览 2466

深度复盘:大疆是如何成为影像领域新巨头的?

极客公园 浏览 2874

洪都拉斯3-0大胜海地,奎奥托建功,安东尼-洛萨诺破门

懂球帝 浏览 3159

2026,如何留在“牌桌”上?

虎嗅APP 浏览 2502

以军对加沙地带南部的哈马斯目标发动袭击

新华社 浏览 3140

蜜雪冰城开到公交站乘车享折扣 执法局的人却上门了

每日经济新闻 浏览 33073

演绎日式豪华MPV 全新日产Elgrand新车图解

车质网 浏览 2559

科技巨头再投500亿瞄准这个赛道

中国新闻周刊 浏览 2931

专家解读:“最后期限”前 美国伊朗如何出牌

新华社 浏览 1905

光伏“卖铲人”去年净利腰斩

网易财经 浏览 1723

果园8.8元"偷橘子":一晚卖几百斤 抓人的狗都累瘫了

红星新闻 浏览 15622

推广|| 她们新年状态大开挂?原来悄悄做了这笔“美丽投资”

黎贝卡的异想世界 浏览 2125

搭载地平线征程6E 全新MG4 530将于10月底开启交付

网易汽车 浏览 3053

帮助中国人撤离的伊朗民众:我们走不了的

南方都市报 浏览 1351

向渠道要效率,理想汽车:将关闭一些能效低的门店,目前还处于评估阶段

时代财经 浏览 1945

分羹法拍房!富滇银行落地首笔“法拍贷”,曝五部门全程配合

密探财经 浏览 3638
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1