关闭广告

复旦大学等顶尖高校联手研发:AI模型学会像侦探一样使用工具

科技行者3043人阅读


这项由复旦大学、同济大学、新加坡国立大学、华盛顿大学、电子科技大学以及香港中文大学联合开展的研究发表于2026年1月,论文编号为arXiv:2601.18631v1,为多模态大语言模型的工具使用能力带来了重大突破。

现代人工智能模型就像是刚学会看图识字的学生,虽然能够理解图像内容,但在面对需要多步推理的复杂视觉任务时往往力不从心。比如让AI规划一条从起点到终点的安全路径,既要避开障碍物,又要找到最短路线,或者让AI完成拼图游戏,需要理解图像的整体结构和局部细节。这些任务对人类来说相对简单,但对AI来说却是巨大挑战。

正如人类在遇到超出自身能力的问题时会借助工具一样,研究团队提出了一个革命性的想法:让AI模型学会主动使用各种视觉工具来解决复杂问题。这就好比教会一个学生不仅要会做题,还要知道什么时候该用计算器,什么时候该用尺子,什么时候该用放大镜。

研究团队开发的AdaReasoner系统就像是培养了一位经验丰富的侦探。这位AI侦探不仅具备基本的观察能力,更重要的是,它学会了在破案过程中灵活运用各种侦查工具。当遇到需要精确定位的线索时,它会使用"放大镜工具";当需

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

你敢变重6公斤吗?

时尚COSMO 浏览 884

对话“死了么”App创始人:这几天付费人数翻了200倍;另有“活了么”App上线

红星资本局 浏览 3249

钉钉和AI抢时间

虎嗅APP 浏览 3456

美防长被指佩戴与俄国旗颜色一致领带引猜测 万斯回应

环球时报新闻 浏览 9177

图片报:塔踩到了斯塔尼希奇此前受伤的右脚,使其退出训练

懂球帝 浏览 2990

给《树影迷宫》演技最好的7位演员排座次:刘琳第3,第1无法超越

娱乐圈笔娱君 浏览 3940

特朗普提出将美国军费提升至1.5万亿美元

澎湃新闻 浏览 3263

美媒:美正向中东增派包括航母在内的兵力

界面新闻 浏览 3166

法兰克福3-4柏林联合,伯克戴帽,伯卡特点射,瓦希送助攻

懂球帝 浏览 4957

马尔科-席尔瓦:大马丁百分之百禁区内犯规了,裁判没给我们点球

懂球帝 浏览 4945

独立研究者破解扩散模型的最佳预测目标之谜

科技行者 浏览 2952

穆西亚拉庆祝梦幻回归

绿茵情报局 浏览 3215

特斯拉Robotaxi撞车率约人类司机4倍

不看车bukanche 浏览 2668

综合补贴8.78万元起 星光730尊享型正式上市

网易汽车 浏览 1154

多名男女在呼伦贝尔大草原上跳起"纸片舞" 当地回应

扬子晚报 浏览 9341

澳网总监:女子赛事若采用五盘三胜,或将在2027年实施

懂球帝 浏览 2930

刚亮完核杀器 俄罗斯"末日电台"发出6字神秘信号

参考消息网 浏览 15195

布云朝克特遭遇新赛季开门黑,周意送蛋横扫受到网友表扬!

网球之家 浏览 3426

古美关系高度紧张 古巴启动"战争状态"

扬子晚报 浏览 3101

又一黑马大剧《表妹万福》来袭,宋祖儿撒娇追夫

动物奇奇怪怪 浏览 4312

S家族,最出名的不是八卦?

江湖人称艾掌门 浏览 4128
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1