关闭广告

复旦大学等顶尖高校联手研发:AI模型学会像侦探一样使用工具

科技行者1141人阅读


这项由复旦大学、同济大学、新加坡国立大学、华盛顿大学、电子科技大学以及香港中文大学联合开展的研究发表于2026年1月,论文编号为arXiv:2601.18631v1,为多模态大语言模型的工具使用能力带来了重大突破。

现代人工智能模型就像是刚学会看图识字的学生,虽然能够理解图像内容,但在面对需要多步推理的复杂视觉任务时往往力不从心。比如让AI规划一条从起点到终点的安全路径,既要避开障碍物,又要找到最短路线,或者让AI完成拼图游戏,需要理解图像的整体结构和局部细节。这些任务对人类来说相对简单,但对AI来说却是巨大挑战。

正如人类在遇到超出自身能力的问题时会借助工具一样,研究团队提出了一个革命性的想法:让AI模型学会主动使用各种视觉工具来解决复杂问题。这就好比教会一个学生不仅要会做题,还要知道什么时候该用计算器,什么时候该用尺子,什么时候该用放大镜。

研究团队开发的AdaReasoner系统就像是培养了一位经验丰富的侦探。这位AI侦探不仅具备基本的观察能力,更重要的是,它学会了在破案过程中灵活运用各种侦查工具。当遇到需要精确定位的线索时,它会使用"放大镜工具";当需

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

秦PLUS DM-i加推128KM进取型 全系限时6.98万元起

网易汽车 浏览 2925

汽车图谱㉔|1月车市调整:上汽销量居首,吉利逆势增长

贝壳财经 浏览 1067

泰晤士报:阿森纳关注卢克巴和利夫拉门托;贝尔塔想清理冗员

懂球帝 浏览 77

恩智浦全新S32N7处理器释放软件定义汽车(SDV)的全部潜力

HiEV 浏览 1419

应采儿携子伦敦地铁,13岁Jasper摘牙套十分帅气

凉湫瑾言 浏览 462

牛弹琴:特朗普“三个很开心” 让全世界脊背发凉

现代快报 浏览 11368

今年秋天最好看的5件风衣!

LinkFashion 浏览 3213

售价更低 荣威i5新版本车型发动机参数下调

车质网 浏览 2493

RMC:姆巴佩找到外部专家以检查膝伤,他有望3月中旬回归

懂球帝 浏览 448

特朗普转发针对古巴强硬言论:鲁比奥将成"古巴总统"

环球时报国际 浏览 10746

赵继伟伤后动态!工作室确定拉伤,待医生进一步检查!

篮球资讯达人 浏览 2116

接到立案通知后,股民以为完了,5个月后一算账,7000人账面翻倍

壹只灰鸽子 浏览 1809

特朗普:将很快对拉丁美洲贩毒行动展开“地面打击”

环球网资讯 浏览 1851

iPhone17来了!华强北最新实探

中国基金报 浏览 3115

主播让弗洛伦齐向拉齐奥打招呼,弗洛伦齐:永远不会

懂球帝 浏览 2380

高圆圆首谈当妈感受:感情都在妈妈身上用完了

雅儿姐爱追剧 浏览 1218

泽连斯基接受采访期间马林斯基宫两度停电 俄官员回应

环球网资讯 浏览 2107

美军空袭尼日利亚 至少有4枚"战斧"疑未能引爆

环球网资讯 浏览 1317

娜扎《玉茗茶骨》解锁国风新体验

呱田里的猹 浏览 1333

医药新股闹涨“A+H市场”

北京商报 浏览 1710

李凤刚出任北京现代总经理,20 年来首次由中国本土人才代表韩方

IT之家 浏览 2155
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1