关闭广告

复旦大学等顶尖高校联手研发:AI模型学会像侦探一样使用工具

科技行者2921人阅读


这项由复旦大学、同济大学、新加坡国立大学、华盛顿大学、电子科技大学以及香港中文大学联合开展的研究发表于2026年1月,论文编号为arXiv:2601.18631v1,为多模态大语言模型的工具使用能力带来了重大突破。

现代人工智能模型就像是刚学会看图识字的学生,虽然能够理解图像内容,但在面对需要多步推理的复杂视觉任务时往往力不从心。比如让AI规划一条从起点到终点的安全路径,既要避开障碍物,又要找到最短路线,或者让AI完成拼图游戏,需要理解图像的整体结构和局部细节。这些任务对人类来说相对简单,但对AI来说却是巨大挑战。

正如人类在遇到超出自身能力的问题时会借助工具一样,研究团队提出了一个革命性的想法:让AI模型学会主动使用各种视觉工具来解决复杂问题。这就好比教会一个学生不仅要会做题,还要知道什么时候该用计算器,什么时候该用尺子,什么时候该用放大镜。

研究团队开发的AdaReasoner系统就像是培养了一位经验丰富的侦探。这位AI侦探不仅具备基本的观察能力,更重要的是,它学会了在破案过程中灵活运用各种侦查工具。当遇到需要精确定位的线索时,它会使用"放大镜工具";当需

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

商竣程香港250赛再爆大冷排名狂飙95位,郑钦文官宣退出2026澳网

网球之家 浏览 3177

外媒:扎克伯格态度转变 Meta使用阿里千问优化其最新AI模型

环球网资讯 浏览 3509

米体:尤文自2019年起已完成四次增资,总额接近10亿欧

懂球帝 浏览 3688

美军在加勒比地区袭击船只致6人死亡 包括两名特多公民

环球网资讯 浏览 4182

九旬李明启谈到容嬷嬷为自己发声

蜜桔娱乐 浏览 3925

跟队:拜仁内部不会轻易谈论让伦纳特-卡尔踢世界杯的话题

懂球帝 浏览 4125

日产携左舵版N7亮相2025日本移动出行展

网易汽车 浏览 3907

看玄彬孙艺珍这样撒糖,谁能扛得住

Yuki女人故事 浏览 3602

江门中微子实验圆满完成工程建设任务

IT之家 浏览 3138

央行连续增持黄金,10月我国外汇储备规模稳中有升

中国商报 浏览 3925

国信策略:抢占科技发展制高点

网易财经 浏览 4117

特瓦斯:大多数联赛都在苦苦挣扎,我好奇为何人们这么想阻止海外赛

懂球帝 浏览 4032

尘埃落定!全部划归国资!许家印的“御用包工头”被掏空家底

壹只灰鸽子 浏览 4236

斯帕莱蒂抵达尤文总部,受到球迷夹道欢迎

懂球帝 浏览 3909

从“贝塔躺赢”到“阿尔法精选”!公募2026年南下新打法曝光

券商中国 浏览 3163

前三季度应收账款激增603.71%,卤味巨头煌上煌靠收购和补贴撑利润?

时代周报 浏览 4097

秋天怎么穿出时尚感?避开老气的着装方式,美得自然又大方

静儿时尚达人 浏览 3780

开局2026,企业家的坚守与求变|封面故事

中国企业家杂志 浏览 3178

最高涨价28%,老铺黄金年内第三次调价,今年已累计涨约50%

红星资本局 浏览 4083

关于格陵兰岛 普京表态:与俄罗斯完全无关

极目新闻 浏览 20298

日本自民党高官窜访台湾 外交部:"媚日谋独"令人不齿

澎湃新闻 浏览 8594
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1