关闭广告

复旦大学等顶尖高校联手研发:AI模型学会像侦探一样使用工具

科技行者886人阅读


这项由复旦大学、同济大学、新加坡国立大学、华盛顿大学、电子科技大学以及香港中文大学联合开展的研究发表于2026年1月,论文编号为arXiv:2601.18631v1,为多模态大语言模型的工具使用能力带来了重大突破。

现代人工智能模型就像是刚学会看图识字的学生,虽然能够理解图像内容,但在面对需要多步推理的复杂视觉任务时往往力不从心。比如让AI规划一条从起点到终点的安全路径,既要避开障碍物,又要找到最短路线,或者让AI完成拼图游戏,需要理解图像的整体结构和局部细节。这些任务对人类来说相对简单,但对AI来说却是巨大挑战。

正如人类在遇到超出自身能力的问题时会借助工具一样,研究团队提出了一个革命性的想法:让AI模型学会主动使用各种视觉工具来解决复杂问题。这就好比教会一个学生不仅要会做题,还要知道什么时候该用计算器,什么时候该用尺子,什么时候该用放大镜。

研究团队开发的AdaReasoner系统就像是培养了一位经验丰富的侦探。这位AI侦探不仅具备基本的观察能力,更重要的是,它学会了在破案过程中灵活运用各种侦查工具。当遇到需要精确定位的线索时,它会使用"放大镜工具";当需

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中国移动成功举办“AI赋能医院后勤管理新发展”论坛

北青网-北京青年报 浏览 1610

王玉雯激动发合照,评论区林一破防

鲁中晨报 浏览 1993

瑞信前副总裁挪用客户资金,判囚13年,24名高净值人士获赔8690万

财通社 浏览 1065

燕翔:A股上市公司增减持特征与近况

首席经济学家论坛 浏览 2088

切尔西本赛季英超10名不同球员破门,与阿森纳并列最多

懂球帝 浏览 2108

拉总:诺坎普改叫梅西球场?不合适

体坛周报 浏览 1483

马年壁纸送上,祝大家新年快乐,马上发财!

黎贝卡的异想世界 浏览 301

告别羽毛球自由,中产迷上匹克球

虎嗅APP 浏览 2178

小鹏汇天以保密形式提交港股IPO申请

财视传播 浏览 1093

50+姐姐冬季穿搭别“作妖”,4个法则穿得简约高级,时髦极了

静儿时尚达人 浏览 1473

特朗普邀请俄罗斯重回西方怀抱 普京用一句话表明决心

空天力量 浏览 17193

售价更低 零跑Lafa5无激光雷达版申报信息曝光

网易汽车 浏览 2294

马斯克的Grok AI聊天机器人再现严重故障:混淆邦迪海滩枪击事件

IT之家 浏览 1452

43岁张杰退出投票,粉丝和路人都点赞

眼界看视野 浏览 839

硬件不会绑定新特性:荣耀 Magic6 / 7 全系将支持追色和胶片功能

IT之家 浏览 1963

表现不稳,世体:巴萨对巴尔德和孔德当前展现的水平感到担忧

懂球帝 浏览 1759

你看不起的零跑,终于打响第一枪!

象视汽车 浏览 1945

流行了100年的CP?大衣+阔腿裤,不过时的高级

LinkFashion 浏览 850

高管减持、股东跑路、产品爆炸:上市公司的“中年危机”

诗与星空 浏览 2162

或叫欧拉5?欧拉全新SUV要来了!

车叫兽 浏览 2905

营销悍将赵长江加盟智界,放言智界V9三年内无对手!

车市红点 浏览 1065
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1