关闭广告

复旦大学等顶尖高校联手研发:AI模型学会像侦探一样使用工具

科技行者2919人阅读


这项由复旦大学、同济大学、新加坡国立大学、华盛顿大学、电子科技大学以及香港中文大学联合开展的研究发表于2026年1月,论文编号为arXiv:2601.18631v1,为多模态大语言模型的工具使用能力带来了重大突破。

现代人工智能模型就像是刚学会看图识字的学生,虽然能够理解图像内容,但在面对需要多步推理的复杂视觉任务时往往力不从心。比如让AI规划一条从起点到终点的安全路径,既要避开障碍物,又要找到最短路线,或者让AI完成拼图游戏,需要理解图像的整体结构和局部细节。这些任务对人类来说相对简单,但对AI来说却是巨大挑战。

正如人类在遇到超出自身能力的问题时会借助工具一样,研究团队提出了一个革命性的想法:让AI模型学会主动使用各种视觉工具来解决复杂问题。这就好比教会一个学生不仅要会做题,还要知道什么时候该用计算器,什么时候该用尺子,什么时候该用放大镜。

研究团队开发的AdaReasoner系统就像是培养了一位经验丰富的侦探。这位AI侦探不仅具备基本的观察能力,更重要的是,它学会了在破案过程中灵活运用各种侦查工具。当遇到需要精确定位的线索时,它会使用"放大镜工具";当需

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

超千万元罚单屡见不鲜!第三方支付机构这些“坑”别再踩了

国际金融报 浏览 3130

秦昊一家五口度假,伊能静少女打扮但很显胖

八怪娱 浏览 3377

很运动 全新雷克萨斯ES F SPORT渲染图曝光

车质网 浏览 4649

迈凯伦新专利 赛道模式将锁定使用场景

车质网 浏览 3535

央视春晚二次联排阵容曝光,网友泼冷水:这配置真没必要硬凑热闹

肆季娱乐 浏览 2924

“金字招牌”业绩几近腰斩,韩国免税业迎接“寒冬”

环球网资讯 浏览 2138

秦雯编剧电视剧被央视撤档 此前王家卫秦雯录音惹争议

鲁中晨报 浏览 16626

英伟达CEO黄仁勋:“上帝级AI”还很遥远,但世界仍需向前发展

IT之家 浏览 3053

逃离5A景区的中年人,正在涌向“差评最多”的小店

她刊 浏览 764

高市早苗:若执政党阵营在选举中未过半数 将即刻辞职

界面新闻 浏览 7257

该不该踢双前锋?哲科:我说多了教练要生气

懂球帝 浏览 4100

佘智江获利达1.5亿元:曾逼美貌女性卖淫 或供"玩乐"

新京报 浏览 18092

队报:比赛中拉门斯的长传频繁且精准,推动了曼联的战术转型

懂球帝 浏览 4037

杨明洋:感谢罗慕洛为我助攻,也感谢南通球迷一直支持我

懂球帝 浏览 4226

2026 春节档终极 PK!沈腾周星驰二次交手

第一娱记 浏览 3032

李镇全打趣:现场听到GAI的说唱,我在场上可能多跑几百米

懂球帝 浏览 2195

哥伦比亚总统:反对对古巴进行任何形式的军事干预

国际在线 浏览 860

AI聊天机器人背后的肯尼亚劳工:每条“我爱你”付费0.05美元

DeepTech深科技 浏览 3370

齐沃:阿森纳和拜仁是目前欧洲最强,但这不意味着我们输定了

懂球帝 浏览 3024

VNU University of Science:精准调控技术提升机器人执行能力

科技行者 浏览 2904

对话郝飞:智能座舱新物种 斑马为端芯片带来的新机遇

网易汽车 浏览 4253
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1