关闭广告

复旦大学等顶尖高校联手研发:AI模型学会像侦探一样使用工具

科技行者2268人阅读


这项由复旦大学、同济大学、新加坡国立大学、华盛顿大学、电子科技大学以及香港中文大学联合开展的研究发表于2026年1月,论文编号为arXiv:2601.18631v1,为多模态大语言模型的工具使用能力带来了重大突破。

现代人工智能模型就像是刚学会看图识字的学生,虽然能够理解图像内容,但在面对需要多步推理的复杂视觉任务时往往力不从心。比如让AI规划一条从起点到终点的安全路径,既要避开障碍物,又要找到最短路线,或者让AI完成拼图游戏,需要理解图像的整体结构和局部细节。这些任务对人类来说相对简单,但对AI来说却是巨大挑战。

正如人类在遇到超出自身能力的问题时会借助工具一样,研究团队提出了一个革命性的想法:让AI模型学会主动使用各种视觉工具来解决复杂问题。这就好比教会一个学生不仅要会做题,还要知道什么时候该用计算器,什么时候该用尺子,什么时候该用放大镜。

研究团队开发的AdaReasoner系统就像是培养了一位经验丰富的侦探。这位AI侦探不仅具备基本的观察能力,更重要的是,它学会了在破案过程中灵活运用各种侦查工具。当遇到需要精确定位的线索时,它会使用"放大镜工具";当需

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美军在加勒比地区袭击船只致6人死亡 包括两名特多公民

环球网资讯 浏览 3564

工程师崩溃!某车企研发开始试行“两班倒”!

明镜pro 浏览 3525

宁波网友投诉到理发店理发被诱导消费:1次花了6万元

潇湘晨报 浏览 7627

美海军罕见宣布:解除一弹道导弹核潜艇指挥官职务

环球时报国际 浏览 3635

女子应聘疑遭老板性暗示 涉事企业法人:出于工作需要

极目新闻 浏览 8635

希门尼斯:我们踢了一场好比赛;希望勒诺尔芒能尽快回归

懂球帝 浏览 3352

女演员发文点名檀健次:好聚好散

扬子晚报 浏览 7564

民调显示:相较美国,加、德、法、英四国民众更信赖中国

环球网资讯 浏览 1471

极氪8X车型最新谍照曝光,展示尾灯造型

IT之家 浏览 2661

46岁邓超暴瘦引讨论,人前光鲜背后令人担忧

小梊搞笑解说 浏览 2399

全球最大、国内首制万吨级纯电动智能海船“宁远电鲲”号开启海试

IT之家 浏览 2185

天呐!汇丰银行一主任为了1.3万,获刑半年

财通社 浏览 2518

第五季了,谁还在说艾米丽不时髦啊?

时尚COSMO 浏览 2861

被演唱会上的叶倩文惊艳

喵喵娱乐团 浏览 3649

卖零食的,上市首日暴涨88%!股价400港元,合理吗

财通社 浏览 2260

泽连斯基:乌美就领土问题讨论长达6.5小时

每日经济新闻 浏览 16205

宋慧乔的短发太好看了!今年想换发型一定不要错过这篇

LinkFashion 浏览 1977

喜马拉雅烟花秀引争议 新华社、人民日报接连发声

21世纪经济报道 浏览 21278

伊朗外长:美国是否真心实意进行谈判还有待观察

国际在线 浏览 221

吉利发布全域AI 2.0 千里浩瀚G-ASD全面进化

网易汽车 浏览 2541

0.95马赫!全球最快在役公务飞机Global 8000交付

IT之家 浏览 2827
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1