关闭广告

复旦大学等顶尖高校联手研发:AI模型学会像侦探一样使用工具

科技行者2920人阅读


这项由复旦大学、同济大学、新加坡国立大学、华盛顿大学、电子科技大学以及香港中文大学联合开展的研究发表于2026年1月,论文编号为arXiv:2601.18631v1,为多模态大语言模型的工具使用能力带来了重大突破。

现代人工智能模型就像是刚学会看图识字的学生,虽然能够理解图像内容,但在面对需要多步推理的复杂视觉任务时往往力不从心。比如让AI规划一条从起点到终点的安全路径,既要避开障碍物,又要找到最短路线,或者让AI完成拼图游戏,需要理解图像的整体结构和局部细节。这些任务对人类来说相对简单,但对AI来说却是巨大挑战。

正如人类在遇到超出自身能力的问题时会借助工具一样,研究团队提出了一个革命性的想法:让AI模型学会主动使用各种视觉工具来解决复杂问题。这就好比教会一个学生不仅要会做题,还要知道什么时候该用计算器,什么时候该用尺子,什么时候该用放大镜。

研究团队开发的AdaReasoner系统就像是培养了一位经验丰富的侦探。这位AI侦探不仅具备基本的观察能力,更重要的是,它学会了在破案过程中灵活运用各种侦查工具。当遇到需要精确定位的线索时,它会使用"放大镜工具";当需

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

澳大利亚国立大学发现:攻击AI视觉模型只需要操控20%的关键词汇

科技行者 浏览 3031

撕开铁幕裂缝:国产手术机器人的千亿逆袭

钛媒体APP 浏览 4196

看了这些日系穿搭才知道,还是西装和衬衫最靠谱,舒适大方

静儿时尚达人 浏览 3941

中国社会科学院发布14项冷门绝学

经济观察报 浏览 4801

印巴空战震撼全球:PL-15导弹为何一击必杀

浏览 8025

全新外观、新增大电池版本,新款比亚迪海狮05DM申报

IT之家 浏览 3177

“打飞的”半小时畅飞长三角,低空经济“飞入”进博会|聚焦2025进博会

华夏时报 浏览 3769

日方鼓吹拥核 国防部表态

环球网资讯 浏览 3186

卷上天的新能源厂商,销量却被燃油车背刺了

虎嗅APP 浏览 4225

今日热点:《怪奇物语》番外动画剧预告;NEWBEAT签约摩登天空……

伊周潮流 浏览 3172

OPPO AI战略曝光!全场景、全链路,要把 AI 做成系统?

雷科技 浏览 4297

大疆突然降价有的便宜近1500元 有人傻眼:刚买没几天

大象新闻 浏览 18899

过时的拍照姿势,毁了多少普通女孩?

Yuki女人故事 浏览 6016

强奸大嫂凶手出狱去大嫂家 大嫂吓得穿内衣跑街上求救

澎湃新闻 浏览 93805

岚图泰山Ultra测试车曝光 华为四激光L3级SUV将首量产

林林Go 浏览 3103

追寻阳光的Isabel Marant女郎,再次独自启程

时尚COSMO 浏览 4356

Prada如何解构身体与气质?

时尚COSMO 浏览 6142

配置升级 长安Lumin宝藏版将于10月30日上市

车质网 浏览 3941

上海药物所突破:AI滤波器精准筛选神经系统疾病新药

科技行者 浏览 2816

比亚迪锂电、钠电池量产 电动车或有4大变化

电动车的那些事儿 浏览 3319

国家禁止亏本卖车,价格战就能不打了?

汽车公社 浏览 3147
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1