关闭广告

中科大团队实现AI图表数学逻辑理解

科技行者4009人阅读


这项由中国科学技术大学多媒体计算与通信实验室的乐卓等研究者领导的突破性研究,联合北京航空航天大学、上海交通大学、上海人工智能实验室、Hugging Face、新加坡国立大学、字节跳动和香港大学等多个机构,于2025年10月发表在计算机视觉顶级会议上。这项研究首次系统性地解决了AI在生成和编辑结构化图像时"看起来很美实际不准"的核心问题,让人工智能真正具备了理解图表、公式、图形背后数学逻辑的能力。

想象一下,你让AI画一个饼图显示公司各部门的销售占比,AI可能会画出一个看起来很专业的彩色饼图,但仔细一看,所有扇形加起来的角度根本不是360度,或者标注的百分比数字完全对不上扇形的实际大小。这就像是一个只会模仿画家笔触却不懂数学的学生,虽然画得有模有样,但内容完全经不起推敲。

现在的AI图像生成技术确实已经能创造出令人惊叹的自然图像,比如逼真的风景照片或者艺术作品,但当涉及到需要精确计算和逻辑推理的结构化图像时,就像是让一个从未学过数学的人去画函数图像一样困难。这些结构化图像包括数学公式、统计图表、几何图形、科学示意图等,它们不仅要求视觉上的美观,更重要的是内容的准确性和逻辑的严密性。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

媒体:怒批欧洲软弱 结果特朗普自己成"吐槽大会"主角

新京报评论 浏览 20060

兰博基尼Murciélago 无可争议的“大佬级”超跑

CLauto酷乐汽车 浏览 3162

AI概念股重挫,纳指跌近1%,英伟达跌1.63%,软银狂泻12%,国际油价连续七天走高

第一财经资讯 浏览 1124

标配激光雷达 新款领克07EM-P限时13.98万起

网易汽车 浏览 4884

德雷森:穆西亚拉不会挤压卡尔出场时间,没准他俩能同时登场

懂球帝 浏览 3195

拥抱AI 沃尔玛跻身“万亿美元俱乐部”

北京商报 浏览 3000

委内瑞拉外长称已接待美驻委临时代办

国际在线 浏览 2984

9家县级农商行、农信社及9家村行大合并,股金、人员处置方案公布

湘财Plus 浏览 3182

场内嬉笑,场外怒骂,《喜人奇葩说》第一季来了

时尚COSMO 浏览 4076

一颗卫星“掉链”,为何让全球航天界紧张?

上游新闻 浏览 3471

120元和120分钟,哪个更奢侈?

时尚COSMO 浏览 1666

工业与人形机器人蓬勃发展 稀土需求有望迎来几何级增长

金证研 浏览 4420

一觉醒来霍尔木兹传大消息 伊被指启动通行管理新机制

中国基金报 浏览 14421

存储器厂商年赚8.8亿元!晶存科技赴港IPO,经营现金流连续三年入不敷出|港E声

时代周报 浏览 1465

泰国海军做好战争准备 特朗普要电话调停泰柬冲突

环球网资讯 浏览 3672

真爱大牌破价|| 回购多年,这次竟然破天荒200+

黎贝卡的异想世界 浏览 4222

机器人具身操作评估新范式来了,从此告别单一成功率指标

机器之心Pro 浏览 3022

2026北京两会|对话市政协委员刘亮:机器人技术迭代提速,北京打通产学研转化链路

北京商报 浏览 2992

高市为当首相对维新会大幅让步 接受其数个"绝对条件"

极目新闻 浏览 9278

“五菱宏光家族焕新:燃油、增程、纯电三动力,5.48 万元起

IT之家 浏览 3972

消息称一加性能新机搭骁龙 8 系旗舰芯 + 超高刷屏、有很酷的联名

IT之家 浏览 4050
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1