媒体报道,AI通过通用型聊天机器人和AI编程工具正在改变人们的工作方式,为OpenAI和微软等公司的收入带来增长,各家公司一直在尝试把员工的工作内容交给人工智能代理(AI agents)。
然而,许多企业在使用更复杂的AI代理时却遇到了困难,这些代理往往“胜任不了工作”,因此AI提供商不得不亲自介入、与客户一起排查问题,避免AI“搞砸事情”。
例如,欧洲零售商Fnac在使用AI客服代理时遇到困难。Fnac曾测试过OpenAI、Google和其他实验室的模型,但效果不佳。该公司首席数字与电商负责人Olivier Theulle对媒体表示,可靠性是个问题:当顾客反馈产品有缺陷时,AI要求顾客提供产品序列号,但却把这些序列号与其他产品的序列号混淆了,而这些序列号仅有一位数字不同。
Fnac每年营收达100亿美元。Theulle说,直到与以色列公司AI21 Labs达成合作,并获得其工程师的协助后,这个AI代理的表现才开始变得稳定。AI21联合CEO Ori Goshen说,
“问题在于,模型开箱即用时在各类基准测试上表现很好,但在真实企业环境中表现并不好。”
“需要进行相当程度的定制化。”
一些公司对媒体表示,只有在自家软件工程师花上数月时间部署AI代理,并从AI公司那里获得直接技术支持后,他们才能真正从中受益。如今,科技公司领导者也表示,企业不能指望在没有AI厂商“手把手扶持”的情况下,让复杂AI项目顺利运行。
阅读全文