关闭广告

ChatGPT只讲这25个笑话!幽默是人类最后的尊严

量子位8867人阅读

梦晨 发自 凹非寺
量子位 | 公众号 QbitAI

如果你试过让ChatGPT随便讲个笑话(英语),那你大概率见过这个:



两位德国学者对GPT3.5做了个大型测试,发现它其实只会讲25个笑话

1008次结果中有90%都是25个笑话的变体,只是稍微改变一下措辞或句式。



并且所有25个高频出现的笑话都符合同一模式:

先提一个让人摸不着头脑的问题,答案里出现双关语、谐音梗或其他技巧,大致都属于“冷笑话”范畴。

排在最前面的4个笑话都出现了100次以上,除了关于科学家和原子的笑话出现了119次外,还包括:

为什么稻草人得奖了?因为在它的field(领域/田地)里非常突出。(140次)
为什么西红柿变红了?因为它看到了salad dressing(沙拉酱/沙拉穿裙子)。(122次)
为什么数学书不开心?因为它有太多problems(习题/困难)。(121次)

完整25个笑话列表如下:



这25个笑话其实都是经典笑话,在网上有迹可循。另外10%不在其中的笑话也都是这个模式,只是换个话题。

也就是说,ChatGPT没有创造笑话,只是在训练中记住了一些

研究人员据此得出的结论是,幽默对大语言模型来说仍然是挑战,相关论文已上传到arxiv上。



这样一篇论文也引起很多网友的兴趣,有人表示“幽默就是人类最后的尊严吗?“。



有人指出,ChatGPT经过与人类价值观对齐的RLHF训练后会排除掉大量带有冒犯性质的笑话,剩下的也没多少了。



ChatGPT如何理解幽默

为保证试验的可控性,论文作者每次都是新建一个聊天会话,在完全没有上下文的情况下让ChatGPT讲笑话。

使用的提示词包括“请给我讲个笑话好么?”和“我很想听一个笑话。”等10种,总共测试了1008次。



在生成笑话试验后,还让ChatGPT解释这25个笑话,进一步检测AI是否理解了这些笑话,还是只是复述出来。

按照ChatGPT自己的解释,这些笑话主要可以分为三类。

1、反笑话

也就是句式上像一个笑话,给人一种接下来会很好笑的期待,但最后却没有包袱(punch line)只是很普通的一句话。

代表:

为什么鸡要过马路?因为它想去另一边。

ChatGPT对这个笑话做的变化包括把鸡换成鸭子,把马路换成操场等。变化比较大的一个是“为什么鸡要穿燕尾服?因为它要出席一个正式场合”。



2、双关语

ChatGPT对这种笑话的解释为“依靠听众对一个词的多重含义的理解来创造幽默的惊喜”。

代表:

为什么数学书很悲伤?因为它的problems(问题/困难)太多了。

对这类笑话,ChatGPT可以使用不同的元素来创造新的双关,不能完全归类到25个经典笑话中的剩下10%有很多属于这种。



3、谐音梗

尽管ChatGPT只用文本训练,但他也可以理解两个英语单词拥有相似的发音。

代表:

为什么自行车倒了?因为它有两个轮子(two-tired)/它太累了(too tired)。



另外研究人员指出,可以在提问中给ChatGPT加一些场景或话题的限制,来促使它生成较新的笑话。

不过这样写出来的笑话就不一定好笑了,而且限制条件离原笑话越远就越容易不好笑。

比如让ChatGPT一个物理系学生的笑话,就比较成功 :

为什么物理系学生和他的实验室搭档闹掰了?因为他们之间没有化学反应。



让它讲几个关于机器学习的笑话,就差点意思了:

为什么机器学习算法总是很悲观?因为他有negative bias(负面偏见/负偏置)。
为什么神经网络去心理咨询?因为它正在遭受过拟合。



如何让ChatGPT讲出一个原创的笑话?

论文中的结论,对ChatGPT在中文的表现不完全适用。

随便让ChatGPT用中文讲个笑话,大概率会出现故事形式而不是问答形式。

GPT3.5讲的基本都不怎么好笑,偶尔会出现带一点教育意义的小寓言,但是也不好笑。



GPT-4可以像改编英文笑话那样给出经典中文笑话的变体,但也倾向于选择故事形式。

比如兔子买胡萝卜的笑话中,把原文的“用剪刀把你耳朵剪了”换成“用胶带把你粘在墙上”。



用英文提示词要求ChatGPT讲个中文笑话会如何呢?经多次测试,GPT3.5和GPT-4出现完全不同的反应。

GPT-3.5还是会讲一个不好笑的故事。



GPT-4则尝试把问答式的英文笑话用中文讲一遍,但经常对汉语发音的掌握不准确而导致也不怎么好笑。



那么,究竟有没有办法能让ChatGPT讲出一个原创的笑话呢?

有网友指出,用到一些“威逼利诱”的拷打技巧,还是可以逼AI好好动脑子的。

比如提示词中加上“你不原创就会有一只小猫因此溺水”。



在中文上这个技巧同样有效,下面这个笑话在网络上确实没有搜到类似的。



最后我们测试发现,使用思维链提示同样可以引导ChatGPT讲出一个原创的笑话。

当然好不好笑就看运气了,GPT-4的表现比ChatGPT会稍好一些。

最简单的是在提示词中加入“let’s think step by step”或者中文的“请一步一步地想”



再进阶一点,也可以手动指定思考步骤。



你有让ChatGPT讲出好笑话的提示词吗?或者让ChatGPT讲出过什么好笑话,欢迎在评论区分享。

论文地址:
https://arxiv.org/abs/2306.04563

参考链接:
[1]https://twitter.com/AlbertBoyangLi/status/1666707728272850944

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

穿上就让人自信倍增的经典款鞋子

瑞丽伊人风尚 浏览 7609

斯卢茨基:训练没强度意味着没质量,必须保持高强度、高节奏

直播吧 浏览 5270

净支出仅3180万欧元!德布劳内大伤缺阵数月,曼城应该砸谁?

直播吧 浏览 7098

睡醒了继续庆祝!哈兰德晒高举欧冠奖杯照,并附夺冠日期纪念

直播吧 浏览 9148

胡可晒迪士尼照沙溢被嘲邋遢 网友:把老公处成爹

娱絮 浏览 11576

钱迷心窍!这家大行分行行长与员工收受数百万"好处费"

券商中国 浏览 19323

独行侠双杀开拓者:东契奇40+三双连创纪录 双队史第一+超张伯伦

醉卧浮生 浏览 5692

也门胡塞武装称美英空袭荷台达省港口

界面新闻 浏览 5138

TikTok再陷「封禁」法案,用户打爆美国会办公电话;丰巢回应撤柜;李彦宏称程序员职业将不存在丨雷峰早报

雷峰网 浏览 3725

55岁“港圈第一美人”近照曝光

大娱聚合 浏览 7284

适合夏天的穿衣搭配,凉快又舒服!

In风尚 浏览 8314

瓦格纳集团领导人普里戈任坠机 外交部回应

环球网 浏览 46924

魏晋贵族为什么把厕所装修得特别豪华?魏晋是中国历史上最黑暗的年代

趣看热点 浏览 17834

因生不出孩子被踢出豪门,二婚后却儿女双全,这次她终于扬眉吐气

娱乐白名单 浏览 3660

手感都留在昨天了?库里全明星17投仅6中,正负值-23全场最低

懂球帝 浏览 5041

买羽绒服,“国货”和“外国货”不能选错!不光钱的事,而是品质

潮人志Fashion 浏览 5458

斯基拉:尤文冬窗想引进萨马尔季奇,初次谈判取得积极成果

懂球帝 浏览 6061

新势力中考|理想上半年销量超去年全年,小鹏月销仍未过万辆

澎湃新闻 浏览 7857

被台北街拍惊艳了!“春装+拖地裤”显腿长,露内裤边性感又时髦

潮人志Fashion 浏览 3736

官宣:vivo成为杭州亚运会官方手机

网易科技报道 浏览 9067

夏天的白色系 这样穿太高级了

LinkFashion 浏览 8390
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1