关闭广告

ChatGPT只讲这25个笑话!幽默是人类最后的尊严

量子位13420人阅读

梦晨 发自 凹非寺
量子位 | 公众号 QbitAI

如果你试过让ChatGPT随便讲个笑话(英语),那你大概率见过这个:



两位德国学者对GPT3.5做了个大型测试,发现它其实只会讲25个笑话

1008次结果中有90%都是25个笑话的变体,只是稍微改变一下措辞或句式。



并且所有25个高频出现的笑话都符合同一模式:

先提一个让人摸不着头脑的问题,答案里出现双关语、谐音梗或其他技巧,大致都属于“冷笑话”范畴。

排在最前面的4个笑话都出现了100次以上,除了关于科学家和原子的笑话出现了119次外,还包括:

为什么稻草人得奖了?因为在它的field(领域/田地)里非常突出。(140次)
为什么西红柿变红了?因为它看到了salad dressing(沙拉酱/沙拉穿裙子)。(122次)
为什么数学书不开心?因为它有太多problems(习题/困难)。(121次)

完整25个笑话列表如下:



这25个笑话其实都是经典笑话,在网上有迹可循。另外10%不在其中的笑话也都是这个模式,只是换个话题。

也就是说,ChatGPT没有创造笑话,只是在训练中记住了一些

研究人员据此得出的结论是,幽默对大语言模型来说仍然是挑战,相关论文已上传到arxiv上。



这样一篇论文也引起很多网友的兴趣,有人表示“幽默就是人类最后的尊严吗?“。



有人指出,ChatGPT经过与人类价值观对齐的RLHF训练后会排除掉大量带有冒犯性质的笑话,剩下的也没多少了。



ChatGPT如何理解幽默

为保证试验的可控性,论文作者每次都是新建一个聊天会话,在完全没有上下文的情况下让ChatGPT讲笑话。

使用的提示词包括“请给我讲个笑话好么?”和“我很想听一个笑话。”等10种,总共测试了1008次。



在生成笑话试验后,还让ChatGPT解释这25个笑话,进一步检测AI是否理解了这些笑话,还是只是复述出来。

按照ChatGPT自己的解释,这些笑话主要可以分为三类。

1、反笑话

也就是句式上像一个笑话,给人一种接下来会很好笑的期待,但最后却没有包袱(punch line)只是很普通的一句话。

代表:

为什么鸡要过马路?因为它想去另一边。

ChatGPT对这个笑话做的变化包括把鸡换成鸭子,把马路换成操场等。变化比较大的一个是“为什么鸡要穿燕尾服?因为它要出席一个正式场合”。



2、双关语

ChatGPT对这种笑话的解释为“依靠听众对一个词的多重含义的理解来创造幽默的惊喜”。

代表:

为什么数学书很悲伤?因为它的problems(问题/困难)太多了。

对这类笑话,ChatGPT可以使用不同的元素来创造新的双关,不能完全归类到25个经典笑话中的剩下10%有很多属于这种。



3、谐音梗

尽管ChatGPT只用文本训练,但他也可以理解两个英语单词拥有相似的发音。

代表:

为什么自行车倒了?因为它有两个轮子(two-tired)/它太累了(too tired)。



另外研究人员指出,可以在提问中给ChatGPT加一些场景或话题的限制,来促使它生成较新的笑话。

不过这样写出来的笑话就不一定好笑了,而且限制条件离原笑话越远就越容易不好笑。

比如让ChatGPT一个物理系学生的笑话,就比较成功 :

为什么物理系学生和他的实验室搭档闹掰了?因为他们之间没有化学反应。



让它讲几个关于机器学习的笑话,就差点意思了:

为什么机器学习算法总是很悲观?因为他有negative bias(负面偏见/负偏置)。
为什么神经网络去心理咨询?因为它正在遭受过拟合。



如何让ChatGPT讲出一个原创的笑话?

论文中的结论,对ChatGPT在中文的表现不完全适用。

随便让ChatGPT用中文讲个笑话,大概率会出现故事形式而不是问答形式。

GPT3.5讲的基本都不怎么好笑,偶尔会出现带一点教育意义的小寓言,但是也不好笑。



GPT-4可以像改编英文笑话那样给出经典中文笑话的变体,但也倾向于选择故事形式。

比如兔子买胡萝卜的笑话中,把原文的“用剪刀把你耳朵剪了”换成“用胶带把你粘在墙上”。



用英文提示词要求ChatGPT讲个中文笑话会如何呢?经多次测试,GPT3.5和GPT-4出现完全不同的反应。

GPT-3.5还是会讲一个不好笑的故事。



GPT-4则尝试把问答式的英文笑话用中文讲一遍,但经常对汉语发音的掌握不准确而导致也不怎么好笑。



那么,究竟有没有办法能让ChatGPT讲出一个原创的笑话呢?

有网友指出,用到一些“威逼利诱”的拷打技巧,还是可以逼AI好好动脑子的。

比如提示词中加上“你不原创就会有一只小猫因此溺水”。



在中文上这个技巧同样有效,下面这个笑话在网络上确实没有搜到类似的。



最后我们测试发现,使用思维链提示同样可以引导ChatGPT讲出一个原创的笑话。

当然好不好笑就看运气了,GPT-4的表现比ChatGPT会稍好一些。

最简单的是在提示词中加入“let’s think step by step”或者中文的“请一步一步地想”



再进阶一点,也可以手动指定思考步骤。



你有让ChatGPT讲出好笑话的提示词吗?或者让ChatGPT讲出过什么好笑话,欢迎在评论区分享。

论文地址:
https://arxiv.org/abs/2306.04563

参考链接:
[1]https://twitter.com/AlbertBoyangLi/status/1666707728272850944

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

杨幂发文谈新剧番位:名字的顺序都该为角色让位

网易娱乐 浏览 16652

纳指收创新高:特斯拉涨超6% 市值一夜大增近2800亿元

每日经济新闻 浏览 50775

新增远程代客泊车辅助 深蓝S7i高阶智驾深度体验

车市红点 浏览 9652

2020诺贝尔化学奖得主揭晓,研究团队发明5分钟检测新冠方法

趣看热点 浏览 22825

ICML2024高分!魔改注意力,让小模型能打两倍大的模型

量子位 浏览 8365

美英打击胡塞武装 行动规模或限定在“小范围”

澎湃新闻 浏览 9852

中国移动正式发布两颗自研芯片

爱集微 浏览 12997

累计交付323.6万辆,大众汽车集团2023销量成绩公布

天天汽车 浏览 9685

能否挑战 19 万美元纪录?罕见4GB未拆封初代苹果iPhone再次拍卖

IT之家 浏览 8476

科创板IPO半年报:海通证券保荐募资额居首

财联社 浏览 12332

初夏穿什么?当然选杨采钰的法式风!

瑞丽网 浏览 15688

日本人相当敏感:央视14年来头一回!

环球网 浏览 23440

厉害了,宝马还在为60年前的老车生产零件

MOTO 浏览 9388

杨颖虽挤不进红毯 她却深V露背艳压全场

皮蛋儿电影 浏览 13495

中泰证券裁员,不想做投行了?

BT财经 浏览 13542

《沙丘2》中有一处令人费解的漏洞

幕味儿 浏览 9140

"姬发"和"妲己"这么配,纣王知道吗?

闲聊小神龙 浏览 11814

进军好莱坞的奢侈品巨头,扎堆拍电影?

YOKA网 浏览 9700

马思纯最新亮相美到我!穿黑色露肩衣美艳十足

时尚丽人风行 浏览 16090

俄国防部:一架L-39教练机于俄南部机场内坠毁

环球网资讯 浏览 11258

这双鞋太火了!怎么搭都好看|好物

LinkFashion 浏览 7737
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1