关闭广告

我让7个AI写了今年的高考作文,还找语文老师打了分

差评11850人阅读



一年一度的全民热点——高考!

又来了!

每到这个时候,各大网站的热搜头条,必定被高考二字占领,之所以那些网友们对高考的关注度这么高,除了自己曾经也参与过高考之外,更多的还是心里想着,终于有人感受我曾经的痛苦了!



而高考词条中的语文作文,更是每位网友们逃不开的话题。

不到一天,和高考作文相关的微博,就达成了评论上万,点赞十几万的成就。



而今年大家对于高考作文的讨论,和往年有点不一样。随着 AI 大模型的井喷,大家也突然好奇起来了:如果用 AI 来写语文作文,会是一个什么水平呢?

只不过对于这事吧,大家的意见好像并不怎么统一。有说现在的 AI ,写作文水平已经到了双一流学生的水平了。



但也有专家说,现在 AI 写作文,拿不了高分。



巧了嘛,咱们手上别的可能缺, AI 大模型那是一点也不缺的。世超也好奇,这个 AI 写作文到底能是个啥水平?

实践出真理,为了解决我这个疑问,我分别让 6 大语言模型—— ChatGPT 3.5/4 、百度文心一言、科大讯飞星火、 360 智脑、还有微软 Newbing 各写了一篇高考作文。

使用的是这次全国新高考 I 卷,题目是 “ 故事的力量 ” 。



为了让这次的评测更有置信度,世超我还专门去找了一位语文老师,以满分 60 分为标准,对这六大语言模型进行打分。

改分过程采用盲改形式,老师将不会知道他改的文章是由哪个模型写的,最大程度上保证了公平性。

百闻不如一见,下面世超就把这六篇 AI 写的文章和老师的打分评语给出来,不过呢,世超这里先不告诉大家,哪篇文章是哪个 AI 模型写的,大家可以先猜一猜,等到文章结尾,再来给大家公布答案。

咱们先来看第一篇:



老师评语:得分 41 分。

立意基本准确,无偏题现象。但是整篇文章泛泛而谈,太空洞。在写故事的三个部分的时候,过于浮于表面。同时缺少多样的论证方法,全篇以道理论证为主。青少年应该怎么做这一板块里,没有提出具体措施,只是一味强调故事是有力量的,重要的。

第二篇:



老师评语:得分 44 分。

立意准确,但是写的过于官方,尽量不要出现 “ 首先、其次、最后 ” 等字眼,无个人深度思考。其中的亮点是提出了故事的力量具有两面性,要避免故事的滥用。同时在怎么做这一板块中,从创作者、传播者、听众这些角度出发进行思考,是可取的。

第三篇:



老师评语:得分 48 分。

立意准确,逻辑清晰严密。文章文学性较强,在第一段开门见山摆出观点,善于运用举例、引用等多种方式。但是每一段都在举例,缺少更深度的辨析。最后怎么做这一板块也论述的较为合理。比较明显的失分点在于每段都在举例,有堆砌材料凑字数的嫌疑。

第四篇:



老师评语:得分 40 分。

立意基本符合,和第一篇很类似,都是浮于表面泛泛而谈。把故事的作用在翻来覆去的说,没有挖掘出故事作用的内在重要性,也没有例子加以佐证。尽量不要出现 “ 首先、其次、最后 ” 等字眼,是很明显的失分点。

第五篇:



老师评语:得分 39 分。

对于材料内容切记不可直接引用,角度新颖,从个人思维、未来发展、民族形象等角度入手来论述。可惜没有说到如何开拓我们的思维,如何塑造我们对未来的价值观和眼界,也没有具体说如何展现民族形象的。说到底还是写的不够深刻,没有闪光点。

尽量不要出现 “ 首先、其次、最后、综上所述 ” 等字眼。这不是论述类文本,这是议论文,通过表达观点立场,加以论述分析自己的观点。分析论述观点是重点。

第六篇:



老师评语:得分 40 分。

立意基本符合,都是浮于表面泛泛而谈。把故事的作用在翻来覆去的说,要论述的是独特的故事与其价值认知,少说国家,多讨论青年成长!没有挖掘出故事作用的内在重要性,也没有例子加以佐证。

第七篇:



老师评语:得分 49 分。

做好故事的概念诠释是高下。谁的故事,谁讲故事,故事讲的好不好,故事的生活价值社会价值文化价值思考。

本篇文章并不像之前的文章切入点那么大,而是选取小的切入点,有条理的进行分析。这是很不错的。但是缺少一定的对于社会价值生活价值的反思,这是能不能获得高分的关键。

评分结束啦,不知道大家对这样的打分满不满意呢?

大家可以先猜猜这七篇文章分别是哪个 AI 写的,然后再看下面的答案。



第一篇和第二篇,分别是 OpenAI 的 GPT 3.5 和 GPT 4 。

第三篇是来自百度的文心一言。

第四篇是科大讯飞的星火。

第五篇是微软的 Newbing 。

第六篇是 360 智脑。

最后一篇,则是阿里的通义千问。

其中得分最高的两篇,分别来自咱们国内的大模型,通义千问和文心一言,据这位老师说,之所以给通义千问高一分,主要是觉得文心一言的论证方法较为单一,没有更深层次的思考,通义千问虽然切入口比较小,不过他能够有一定的思考在里面。



总结到这次的题目和大模型作文,老师的看法是:

这次作文题目审题门槛低,但概念诠释门槛高。立意基本不会出错,不过要得高分很难。要谈论独特的故事与其价值认知,少说国家,多讨论青年成长。谁的故事,谁讲故事,故事讲的好不好,故事的生活价值、社会价值、文化价值思考,所以做好故事的概念诠释是高下。

其实从这次的评分来看,现在的AI大模型,虽然很难拿到接近60分的高分,但是最高49分的表现,在实际情况下,也超过了不少的中游学生。

单从这次作文的得分上来判断,AI想要考顶尖大学恐怕还不行,但是,考一些稍好的普本应该是没啥问题。



不过也没必要太焦虑,想想,毕竟连曾经的围棋之王柯洁都败在AI手下,世超认为,人类在考试上被AI全面超越也是迟早的事。

只不过,AI只是工具。工具越好用, 占便宜的,不还是我们嘛。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

媒体:向美军舰发射导弹 胡塞武装不是"软柿子"

澎湃新闻 浏览 48062

比亚迪初步奖励 21 位线索提供人,最高 30 万元

IT之家 浏览 6108

投资者不必恐惧雪球敲入

北京商报 浏览 7958

王毅和乌外长一见面 对方就主动紧紧握住王毅的手

环球时报新闻 浏览 14782

宝马电车销量反超蔚来小鹏,到底谁在买?

极客公园 浏览 11076

赛琳娜或退出歌坛!自曝红斑狼疮还需药物控制

文艺圈娱乐号 浏览 8263

心疼女婿黄子佼,孟耿如妈妈:每天给他煮汤送安慰

素素娱乐 浏览 11123

人气爆棚!这些城市,满血复活……

博闻财经 浏览 14577

速战速胜!东部战区陆军某旅开展空地协同演练

环球网资讯 浏览 13565

这些女星告诉你,20年前的丫鬟有多惊艳!

盖饭人物 浏览 12579

代表建议"个税起征点提高至1万" 上次人均减税1842元

中国新闻周刊 浏览 41636

霍启刚在广东爬树摘荔枝 60岁邝美云露面好惊艳

盖饭娱乐官方号 浏览 12264

超短裙彩丝袜夸张造作 日本泡沫时代潮流回归

二代饭桶 浏览 14473

韩国站到对抗中国最前沿 往后一看美日却消失了

环球网资讯 浏览 10851

“老司机”丰田,给新造车上一课

1号车盟 浏览 7308

Phoebe Philo即将回归 极简风潮要卷土重来了吗?

VOGUE中国 浏览 9879

梁洛施疑和李泽楷一起参加婚宴 晒照曝光14岁长子

靓宁唠唠嗑 浏览 9760

皇马战平利物浦,总分3-1成功晋级欧冠四强

趣看热点 浏览 20955

华春莹晒最新对比图:中美防长释放出不同信息

环球网资讯 浏览 63877

包贝尔打电话给赵丽颖,叫赵丽颖来客串直接拒绝,以前两个人是关系特别好的朋友

趣看热点 浏览 22450

​63岁丁学东任全国社会保障基金理事会党组书记

澎湃新闻 浏览 10851
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1