关闭广告

我让7个AI写了今年的高考作文,还找语文老师打了分

差评9142人阅读



一年一度的全民热点——高考!

又来了!

每到这个时候,各大网站的热搜头条,必定被高考二字占领,之所以那些网友们对高考的关注度这么高,除了自己曾经也参与过高考之外,更多的还是心里想着,终于有人感受我曾经的痛苦了!



而高考词条中的语文作文,更是每位网友们逃不开的话题。

不到一天,和高考作文相关的微博,就达成了评论上万,点赞十几万的成就。



而今年大家对于高考作文的讨论,和往年有点不一样。随着 AI 大模型的井喷,大家也突然好奇起来了:如果用 AI 来写语文作文,会是一个什么水平呢?

只不过对于这事吧,大家的意见好像并不怎么统一。有说现在的 AI ,写作文水平已经到了双一流学生的水平了。



但也有专家说,现在 AI 写作文,拿不了高分。



巧了嘛,咱们手上别的可能缺, AI 大模型那是一点也不缺的。世超也好奇,这个 AI 写作文到底能是个啥水平?

实践出真理,为了解决我这个疑问,我分别让 6 大语言模型—— ChatGPT 3.5/4 、百度文心一言、科大讯飞星火、 360 智脑、还有微软 Newbing 各写了一篇高考作文。

使用的是这次全国新高考 I 卷,题目是 “ 故事的力量 ” 。



为了让这次的评测更有置信度,世超我还专门去找了一位语文老师,以满分 60 分为标准,对这六大语言模型进行打分。

改分过程采用盲改形式,老师将不会知道他改的文章是由哪个模型写的,最大程度上保证了公平性。

百闻不如一见,下面世超就把这六篇 AI 写的文章和老师的打分评语给出来,不过呢,世超这里先不告诉大家,哪篇文章是哪个 AI 模型写的,大家可以先猜一猜,等到文章结尾,再来给大家公布答案。

咱们先来看第一篇:



老师评语:得分 41 分。

立意基本准确,无偏题现象。但是整篇文章泛泛而谈,太空洞。在写故事的三个部分的时候,过于浮于表面。同时缺少多样的论证方法,全篇以道理论证为主。青少年应该怎么做这一板块里,没有提出具体措施,只是一味强调故事是有力量的,重要的。

第二篇:



老师评语:得分 44 分。

立意准确,但是写的过于官方,尽量不要出现 “ 首先、其次、最后 ” 等字眼,无个人深度思考。其中的亮点是提出了故事的力量具有两面性,要避免故事的滥用。同时在怎么做这一板块中,从创作者、传播者、听众这些角度出发进行思考,是可取的。

第三篇:



老师评语:得分 48 分。

立意准确,逻辑清晰严密。文章文学性较强,在第一段开门见山摆出观点,善于运用举例、引用等多种方式。但是每一段都在举例,缺少更深度的辨析。最后怎么做这一板块也论述的较为合理。比较明显的失分点在于每段都在举例,有堆砌材料凑字数的嫌疑。

第四篇:



老师评语:得分 40 分。

立意基本符合,和第一篇很类似,都是浮于表面泛泛而谈。把故事的作用在翻来覆去的说,没有挖掘出故事作用的内在重要性,也没有例子加以佐证。尽量不要出现 “ 首先、其次、最后 ” 等字眼,是很明显的失分点。

第五篇:



老师评语:得分 39 分。

对于材料内容切记不可直接引用,角度新颖,从个人思维、未来发展、民族形象等角度入手来论述。可惜没有说到如何开拓我们的思维,如何塑造我们对未来的价值观和眼界,也没有具体说如何展现民族形象的。说到底还是写的不够深刻,没有闪光点。

尽量不要出现 “ 首先、其次、最后、综上所述 ” 等字眼。这不是论述类文本,这是议论文,通过表达观点立场,加以论述分析自己的观点。分析论述观点是重点。

第六篇:



老师评语:得分 40 分。

立意基本符合,都是浮于表面泛泛而谈。把故事的作用在翻来覆去的说,要论述的是独特的故事与其价值认知,少说国家,多讨论青年成长!没有挖掘出故事作用的内在重要性,也没有例子加以佐证。

第七篇:



老师评语:得分 49 分。

做好故事的概念诠释是高下。谁的故事,谁讲故事,故事讲的好不好,故事的生活价值社会价值文化价值思考。

本篇文章并不像之前的文章切入点那么大,而是选取小的切入点,有条理的进行分析。这是很不错的。但是缺少一定的对于社会价值生活价值的反思,这是能不能获得高分的关键。

评分结束啦,不知道大家对这样的打分满不满意呢?

大家可以先猜猜这七篇文章分别是哪个 AI 写的,然后再看下面的答案。



第一篇和第二篇,分别是 OpenAI 的 GPT 3.5 和 GPT 4 。

第三篇是来自百度的文心一言。

第四篇是科大讯飞的星火。

第五篇是微软的 Newbing 。

第六篇是 360 智脑。

最后一篇,则是阿里的通义千问。

其中得分最高的两篇,分别来自咱们国内的大模型,通义千问和文心一言,据这位老师说,之所以给通义千问高一分,主要是觉得文心一言的论证方法较为单一,没有更深层次的思考,通义千问虽然切入口比较小,不过他能够有一定的思考在里面。



总结到这次的题目和大模型作文,老师的看法是:

这次作文题目审题门槛低,但概念诠释门槛高。立意基本不会出错,不过要得高分很难。要谈论独特的故事与其价值认知,少说国家,多讨论青年成长。谁的故事,谁讲故事,故事讲的好不好,故事的生活价值、社会价值、文化价值思考,所以做好故事的概念诠释是高下。

其实从这次的评分来看,现在的AI大模型,虽然很难拿到接近60分的高分,但是最高49分的表现,在实际情况下,也超过了不少的中游学生。

单从这次作文的得分上来判断,AI想要考顶尖大学恐怕还不行,但是,考一些稍好的普本应该是没啥问题。



不过也没必要太焦虑,想想,毕竟连曾经的围棋之王柯洁都败在AI手下,世超认为,人类在考试上被AI全面超越也是迟早的事。

只不过,AI只是工具。工具越好用, 占便宜的,不还是我们嘛。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

火箭将退役哈登13号球衣,费尔蒂塔表示他永远是一个火箭人

趣看热点 浏览 18464

丁真得到一匹名叫青龙的赛马网友:珍珠可以认真干饭了

趣看热点 浏览 18696

特斯拉称投资比特币后 市值蒸发2000亿美元

网易科技报道 浏览 19280

楼房玻璃被砸碎,墙体像被子弹打过!一地突降冰雹,最大直径9厘米

每日经济新闻 浏览 7892

45岁林嘉欣变胖了,成了大码美女

素素娱乐 浏览 4726

董洁直播走红,成小红书电商全村希望?

Tech星球 浏览 12000

强烈呼吁封杀汪峰!他频繁宣布恋情,给年轻人婚姻观造成负面影响

娱乐白名单 浏览 3582

牵手小鹏后,大众为何还豪赌Rivian

帮宁工作室 浏览 3247

俄罗斯一军火库发生爆炸,爆炸碎片最远可波及20公里内区域

趣看热点 浏览 18625

伊拉克安全专家:美军空袭公然践踏伊拉克主权

国际在线 浏览 5116

快手程一笑:过去一年,超过2200万名创作者在快手获得收入

网易科技报道 浏览 7375

朱珠带女儿看画展,打扮得光鲜亮丽,保姆一路同行

娱絮 浏览 11936

手感都留在昨天了?库里全明星17投仅6中,正负值-23全场最低

懂球帝 浏览 5041

9.4分国产神剧一夜口碑暴跌差评不断,全因"爹味"?

毒舌电影 浏览 11198

多视角直击战车驾驶训练

环球网资讯 浏览 11628

美国能源部长:中国电动车涌入美国市场的能力引人担忧

盖世汽车 浏览 4927

今年的毛衣,放松穿更好看!

LinkFashion 浏览 3817

乌克兰迎来“天大喜讯” 泽连斯基兴奋发自拍照

牛弹琴 浏览 7313

开发商未批先建楼盘烂尾5年 13次专题会督促解决未果

鲁中晨报 浏览 23132

戴尔科技集团发布2024财年ESG报告 重申ESG2025目标

网易科技报道 浏览 3206

佐拉:现代足球强调进攻且战术刻板,我和巴乔这样的10号已不存在

直播吧 浏览 6766
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1