文 | AI 唱反调
今天最重要的事情是什么?就是高考!没有之一!
听说高考期间豆包、DeepSeek 等模型一度屏蔽了 " 做题 " 相关功能,我们当时还以为是平台主动规避,结果考完试功能立马恢复,合着是怕 AI 提前交卷?不管怎样,这事儿反而让我们更来劲了:如果真的让 AI 去写高考作文,它们谁能争夺状元之位?谁又是吊车尾呢?
所以,我们把最先爆出的全国一卷作文题丢给七款大模型—— DeepSeek、Kimi、通义千问、豆包、文心一言、智谱清言、腾讯元宝,不加任何优化提示,让它们自由发挥。看看谁能上清北,谁去上大专。
不过,我们确实也找不到真实的高考语文老师来审卷子,只能让 Claude 设计评测标准,让 ChatGPT5.5 来帮我们判卷,毕竟这也代表了文本模型现下几乎最强的水平。

录取结果:清北到复读
最高分 56.5,最低分 49.5,差距近 7 分。在高考作文的江湖里,这是清北到复读班的距离。
不墨迹先给结果。

七款 AI 全部达标—— 800 字以上、自拟标题、不跑题。基础门槛已经 100% 拿下。但 " 像人 " 这件事,差距立刻拉开。
这道题在考什么
2026 年全国Ⅰ卷的核心要求就一句话:选一个你成长过程中理解发生变化的词,写出变化的过程和意义。
三个陷阱:必须锚定一个词,必须写 " 我变了 " 而非 " 词是什么意思 ",必须有真实的成长印记。说白了,考的不是写作技巧,是 " 像不像人 "。
清北选手:Kimi
Kimi 以 56.5 分拿下第一。它选 " 自由 " 却不写 " 从束缚到自由 ",而是写 " 从自由到自律 " ——反直觉切入,天然抓眼。
更关键的是认知链极其扎实:小时候觉得自由是不用上学,高二独居一个月玩到凌晨三点、外卖盒堆满房间、胃痛发作,月底母亲推门只说 " 你瘦了 ",后来读康德 " 自由不是想做什么就做什么 ",实习遇到前辈说 " 真正的自由是建立轨道后的余裕 "。

唯一短板:时代背景偏弱。但在高考作文阅卷中,个人叙事的真挚往往比宏大叙事的空泛更打动人。
985 选手:文心一言
文心一言 55.5 分排第二。它的杀手锏是细节密度:
" 楼道里飘来邻居家炖萝卜的香气 " " 暖黄的灯光落在她发梢 " " 视频镜头里爸爸举着的红薯 "
那个 " 爸爸举着刚烤好的红薯凑到镜头前 " 的画面,笨拙的父爱极具感染力。语言自然度同样拿了满分。

复读选手:豆包
豆包 49.5 分垫底。问题很典型:选了最安全的 " 担当 ",写了最标准的 " 三段论 " ——小时候觉得担当是英雄、中学觉得担当是值日、长大觉得担当是家国。这是 AI 写成长类作文的惯用套路,也是阅卷老师最容易识别的套作模板。
语言上排比句密集:" 实验室里青年科研者潜心钻研……田野间基层工作者扎根乡土……危难前青年志愿者挺身而出…… " 不需要真实细节,只需要把正确意象并列堆砌。ChatGPT 直接给出 "AI 腔明显 " 的扣分。

对比 Kimi 的 " 外卖盒堆满房间 "" 胃痛 "" 母亲推门 ",豆包在这个维度交了白卷。
几个关键发现
选词即战略。 Kimi 反着写 " 自由 "、文心写 " 回家 " 的情感浓度、清言选 " 附近 " 的社会学深度,都拿到了高分。豆包选最安全的 " 担当 ",反而最套路。新颖的选词让阅卷老师产生期待,烂大街的词让文章还没读就陷入疲劳。
AI 腔可去,但需要刻意。 高分两篇的共同策略:少用排比和正确结论,多用叙事和认知挣扎。AI 擅长给 " 正确答案 ",人类魅力在 " 纠结过程 "。
时代与个人融合是天花板。 七篇无一篇两项同时高分。Kimi 个人叙事强但时代感弱;清言时代感强但个人经历弱;DeepSeek 时代最强但个人完全隐身。AI 很难同时驾驭 " 大时代 " 和 " 小自我 ",硬连接往往变成 " 硬拔高 "。
56 分是清北线,60 分仍是禁区。 Kimi 的 56.5 分已具备冲击省级优秀作文的实力,但距离满分差一口气——那口气叫 " 不可复制的个人生命体验 "。独居故事很真,但仍是 " 可能发生的典型故事 ",而非 " 只有这个人才能写出的独家记忆 "。
结语
AI 可以考上清北,但写不出凌晨三点盯着天花板的恍惚,写不出高铁站忽然意识到 " 我说的是 ' 我走了 ' 而不是 ' 我回家了 '" 的刺痛,写不出山坳里红薯的焦香。
这些带着体温的细节,是 AI 的盲区,也该是教育的重心。当作文的分数可以模拟时,生命的厚度无法生成。
实测时间:2026 年 6 月 7 日 | 评测标准:Claude 设计,ChatGPT 执行 | 模型:DeepSeek、Kimi、通义千问、豆包、文心一言、智谱清言、腾讯元宝,更多测试内容可联系我们获取!