关于ZAKER Skills 合作
钛媒体 29分钟前

AI 写小说的套路被扒光了: Claude 爱平铺,GPT 总做梦,Gemini 只会“他如何如何”

先做个小测试。

读下面这段话:

" 他感到胸口发紧,冷汗顺着脊背滑落,周围的灯光似乎暗了下来。空气中弥漫着一种说不清的气息,像雨后的泥土,又像某种古老的记忆。"

再读这段话:

" 张三很害怕。他不知道为什么,但他就是觉得不对劲。他想起了小时候外婆讲的那个故事。"

直觉告诉你,哪段是 AI 写的?

大概率是第一段。因为你已经 " 进化 " 出了鉴别 AI 写作的雷达——那些过度描写感官体验、把 " 恐惧 " 包装成一堆生理反应的文字,怎么看怎么像 ChatGPT 的手笔。

过去一年,网上充斥着各种 "AI 写作鉴别指南 ":爱用破折号?AI 写的。爱用 " 首先、其次、最后 "?AI 写的。形容词堆砌?AI 写的。但这些都属于 " 风格特征 " ——换一套提示词就能轻松绕过。很多人相信,只要会 " 调教 "AI,就能让机器写出和人类别无二致的文字。

但马里兰大学和 Google DeepMind 的团队告诉你:别费劲了,AI 写故事的 " 底层操作系统 " 和人类完全不同,改提示词也救不了

(论文地址:https://arxiv.org/abs/2604.03136)

一场 " 文学解剖 " 实验

2026 年 4 月,马里兰大学计算机系 Jenna Russell 团队联合 Google DeepMind 在 arXiv 上发表了论文StoryScope: Investigating idiosyncrasies in AI fiction(《故事显微镜:探究 AI 小说的特质》)。

5 月 28 日,沃顿商学院教授 Ethan Mollick 在 X 上分享了这篇论文,配文说:" 关于 AI 写作风格特征(破折号之类的)已经写了很多,但这篇论文关注的是 AI 的叙事特征。AI 和人类叙事之间存在令人着迷的差异,而且让 AI 用不同风格写作,也几乎改变不了这一点。"

Ethan Mollick 于 2026 年 5 月 28 日在 X 上分享的论文核心图表,获得 31.5 万次查看

短短一天,这条推文获得 31.5 万次查看,3000 多个点赞,近 600 次转发。AI 圈的学者、写作者、普通读者都被同一个问题吸引了:AI 到底会不会讲故事?

实验的规模大得惊人:他们收集了 10272 个写作提示(相当于写作题目),每个提示分别由人类作者和五个大语言模型Claude、DeepSeek、Gemini、GPT、Kimi 各写一篇故事,每篇约 5000 词。最终获得了 61608 篇故事,每篇提取 304 个叙事特征。

这是什么概念?相当于把六万多部小说的 " 骨架 " 一根根拆开,放在显微镜下比对,从情节结构、角色能动性、时间连贯性到对话密度,无所不包。

研究团队开发了一个名为StoryScope的自动化分析管道,能从 10 个维度自动归纳出细粒度的、可解释的叙事特征,涵盖情节、主体、时间结构等层面,然后对比 AI 生成的和人类写的,看看骨头架子到底有什么不同。

结果完全不看用词、句式、标点这些风格信号,仅用叙事特征,就能以 93.2% 的准确率区分人类和 AI 写作;在 " 六个作者分别是谁 " 的六类归属任务中,准确率达到 68.4%。作为对比,包含了风格线索的完整模型,准确率也就高出不到 3%。

换句话说,AI写作的 " 底层叙事逻辑 " 本身就是一张明牌。哪怕你把所有破折号都删掉、把所有 " 首先其次最后 " 换成口语化表达,你的叙事骨架依然会出卖你。

AI 写故事,到底哪里不对劲?

研究团队将核心差异归纳为五个维度。

AI太爱 " 说教 " 了。AI 写的故事,就像一个生怕你读不懂的语文老师。77% 的情况下,AI 的叙事者会直接点明故事主题:" 这个故事告诉我们…… ",而人类作者的这一比例只有 52%。AI 故事里的对话出现哲学讨论的比例是 59%,而人类只有 34%。

更明显的是:AI 对其他作品的引用全是 " 模糊的暗指 "(占比 72%),而人类作者更倾向于直接说 " 像《百年孤独》里那样 "...... 明确提及作品名称占 50%。AI 的潜台词似乎是:" 我告诉你一个道理,你好好听着。" 人类的潜台词则是:" 你自己品。"

你可能会说,这不是很负责任吗?把道理讲清楚不好吗?问题在于,好的故事从来不靠 " 讲道理 " 打动人。托尔斯泰不会在《安娜 · 卡列尼娜》结尾写 " 这个故事告诉我们,出轨没有好下场 " ——他让读者自己去感受。而 AI 做不到 " 放手 ",它必须把每件事都说透。

人类会 " 跳时间线 ",AI 只会一条道走到黑。人类讲故事喜欢玩花样:从葬礼开场,然后倒叙几十年前的事情,再突然闪回到现在。这种非线性叙事在 AI 那里几乎不存在。数据显示:79% 的 AI 故事 " 没有支线情节 ",而人类故事的这个比例是 57%。AI 故事的主角驱动型结局占 69%,而人类只有 46%。

人类更喜欢让故事 " 悬着 ",留给读者想象空间。人类故事的结局更偏向开放式模糊结局,让读者自己去琢磨 " 然后呢 "。AI 则必须给每个角色一个交代:主角要么顿悟了,要么接受了现实(占 47%),而人类只有 27% 会这么做。

研究团队举了个生动的例子:让 AI 和人类分别写一个悬疑故事,人类可能从葬礼开场,再倒叙几十年前的恩怨;而 AI 会从第一条线索开始,按时间顺序一路推进到大结局,中间没有任何 " 岔路 "。

AI对 " 身体描写 " 上瘾。回到开头的测试。AI 写作最显著的特征之一:不会直接说情绪,而是用身体反应和环境描写来 " 演 " 情绪

数据显示,81% 的情况下 AI 会通过生理感受和身体隐喻来传达情绪(人类只有 38%)。AI 使用嗅觉意象的比例高达 82%(人类 57%),还喜欢把环境设定作为角色内心状态的映射。人类作者写 " 张三害怕了 ",就是一句话。

AI 写 " 害怕 ":胸口发紧、冷汗直流、灯光变暗、空气中弥漫着某种气息……人类明确使用情绪标签(" 感到害怕 "" 很愤怒 ")的比例是 29%,而 AI 只有 8%。这暴露了一个本质问题:AI没有真正的情绪体验,它只能从训练数据中学习 " 情绪的外在表现 ",然后用一种 " 教科书式 " 的方式把它们堆砌起来。

它知道恐惧会让人出汗,但它不知道出汗是什么感觉。所以它的描写总有一种 " 用力过猛 " 的违和感——就像一个人从没吃过柠檬,却要写柠檬的酸味。

人类会 " 打破第四面墙 ",AI 只会闷头写。人类作者有一个 AI 学不会的绝活:和读者直接对话。" 你,亲爱的读者,一定猜不到接下来发生了什么…… " 这种打破 " 第四面墙 " 的写法,28% 的人类作品会用到,AI 只有 7%。

同时,人类写作提及具体文本和作者的比例几乎是 AI 的两倍(47% vs 24%)。人类能自如地在显性引用和隐性参考之间切换(37% 的人类作品是 " 混合模式 ",AI 仅 16%),而 AI 只能躲在模糊的暗指背后,仿佛生怕暴露自己 " 没读过什么书 "。

这绝不是因为 AI" 没读过 ",它的训练数据里什么书都有——而是因为它不知道什么时候该说 " 我在引用 ",什么时候该保持沉默。换句话说,AI的叙事是 " 没有读者意识 " 的叙事。它不在乎你在不在看,不在乎你能不能跟上,它只是在 " 完成任务 "。

AI的故事 " 撞脸 " 严重。AI生成的故事在 " 叙事空间 " 中挤作一团,而人类的故事散落在四面八方。人类的故事素材库更丰富 , 涉及更多地点、对话占比更高、更多支线融入核心主题(42% vs 21%),也更常塑造存在道德矛盾的主角(59% vs 38%)。

人类的主角可以是好人也是坏人,可以既善良又自私;AI 的主角则倾向于 " 伟光正 "。AI 的问题不是 " 写得不好 ",而是 " 写得都一样 "。它被困在一个狭窄的 " 默认叙事模板 ",出不来。即便你给不同的 AI 模型同一个提示词,它们写出的故事在叙事空间中的位置也惊人地接近。

每个 AI 都有自己的 " 叙事指纹 "

论文最有趣的发现来了:不同 AI 模型写故事的方式,就像不同作家的 " 笔迹 " 一样,各有各的毛病。

论文摘要中明确列出了三个模型的指纹特征—— Claude 的事件升级格外平淡,GPT 过度使用梦境序列,Gemini 默认使用外部视角描述角色。基于论文实验数据的进一步分析推断,DeepSeek 和 Kimi 也呈现出各自鲜明的叙事倾向。

什么意思呢?如果你看到一篇小说里频繁出现 " 梦境的转折 ",那八成是 GPT 写的;如果整个故事波澜不惊,情节推进像白开水,那大概率是 Claude 的手笔;如果每个角色都从外部描述,像在看人物档案卡,那 Gemini 跑不掉。更厉害的是,用这些 " 指纹 " 做六类归属(从五个 AI 模型和人类中识别具体作者),准确率高达 68.4%。

更扎心的是,论文还发现:所有 AI 模型生成的故事在叙事空间中聚集在同一个共享区域,而人类故事则散布在更广阔的空间里。

也就是说,不管你是 Claude 还是 GPT,不管你的 " 写作风格 " 如何调整,你们的 " 叙事 DNA" 其实是一家人。这种 " 叙事趋同 " 现象,可能是大语言模型训练范式的某种固有问题——它们都从相似的语料中学习 " 什么是一个好故事 ",然后得出了相似的结论。

" 去 AI 味 " 还有意义吗?

这项研究的出现,恰逢 " 去 AI 味 " 成为热门话题。就在论文发布的同一个月,中文互联网上掀起了关于 " 豆包体 " 的群嘲——那些 " 最 "" 非常 "" 深深地 " 满天飞的 AI 生成文本,让网友笑到打鸣。各种 " 消除 AI 味的不完全手册 " 也应运而生。与此同时,尼日利亚作家纳齐尔的小说《林间之蛇》被指控存在大量 "AI 写作痕迹 ",文学界的 AI 写作争议愈演愈烈。

但 StoryScope 的结论泼了一盆冷水:改词汇、换句式、调标点,这些都是 " 表面功夫 "。你让 AI 写 " 我很难过 " 而不是 " 一股悲伤涌上心头 ",改变不了它的叙事结构。你把所有破折号都删掉,也改变不了它偏爱单线程叙事、回避道德模糊性的 " 底层代码 "。

Ethan Mollick 在推文中特别强调:"要求 AI 用不同风格写作,也几乎改变不了叙事层面的这些差异。"

这其实触及了一个更深刻的问题:AI 到底能不能 " 像人类一样 " 创作?

从风格层面看,可以。提示词写得好,AI 能模仿海明威的简洁、博尔赫斯的迷宫、王小波的戏谑。但从叙事层面看,AI在 " 怎么编故事 " 这件事上,和人类有着根本性的不同——它不经历生活,不理解死亡,不知道什么是 " 欲说还休 ",所以它只能套用一个 " 标准的故事模板 "。

这或许才是 AI 写作和人类写作之间,最难以跨越的鸿沟。

论文的结尾,研究团队抛出了一个值得深思的问题:随着 AI 生成文本越来越多地混入人类创作中,我们如何定义 " 原创性"?

他们公开了 StoryScope 的全部代码、10272 个写作提示,以及 51336 篇 AI 生成的叙事文本(部分提示因生成失败未纳入),供学术界进一步研究。这更像是一种 " 预警 " ——当 AI 生成的文字洪水般涌入文学市场时,我们需要一套能穿透表层、直达叙事底层的 " 照妖镜 "。

而对于每一个用 AI 辅助写作的人来说,这篇论文或许也在提醒:别只想着 " 去 AI 味 ",想想你到底想表达什么。因为 AI 可以帮你写出通顺的文字,但它永远无法替你经历一段人生——而后者,才是好故事的真正来源。(本文首发钛媒体 APP,作者 | 硅谷 Tech_news,编辑 | 焦燕)

相关标签

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容

企业资讯

查看更多内容