关于ZAKER Skills 合作
钛媒体 27分钟前

大厂 AI,激战高考

文 | 定焦 One(dingjiaoone),作者 | 王璐,编辑 | 魏佳

又是一年高考季。考场内,千万考生奋笔疾书;考场外,几家互联网大厂的 AI 正围绕高考展开新一轮比拼。

腾讯元宝与 QQ 浏览器联合发布 " 元宝高考通 ",并称其为行业首个高考咨询师 Agent;夸克推出全新升级的高考频道,为考生免费提供 " 高考搜索 "" 智能选志愿 "" 志愿表 "" 志愿报告 " 等功能;百度 APP 内,2026 高考模块已经嵌入到文心助手的核心位置。

这并非大厂第一次盯上高考。早在 2025 年,夸克、QQ 浏览器、百度、豆包就都上线了志愿填报功能。一年过去,这些产品几乎都做了升级。从考前复习、考中安全限制到考后志愿填报,大厂 AI 正被更深地嵌入高考服务的每一个环,各家的投入也在持续增加。

从产品的能力上看,今年的工具确实更进一步,从单轮问答升级为多轮对话,从关键词检索升级为 Agent 式的深度搜索,用起来更简单。但是,使用门槛的降低,并不意味着结果更可靠。有人用 AI 备考,精准锁定薄弱知识点;也曾有人用 AI 报志愿,差点滑档。

带着这些观察,「定焦 One」与多位考生、报志愿工具开发者聊了聊。大厂 AI 为什么集体押注高考这个场景?这些越做越 " 聪明 " 的工具,优点和局限分别在哪儿?以及,在技术被快速推向市场时,其决策的 " 黑箱 " 问题是否被忽略?

01. 从备考到填志愿,大厂 AI 疯狂入局

今年的高考季,各大厂的 AI 布局比往年更猛,表现最突出的是阿里、腾讯、百度、字节四家。

腾讯今年主打 " 元宝高考通 ",定位为 " 行业首个高考咨询师 Agent",重点突出多轮对话、个性化规划与权威数据支持,试图在 "AI 顾问 " 的定位上形成差异。阿里旗下的夸克今年在高考服务上继续加码,不仅覆盖 " 模拟选志愿 "" 志愿表 " 和 " 志愿报告 " 等全流程功能,还全部免费,背后同样依赖的是 Agent 能力。

百度高考则依托搜索入口与文心大模型,意图在用户 " 搜答案 " 的过程中,将其转化为使用 AI 高考服务的起点。字节的豆包并未在考前专门上线 " 高考专区 ",但用户仍可通过其通用对话入口获取志愿预测与报考建议。参考去年在志愿填报阶段上线专区的节奏,今年它大概率也会在相应节点推出针对性服务。

尽管这些产品并非今年才首次亮相,但均基于过往版本实现了重要升级。

从产品能力看,今年的工具更强调多轮对话、个性化推荐和更权威的数据资源。比如,AI 工具会主动追问细节,结合用户的多轮输入,动态调整方案。同时,在数据上,各平台不仅提供基础信息,也接入了更权威、及时的招考数据,让结果更准、更稳。

从服务环节来看,这些工具覆盖了备考、考中乃至考后志愿填报的全阶段。

先看考前。几家大厂的 AI 聊天机器人、AI 浏览器等明星产品中均支持调取全国高考真题,考生可以让大模型分析命题规律、核心考点,也可以让它梳理错题、归纳薄弱知识点。

2025 届的考生 " 猜想 ",在复习阶段一直用 AI 工具锁定自己的薄弱知识点," 比如语文文本阅读里我一直搞不定叙述节奏这类题,我就直接让 AI 帮我找相关例题。"

类似的用法还有很多。有考生用 AI 整理政治大题的答题模板,让其从大量真题中抽取高频答题句式;有人用 AI 模拟英语作文批改,打磨固定句型;也有人把历年数学压轴题的解题思路让 AI 逐步拆解、总结方法。从单个知识点到不同学科规划,大厂 AI 工具的复习用法千人千面。

考生陈艾说,自己高三最后冲刺阶段几乎每天都在用 AI 做文言文专项练习。" 我把自己做过的错题发给它,让它给我出五道同类型的题,再帮我归纳这一类题的审题方法,比自己翻书找题快多了。"

到了考试期间,AI 的姿态变了。今年高考期间,豆包、元宝等 AI 工具普遍启动了功能管控,限制拍题识图等类似功能。

高考期间豆包的拍照答疑功能无法使用

这算是高考期间的惯例动作,目的是保持考试公平。

不过,高考期间,用户依旧可以用 AI 工具识别风景、美食,且文字对话也不受影响。猜想就在去年物理考试结束后、下一场开始前的间隙,用 AI 做了一次临时的 " 心理咨询 "。

他考完物理后,感觉自己只能得 70 多分,几乎崩溃,于是向 AI 求助。AI 告诉他 " 物理已成定局,如何带着这个遗憾去专注考下一科,是接下来真正的考题 ",并建议他快速切割对上一科的纠结,并提醒要防止 " 优势学科翻车 " 的意外。这番话成了他调整状态的关键。他觉得虽然 AI 给出的建议道理浅显,但在失利真实发生的那个时刻,自己也需要一个绝对冷静的 " 旁观者 " 来点明。

而报志愿,才是大厂这场较量真正的主战场。

目前大厂的 AI 报志愿工具产品形态大体一致:用户输入所在省份、科目组合、高考成绩,再设置院校类型和专业偏好,AI 生成便能 " 冲、稳、保 " 三档推荐清单,并附上历年录取分数线、排名走势和专业就业分析。部分产品还支持多轮对话,用户可进一步追问相关问题。

在收费上,主流工具目前基本都基础功能免费,这也是它们能快速铺开的关键。但涉及专家咨询、一键填报等功能部分工具则需要 VIP。

尽管框架相似,四家大厂的侧重点各有不同。

阿里夸克脱胎于搜索、深耕高考场景多年,主打数据的精准和深度,是其中唯一推出自研高考志愿大模型的大厂;腾讯则把志愿填报放进 QQ 浏览器和元宝,提供渐进式、对话化的填报体验,背靠社交流量做触达;百度同样依托搜索生态,打的是 " 信息广度 " 牌;字节豆包则侧重快速触达与功能补充。

个人 AI 志愿填报工具开发者 Michael 指出," 各家的核心推荐逻辑其实很像,真正的差距不在模型,而在数据、产品定位和生态。" 他解释,技术上,主流工具都已采用智能工作流,内核都是通过 " 自动规划 - 搜索 - 反思 " 的循环,来替代传统的人工查找。

02. 有人靠 AI 逆袭,有人因此差点滑档

大厂如此密集地布局,考生最关心的是,这些工具是否真的好用。而不同用户的感受区别很大,这恰恰划出了 AI 能力的边界。

一方面,凡是涉及整理、归类、匹配的活儿,AI 都做得又快又好,能把考生的焦虑迅速转化成具体行动。

猜想表示,AI 更大的价值,在于化解了他有时 " 无从下手 " 的复习焦虑。"AI 的检索和分析能力,用在趋势预测、脉络梳理上很有帮助,尤其是对文科学习。它能把散落的信息快速整合,帮你抓住重点。" 这也解释了为什么他在考试心态崩溃时会转向 AI,在之前的学习中,AI 已扮演了一个相对高效、可信的 " 信息整理者 " 的角色。

陈艾则用 AI 来提升英语写作。" 我把自己的作文发给它批改,它不只纠正语法,还会建议更地道的表达、更清晰的逻辑结构。这种反馈以前只能靠老师,但老师很难每天兼顾到每个人。"

在这些场景中,AI 的优势很明显,它能对结构化信息进行快速处理、归类与匹配,从而高效完成那些以往需消耗大量时间的任务。在这一点上,它确实是个称职的效率工具。

但换到另一种任务,一旦涉及深度理解和复杂决策的场景时,尤其涉及准确性和严谨性时,AI 的短板就暴露出来了。

考生林子涵就有过不愉快的经历。他在核对报考数据时,发现了数据误差:AI 推荐院校的最低录取分数虽与官方一致,但其对应的录取排名却比实际落后了上百名。这个偏差足以让 " 冲 " 的学校希望渺茫,也让 " 稳 " 的选择不再稳妥,很有可能滑档,好在最后一天他发现了这个问题,重新调整了方案。

猜想也使用了 AI 报志愿工具。他认为这类工具在信息检索和整合上确实方便,能快速生成基于分数与位次的备选列表,省去了手动查询的麻烦。但短板同样突出,推荐结果缺乏个性化与针对性。他最终被录取的大学,也不在 AI 此前推荐的名单中。

在他看来,AI 的推荐逻辑过度依赖分数匹配,同一套方案往往被推送给分数相近的大批考生,极易导致他们在那些只招 1 至 2 人的专业上形成 " 志愿扎堆 ",反而降低了录取概率。此外,AI 也难以细致结合考生的个人条件。比如猜想的选科是 " 物化政 ",并未选考生物,可 AI 仍反复推荐与生物强相关的专业,而他几乎无法有效过滤这类明显不匹配的推荐。

即便是相对简单的学科答疑,AI 也并非万无一失。

有考生反映,用 AI 解答数学题时,AI 给出的解法明显超出了高中考纲范围。比如,让 AI 解一道基本不等式的题,常规做法是代数变形,但 AI 给出了 " 求导 " 的思路,而求导是大学微积分的内容。

大模型从业者方芳表示,出现该问题的原因可能在于,虽然大模型拥有丰富的知识,但缺乏对特定场景的深度理解与严格遵守的能力,导致给出正确但无效甚至误导性的建议。

可以看出,AI 在帮助考生整理错题、归纳考点、改作文这类 " 处理信息 " 的任务时,确实能帮考生省下大量时间,但涉及复杂决策的判断以及精准决策的环节,它给出的答案仍然需要人来兜底。

03.AI 高考工具:有进步,但局限更大

需要客观指出的是,经过一年的迭代,大厂的 AI 高考工具在交互体验和信息丰富性上确实有所提升。Michael 表示,仅仅将底层大模型更新到最新版,志愿推荐的结果就会明显改善。" 基座模型进化太快了,我们甚至不需要做太多针对性优化。"

实际上,AI 高考工具确实在变 " 强 ",但这种变强更像是一个 " 搭了顺风车 " 的自动升级。而真正决定工具能力天花板的,是数据完整性、算法、对推荐结果的长期追踪验证等核心问题,这些都很难靠单一的模型升级解决。

首先是大模型固有的 " 逻辑幻觉 " 问题没解决。

" 逻辑幻觉 " 并非程序漏洞,而是大模型基于概率生成的特性所致。在高考辅导场景中,它体现为 AI 给出的题目解析,推理过程可能存在漏洞或错误,最终答案却可能是正确的。

" 这在架构层面无法彻底消除,是技术特性决定的。" 方芳表示。但这也意味着,学生可能面对的是一份逻辑有误却被呈现为 " 标准思路 " 的解析。照着学下去,其风险远大于单纯做错一道题。

其次是错题分析的 " 表面化 "。

目前 AI 的错题分析,大多停留在 " 识别错误 ",还不能 " 追溯成因 "。比如它能指出 " 这道题考查的是等比数列求和公式 ",却回答不了 " 你为什么在这里出错 "。

原因在于 AI 只能获取题目文本和最终答案,但看不到用户的思考过程,因此 AI 往往只能给出 " 加强这个知识点 " 这类通用建议,本质还是一个高效的信息识别工具,做不了真正能进行认知诊断的学习助手。

最后是志愿推荐中存在 " 数据黑箱 " 问题。这或许是所有局限中最为关键、也最受争议的一环。

志愿推荐工具的底层逻辑通常是一个不透明的系统,各平台所使用的历史录取数据来源、清洗规则、预测模型,均被视为商业机密,缺乏统一标准,也缺少第三方监督。

这导致的后果是,同一份成绩输入不同 AI 报志愿平台,推荐结果可能大相径庭。比如,「定焦 One」以一位江苏考生(选科历地政,总分 627 分)为例,用不同 AI 平台进行模拟填报,为了在不同平台间进行更聚焦的对比,我们特意限定了报考地区为北京、上海,结果显示,在 " 冲 " 的院校档位上,因可选项有限,各家结果有一定重合;可到了 " 稳 " 的院校档位,各家给出的名单差异明显。

夸克高考、元宝高考通、百度高考给出的部分较可稳妥报考的学校

这主要是因为," 稳 " 在志愿填报中并没有统一的官方标准,省考试院每年只公布各校的最低投档线,至于 " 高出多少分才算稳 ",由各平台自行把握。尤其当考生将目标限定在北京、上海这类热门地区时,可选的院校数量本就有限,此时哪怕不同平台对 " 稳 " 的判定只差三五分,最终生成的推荐名单也可能截然不同。

这种差异究竟是因为某家平台采用了更保守的预测模型、还是接入了未公开的数据,又或是算法在排序时受到了商业合作因素的影响,外界都难以知晓。Michael 表示,平台虽然可以通过 " 技术约束 " 让结果更准,但 " 约束 " 具体是技术优化,还是商业考量,是一个难以被验证的问题。

方芳则指出了更深的问题," 当推荐结果出现偏差时,AI 报志愿工具可将其归因于数据复杂或算法概率,用户却难以追溯真正原因,这也让用户很难信任 AI 工具。一个无法被追责的系统,很难赢得真正的信任。

这三道坎叠加在一起,决定了当下的 AI 高考工具本质上还是一个辅助工具,而非可靠的决策建议者。

但即便如此,大厂还是会持续投入。高考是几乎不能出错的人生大事,谁能证明自家工具可靠、有用,谁就能赢得用户长期的信任。而每年上千万考生家庭,本身就是一个高频又高价值的入口。所以,大厂表面上比的是高考工具,争的却是未来的用户、数据、生态,以及 AI 服务的主导权。

只不过,考生在把人生选择交给 AI 之前,还得多留个心眼。

* 题图及文中配图来源于 pexels。应受访者要求,文中方芳、陈艾、林子涵为化名。

相关标签
ai

最新评论

没有更多评论了

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容

企业资讯

查看更多内容