文 | 车芯 AIBot
你一定经历过这种时刻:
想买个吸尘器,打开短视频搜 " 吸尘器测评 "。第一条,博主说 A 款碾压全场;第二条,另一个博主说 A 款是智商税,B 款才是真香;第三条," 专业实验室实测 ",结论跟前面两个又不一样。
十条看下来,你比搜之前更糊涂了。
最后你选了那个粉丝最多的博主推荐的那款。收到货一用—— " 就这?"
你不是一个人。你只是数亿被测评 " 反复折磨 " 的消费者中最普通的一个。
2026 年 6 月 8 日,国家网信办与市场监管总局联合印发《网络测评活动规范》。12 条,不长。但如果你曾被测评坑过,这 12 条里藏着一把拆解整个乱象的刀。
先回答一个你最想问的问题:测评,还能信吗?
直接说结论:不是所有测评都不能信,但你刷到的大多数,确实不值得信。
中消协调查过一个扎心的数字:55.7% 的测评账号涉嫌 " 商测一体 ",35.7% 存在虚假测评。 翻译成人话——你刷到的每两条测评,就有一条是 " 既当裁判又当运动员 "。
什么叫商测一体?说人话就是:嘴上帮你避坑,手里挂着你买单的链接。一边评测,一边带货。你以为是避坑指南,其实是另一条通往坑的路。
这不是个别败类,而是整个行业的生存模式。一条测评视频成本不低——买 2-3 份样品存档,送检权威机构,有博主透露 5 项指标的螺蛳粉检测每包检测费近万元。没有商业收入,测评做不下去;一旦接了广告、挂了小黄车," 客观公正 " 就成了薛定谔的猫——你不打开那个链接,永远不知道它是死是活。
头部打假博主阿纯,单日直播间销售额突破 1600 万元,堪称打假界的顶流。然后呢?他 " 金钻级认证 " 推荐的面霜,被第三方机构检出玻色因含量不足 1% ——而非他宣称的 30%。打假博主,自己成了被打假的对象。
这就是中国测评行业最根本的悖论:让测评活下去的方式,恰恰是杀死测评公信力的方式。
那为什么明知道不可信,你还是忍不住看?
这才是最值得追问的地方。
不是你傻,是你焦虑。
面对一个你完全不懂的品类——洗地机、空气炸锅、防晒霜、婴儿辅食机——你有一种深深的无力感。你不信测评,但更不信自己。你没有时间去对比参数、去翻检测报告、去搞清楚 HEPA 滤网的等级差异。测评替你做了你做不了的事,哪怕你知道它可能掺了水。
这是一种 " 溺水者抓稻草 " 的心理:你不是相信那根稻草能救命,而是你实在没有别的东西可抓。
《规范》的出台,本质上不是要消灭这种焦虑,而是要让你至少知道——你抓的这根稻草,是稻草还是蛇。
这 12 条里,最狠的不是你想的那条
多数人关注的是第四条—— " 涉及产品功能、性能等项目测试,应当委托具有法定检验检测资质许可的检验检测机构 "。这条够硬,但也在意料之中。
真正精妙的是第五条:
别小看这几个字。它做了一件前所未有的事——把 " 测评 " 这个混沌的概念,一劈为二。
" 测 " 是客观行为:用仪器、用标准、用可重复的方法论得出数据。" 评 " 是主观表达:我觉得好喝、我觉得好用、我觉得值。
过去十年,这两件事被搅在一起,浑水摸鱼的空间巨大。一个博主拿自己的口味偏好当 " 专业测评 ",把 " 我觉得好喝 " 包装成 " 全网最好喝 ",你根本分不清哪句话有数据支撑、哪句话只是嘴上功夫。
《规范》的逻辑很清晰:你选哪条路都行,但必须让我知道你走的是哪条。 选 " 测 ",就接受专业机构和标准体系的约束;选 " 评 ",就老老实实承认这只是个人体验。
这不是限制表达自由,而是还你一双分辨的眼睛。以后刷到测评视频,先看它有没有标 " 仅为个人体验 " ——如果有,你就知道该怎么掂量它的分量了。
大洋彼岸有一面镜子,照出了一个更残酷的真相
1936 年,美国《消费者报告》(Consumer Reports)创刊。90 年来,它立下四条铁律:非营利、拒接企业送测、拒登广告、匿名采购。 年收入 2.38 亿美元,绝大部分来自订阅和捐赠,零广告。50 个实验室、150 多名测试专家、60 多个匿名采购网点,每年评测数千种产品。
它曾让铃木汽车退出美国市场,曾逼苹果为 iPhone 4 天线问题派发保护套,曾推动《消费者产品安全法》立法。80 余年来与厂商打了 16 次产品诽谤官司,一单未输。
90 年的积淀,一句话概括:公信力不是被赋予的,是用一次又一次的 " 自我克制 " 换来的。
中国呢?中国的测评行业,是在短视频和直播带货的浪潮里被催熟的——从 Consumer Reports 式的专业机构阶段,直接跳到了 " 影响者测评 " 阶段。先有流量,后有专业;先有商业,后有规范。顺序反了。
所以《规范》试图用法规做的事,其实是 Consumer Reports 用了 90 年自愿选择做的事:独立于利益、透明于标准、克制于表达。
问题是——美国那套公信力,是 " 我选择不做 " 换来的;中国这套规范,是 " 你被要求做 " 推出来的。自愿与强制之间,隔着信任的真正根基。
这才是《规范》最大的局限:它可以清除最恶劣的造假者,可以强制披露利益关系,可以划清 " 测 " 与 " 评 " 的边界——但它无法制造一种东西:消费者愿意为 " 可信 " 付费的市场土壤。
Consumer Reports 之所以 90 年不倒,不是因为美国法律管得严,而是因为数百万订阅者用真金白银投票,让独立测评有了不依赖广告的活路。中国消费者目前还没有这个习惯——免费看测评、通过链接下单,太丝滑了,丝滑到没人愿意为 " 可信 " 本身掏钱。
当一个行业的公信力需要靠法规来托底,而不是靠消费者的选择来奖赏,这个行业的自我净化能力就始终缺了一角。
真正的变局,不在博主身上
表面上看,《规范》管的是测评博主和 MCN。但真正的利益攸关方,是平台。
对平台而言,测评内容是交易转化率的关键润滑剂。小红书 2025 年广告收入达 34.2 亿元,其 " 种草 - 比价 - 复购 " 闭环的 LTV/CAC 比高达 4.8。但如果上海消保委的监测是对的—— 23% 的测评视频存在信息误导——那平台赖以生存的 " 真实种草 " 叙事,就有了结构性裂痕。
《规范》第十条把平台责任写进去了: " 加强网络测评信息内容管理,及时受理处置投诉举报。" 平台不能再假装自己只是中立的信息管道。当测评内容附带了购买链接、带上了 " 广告 " 标签,平台就从信息分发者变成了交易链路的一环——你收了交易佣金,就不能再说 " 内容与我无关 "。
对品牌方也是双刃剑。一面,它保护了被恶意诋毁的企业——汽车行业已有先例:博主 " 龙哥讲电车 " 三案累计被判赔 226 万元;博主姚某强因发布方程豹虚假测试信息,被判赔 201 万元。另一面,品牌自己 " 定制测评 " 的灰色空间也消失了——那些精心准备给博主的 " 特供样品 ",在第三条面前无处遁形。
AI 要来了,这 12 条够用吗?
《规范》里有一条容易被忽视但极具前瞻性的规定:" 保留测试样本以及测试数据、图片、视频等记录,确保测试数据、结果可以追溯。"
这不是给今天的乱象打补丁,是给明天的 AI 造假修防火墙。
《规范》发布前一个月,中央网信办启动 " 清朗 · 整治 AI 应用乱象 " 专项行动,首次将 AI 批量生成的虚假种草笔记明确定性为违法内容。更早之前,杭州中院判了中国首例 AI 内容不正当竞争案:两家公司用 AI 工具一键生成某社交平台 " 种草 " 文案,诱导用户发布,被判赔 10 万元。
当 AI 可以把 " 实测 " 文案、检测图片甚至视频证据批量生成时," 可追溯 " 就成了鉴别真伪的最后一道闸门。没有样本留存、没有数据链条,所谓的 " 实测 " 就可能只是 AI 的输出。
这一条,是 12 条里最面向未来的。
所以,以后看测评怎么办?
三句话,够用:
1. 先找标签。 如果标了 " 仅为个人体验 " 或 " 主观感受,仅供参考 " ——当种草看,别当依据用。如果没标,按《规范》它就应当有检测依据,你可以追问它依据的是什么标准。
2. 再看利益。 挂了购买链接的,按《规范》应当标 " 广告 "。标了 " 广告 " 不等于一定不可信,但至少你知道这是一笔交易。没标却挂链接的,直接拉低信任权重。
3. 最后问自己一个问题: 这条测评是在帮我做判断,还是在替我做判断?真正有用的测评给你数据和逻辑,让你自己下结论;想操控你的测评只会给你情绪和结论,让你来不及思考就点链接。
法规能拆开 " 测 " 和 " 评 " 的字面纠缠,但拆开利益与公信力的深层死结——最终还得靠你自己的判断力,和你在每一次消费决策中的选择。
你用脚投的每一票,比 12 条法规更有力量。