APP下载

关于ZAKER

Skills 合作

钛媒体 57分钟前

GPT-5.5 发布：两倍定价，半步进化

文 | 强调 Next

昨天（4 月 23 日），OpenAI 发布了 GPT-5.5，内部代号 "Spud"。距离 GPT-5.4 发布，只有七周。

七周一个大版本，放在行业里已经是相当高的频率。OpenAI 的策略是用持续的发布密度，让对手的每一次重磅推出都迅速失去窗口期。Anthropic 刚在本月发布了 Claude Opus 4.7 和 Mythos Preview，不到两周，话题就被抢回来了。

1 · 能力全景

这一版本的核心进步，集中在两个维度：长上下文理解和多步骤自主完成任务。

长上下文是实质性突破。在 MRCR v2 这个测试长文本信息检索的基准上，512K 到 1M token 区间的得分从 36.6% 跳到了 74.0%，翻了一倍。类似地，Graphwalks BFS（百万 token 下的图遍历测试）从 9.4% 涨到 45.4%，这是质变级的升级。对于需要处理大型代码库、长文档、跨会话上下文的工程和研究场景，这意味着少踩很多坑。

多步骤自主性也在 Codex 上有可感知的改善。官方的描述是 " 给它一个乱糟糟的任务，它自己拆解、用工具、检查结果、继续跑 "，以前这套流程经常在中途卡住，需要你手动推一把；现在卡住的频率明显降低。OSWorld-Verified（测试模型独立操作真实电脑界面的能力）得分 78.7%，和 Anthropic Opus 4.7 的 78% 基本持平，computer use 场景的两强格局已经形成。

2 · 用户真实反馈

Early access 测试者的反馈比跑分有意思。一位开发者说，GPT-5.5 在三分钟内解决了他卡了四个小时的 bug。另一位独立开发者描述得更直接：他在同一个 Codex 会话里跨越了 iOS App、后端服务、MCP 集成、客服回复起草等完全不同类型的工作。之前的模型在切换任务时经常需要重新铺垫上下文，现在它记得住。" 它从代码工具跨过了产品工具的界限 "。

NVIDIA 是目前最大规模的企业内测方，超过一万名员工在工程、法务、市场、财务等部门同时使用 Codex + GPT-5.5。他们报告的变化是：原来需要数天的调试周期，现在压缩到了几个小时。

另外有一个细节，GPT-5.5 帮助 OpenAI 分析了自己的生产流量，并重新编写了负载均衡的启发式算法，最终让服务自身的 token 生成速度提升了 20% 以上。模型参与优化了运行自己的基础设施。

不过，" 感觉 " 和 " 测评 " 之间还有落差。Every 的独立评测指出：GPT-5.5 在速度上明显快于 Opus 4.7，处理有结构化输出需求的任务（报告、课程大纲、会议纪要）表现出色；但在从零开始的创意产品设计上，" 细节好但整体感觉随机 "，还没到能完全替代 Claude 的程度。两款模型目前各有擅长的场景，并非简单的谁碾压谁。

3 · 中国开发者的真实处境

对中国开发者来说，GPT-5.5 的发布带来的首先是定价问题。

GPT-5.5 输出端单价 $30，DeepSeek V3.2 是 $0.42。差距是 71 倍。GPT-5.4 时代已经存在的 35 倍差距，这次直接翻了一番。

截至 2026 年 4 月初，OpenRouter 平台调用量前十的模型里，有六个来自中国：小米 MiMo-V2-Pro、阶跃星辰、MiniMax、DeepSeek V3.2、智谱、MiniMax。自今年 2 月以来，中国模型在该平台的周调用量已经超过美国模型。a16z 的数据也显示，选择开源技术路线的美国 AI 初创公司里，约八成在用中国模型。

这说明价格差距已经大到足以让决策变形。真实的企业实践是 " 分层调用 "：简单任务、高频场景交给中国开源模型，复杂推理、高精度任务才上 GPT 或 Claude。GPT-5.5 进一步拉高了顶端价格，会强化这个分层逻辑。

但不是所有人都能分层。有相当一部分中国开发者干脆没有稳定可用的 GPT 访问渠道，GPT-5.5 的发布对他们是一道观赏性新闻。国产模型在编程能力上正在逼近，DeepSeek V3.2、Qwen3.6 在 LMArena 编程榜单上已经跻身前十；但在复杂推理、顶层科研场景上，FrontierMath Tier 4 国产最优解尚不在同一量级，但差距在收窄。

4 · 结语

GPT-5.5 不是颠覆性升级，但也不是 " 挤牙膏 "。长上下文质变、代理编程改善、多职业知识工作接近上限。

不用过于关注它比上个版本强多少，而是在你的具体场景里。当前这一代模型的能力边界在哪里，你是在能力上限之内工作，还是已经在等待下一版本解锁什么新能力？如果你是后者，GPT-5.5 值得试一试试；如果你是前者，可以等 API 正式开放后再说。

至于 " 新类别的智能 " 这个说法，Greg Brockman 下次可能还会说。留意 GDPval 的数字就好，那个变化才是真正的拐点。

查看原文

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

ZAKER旗下免费视频剪辑工具

企业资讯

查看更多内容

Blockchain News

宙世代元宇宙

元宇宙党建解决方案

元宇宙文旅解决方案

元宇宙展厅解决方案

元宇宙行业峰会解决方案

元宇宙营销解决方案

元宇宙会展解决方案

元宇宙演艺节目解决方案

元宇宙博物馆解决方案

元宇宙图书馆解决方案

元宇宙校园解决方案

元宇宙企业展厅解决方案

元宇宙艺术展解决方案

元宇宙电商解决方案

融媒体解决方案

ZAKER智慧云

媒体解决方案

党建解决方案

公检法解决方案

智慧交通解决方案

高校解决方案

AI视频

AI视频剪辑

视频定制服务

AI智能客服

我的订阅

GPT-5.5 发布：两倍定价，半步进化

宙世代

一起剪

相关阅读

新加速卡性能近3倍于H20、支持FP4！华为：昇腾超节点系列产品全面支持DeepSeek V4

国外游戏行业正在进入“后震期”？55%的人被裁后未再就业，44%想离开

微软不讲武德：新Xbox硬刚两万块顶配电脑 售价才几千块！

Gartner：阿里云稳居中国第一 份额扩大至32.8%

一图看懂：当贝超级盒子H5 64GB版发布 大存储旗舰盒子回归

NVIDIA悄悄删了一颗芯片！RTX 4090公版PCB改版时隔三年首度曝光

爸爸模拟器2.0来袭！入手技嘉RTX 50高端硬件 白嫖热门3A

姚顺雨首交成绩单；OpenAI发布GPT-5.5

关于网易有道，我有几个新看法

iPhone 18 Pro Max与前代对比图曝光 摄像头或迎显著升级

商业航天企业资本化进程提速，供应链重构成商业航天降本关键

小米MiMo-V2.5语音模型正式发布：一句话生成声音、克隆真人音色

科创板再添硬核科技力量，高端测试仪器国产化先锋联讯仪器成功上市！

泰剧《WU อู》定档：双命运绑定的新叙事实验

维智捷纽交所上市后发布中国战略，聚焦客户共赢、数智运营与工程创新

最新评论

钛媒体

热门推荐

企业资讯

微软不讲武德：新Xbox硬刚两万块顶配电脑售价才几千块！

Gartner：阿里云稳居中国第一份额扩大至32.8%

一图看懂：当贝超级盒子H5 64GB版发布大存储旗舰盒子回归

爸爸模拟器2.0来袭！入手技嘉RTX 50高端硬件白嫖热门3A

iPhone 18 Pro Max与前代对比图曝光摄像头或迎显著升级