SuperCLUE 9 月总榜出炉：华为盘古 718B 模型开源第二

【CNMO 科技消息】CNMO 注意到，在最新一期的 SuperCLUE 中文大模型通用基准测评中，华为盘古 718B 模型获得开源第二的好成绩。

华为盘古大模型

CNMO 获悉，此次测评通过数学推理、科学推理、代码生成、智能体 Agent、幻觉控制、精确指令遵循六个维度进行核心能力评估，共计 1260 道题目，全面检验大模型的综合实力。综合开源、国产两个维度来看，前三名依次为：DeepSeek-V3.1-Terminus-Thinking、openPangu-Ultra-MoE-718B 和 Qwen3-235B-A22B-Thinking-2507。其中，拥有 7180 亿参数体量的华为盘古 718B 模型，并未依靠简单的数据堆砌，而是凭借独特的 " 思考 " 能力脱颖而出。

据报道，openPangu 团队在后训练数据构建中，严格遵循质量优先、多样性覆盖、复杂度适配三个核心原则，并建立了一套覆盖 " 数据生成 - 科学筛选 - 精准增强 " 的全流程方案。

在质量优先方面，团队构建指令数据质量评估体系，结合规则、模型和人工三重审核机制，有效清理低质量样本；多样性覆盖上，从领域和任务类型两个维度进行设计，运用去重和压缩选样算法，保证数据覆盖广度且避免冗余；复杂度适配环节，通过推理步骤、概念抽象度、计算复杂度等指标量化任务难度，并利用自迭代拒绝采样策略，重点训练中高难度任务。这种对数据质量的严格把控，成为了提升模型在复杂场景下推理能力的关键因素之一。

刘强东的“资本版图”再下一城

钛媒体 5小时前

宙世代元宇宙

元宇宙党建解决方案

元宇宙文旅解决方案

元宇宙展厅解决方案

元宇宙行业峰会解决方案

元宇宙营销解决方案

元宇宙会展解决方案

元宇宙演艺节目解决方案

元宇宙博物馆解决方案

元宇宙图书馆解决方案

元宇宙校园解决方案

元宇宙企业展厅解决方案

元宇宙艺术展解决方案

元宇宙电商解决方案

融媒体解决方案

ZAKER智慧云

媒体解决方案

党建解决方案

公检法解决方案

智慧交通解决方案

高校解决方案

AI视频

AI视频剪辑

视频定制服务

AI智能客服

我的订阅

SuperCLUE 9 月总榜出炉：华为盘古 718B 模型开源第二

宙世代

一起剪

相关阅读

郭明錤：小米17系列出货量下调20%预计约800万台 标准版销量被苹果17压制

苹果手机闹钟又不响了！不是因为节假日 而是更新了iOS 26

七彩虹iGame柒小希首套纪念版硬件套装开售！仅限量200套：三大定制组件

清华大学给细胞装上“高清显微镜” 有了两大惊人发现

云与AI，如何托举 Z 世代的创新野心

抢跑“双11”：多平台定档10.9，消费节继续“减法革命”

安卓旗舰跑分逆袭！国产手机性能领先iPhone 17系列

刘强东的“资本版图”再下一城

牛上天的工艺打造！一加15原色沙丘官图公布

提升网络性能！华为完成5G-A关键技术RAN AI技术验证

同德首款！推出RTX 5050 StormX单风扇显卡：170mm ITX设计

1元/百万token，8.9ms生成速度，Aengt落地“成本账”与“速度账”都要算

美团发放1亿元“不闯红灯”安全奖金：激励骑手安全跑单

浙大人工智能研究所郑小林：AI普惠正在成为可能

王健林限高取消！“一个亿小目标”曾火遍全网，能否东山再起？

最新评论

手机中国

热门推荐

热门订阅 换一批

Z汽车

郭明錤：小米17系列出货量下调20%预计约800万台标准版销量被苹果17压制

苹果手机闹钟又不响了！不是因为节假日而是更新了iOS 26

热门订阅换一批