
蓝鲸新闻 12 月 19 日讯(记者 朱俊熹)" 要衡量 AI 的发展速度,最重要的指标就是 tokens 调用量。" 字节跳动旗下云服务平台火山引擎总裁谭待表示。" 因为模型只有被调用才能发挥价值,而越有价值的模型,调用量就会越多。"
火山引擎在 12 月 18 日举办的 FORCE 原动力大会上披露,截至今年 12 月,豆包大模型日均 token 使用量已突破 50 万亿。相比今年 5 月公布的 16.4 万亿大幅提升,较去年同期增长超过 10 倍。目前有超过 100 家企业客户累计 token 使用量超过一万亿。
token 是大模型处理信息的最小单位,调用量反映的是模型在 API 调用、对话等使用场景中实际处理的 token 总量。从全球范围来看,云巨头谷歌 10 月称其各类产品和服务每月处理 1300 万亿 token。微软表示,如果单看其企业级 AI 平台 Azure AI Foundry 的 API 调用,今年 token 处理量超过 500 万亿,较此前增长超 7 倍。
国际数据公司 IDC 的报告显示,在 2025 年上半年的模型即服务(MaaS)市场中,火山引擎以 37.5% 的份额位居中国第一,排在其后的阿里、百度、腾讯分别占比 21%、15.5%、4.2%。MaaS 主要以 API 访问、模型中枢或会话接口来提供服务,大多以 token 调用量作为核心计费依据。IDC 统计口径并不包含单独销售的云基础资源层(IaaS)和算力收入,也未计入厂商自有业务调用量。
但若论 AI 大模型解决方案市场,厂商会将一整套可落地的大模型系统交付给企业客户,在企业自己或第三方的数据中心部署。从市场份额上看,百度、华为、商汤科技、科大讯飞等厂商占据了较为领先的位置。
作为对外开放字节技术工具的云厂商,火山引擎在推进 To B 市场时尤为强调 " 内外一体 " 的理念。12 月 18 日的活动上,火山引擎还上线了豆包助手 API,将豆包 App 的对话、思考、搜索等核心 Agent 能力,以 API 的方式开放出来,供企业直接使用。之后还将陆续开放多模态理解、深入研究、内容创作、视频通话等豆包助手能力。
" 大模型是 C 端、B 端都可以很容易体验到,To C 和 To B 之间会有很好的协同。" 谭待在接受媒体群访时表示。他提到,很多企业家在经常使用豆包 App 之后,都会询问能否让企业直接用上豆包的功能。尽管豆包的表现形式是一个 App,但其功能背后是不断迭代的 Agent 系统。基于此,火山此次将相关 Agent 能力以 API 方式对外开放。
谭待强调,豆包产品同样运行在火山的技术底座上,大模型服务平台火山方舟的能力,已在大规模用户使用场景中得到验证和锻炼。从全球来看,亚马逊、谷歌、阿里等表现突出的厂商,都在外溢自己的技术能力,从而在高投入背景下保持竞争力。就火山而言,其能力外溢也经历了从早期抖音同款工具到规模优势,再到当下 AI 能力的演进过程。
字节豆包 App 的月活长期稳居国内 AI 产品榜单首位,但近期阿里开始发力猛攻 C 端市场,以期激发与 B 端的协同效应。AI 产品榜数据显示,11 月豆包 MAU 达 1.68 亿,仍大幅领先于腾讯元宝、DeepSeek 等其他 AI 原生应用。而阿里将通义更名为千问后,其 MAU 环比增长 149% 至 1834 万。阿里核心管理层将 " 千问 " 项目视为 "AI 时代的未来之战 ",并成立千问 C 端事业群,首要目标是将千问打造成为一款超级 APP。
在此次活动上,火山引擎还正式发布了豆包大模型 1.8 及音视频创作模型 Seedance 1.5 pro。其中,豆包大模型 1.8 面向多模态 Agent 场景进行了定向优化。Seedance 1.5 pro 在音画同步技术上取得进展,支持环境音、背景音乐、人声等多种元素,实现毫秒级的音画同步输出。对白处理上还覆盖四川话等中文方言、英文及小语种。
谷歌今年 5 月发布的 Veo 3,是首次实现音画同步生成的 AI 视频模型。随后,OpenAI 的 Sora 2,以及国内的阿里万相 2.5、百度蒸汽机 2.0、快手可灵 2.6 等模型,均已支持音画同步的能力。
谭待表示,尽管不少厂商都已具备相关功能,但真正把音画同步做好并不容易,仍可能出现嘴型对不上、吞音等问题,背后涉及视频模型、大语言模型、端到端语音模型等能力。他认为,目前谷歌在整体能力上处于领先位置,字节正在加速追赶,并在部分领域已出现交替领先的情况。
对于 " 追赶 " 的衡量标准,谭待进一步解释称,可以从距离、速度、加速度来评估。" 要衡量距离,那有差距;衡量速度,可能短期内速度也有差距;但是我觉得加速度,我们现在在提升,最终肯定能看到越来越接近。" 他表示。