关于ZAKER Skills 合作

科大讯飞发布端侧多模态大模型与自研声学系统,推动智能座舱向主动服务演进

科大讯飞在北京车展上推出新一代多模态智能座舱解决方案,包含端侧部署的 SparkAuto-EMM 大模型、iFLYSOUND 氮化镓母带级声学系统及面向海外市场的多语言交互方案。该方案旨在实现从 " 被动响应 " 到 " 主动服务 " 的转变,构建涵盖感知、理解、决策、执行与主动服务的完整闭环。 新发布的端侧多模态大模型支持 0.5B 至 7B 参数规模的阶梯式部署,适配不同算力平台,在无网络环境下仍可运行,并保障用户数据不出车。该模型能理解模糊语义和复杂意图,例如根据 " 有点闷 " 自动判断应开窗或启动空调,并支持多步骤任务规划,如 " 先加油再去机场,路上找一家川菜馆 ",实现任务拆解、路径规划与服务调用。 同时,科大讯飞构建三层智能体生态:自研高频场景智能体、深度集成生态伙伴(如美团)的车端优化智能体,以及长尾场景的可扩展解决方案。所有智能体均围绕车载场景定制,强调首轮命中率高、交互路径短、弱网或离线可用,并兼顾驾驶安全。 针对中国汽车出口需求,其海外星火助理覆盖 32 种语言、60 个国家和地区,采用母语者构建的语料库和 52 个高质量 TTS 发音人,结合本地数字生态(如导航、音乐、新闻),提供符合文化习惯的交互体验。目前中国出海前十车企中已有 8 家与其合作,累计搭载于 100 多款量产车型。 在声学领域,iFLYSOUND 采用氮化镓音频功放架构,单通道峰值输出达 300W,配合红宝石薄膜电容、低密度翅片散热等技术,在音质提升 20%、重量降低 30% 的同时控制成本。该系统已获 QQ 音乐臻品音质认证,并搭载于魏牌 V9X、东风日产 NX8、极氪 007GT、奇瑞星途 EX7、风云 T9L、昊铂 S600 等车型,累计装车超 120 万辆。 iFLYSOUND 还集成超 30 项自研音频算法,支持声场分区、方位导航提示、无麦 K 歌、随行 DJ 等功能,实现 " 好听、好用、好玩 " 的多维体验。其中,随行 DJ 可根据车速、油门深度等实时数据动态混音,增强驾驶与音乐的互动性。 整体方案标志着智能座舱竞争进入系统级智能体能力阶段,强调对真实驾驶场景的理解、车规级工程落地能力及全球化本地适配,而非单一功能堆砌。

最新评论

没有更多评论了

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容

企业资讯

查看更多内容