创始人 &CEO 朱余浩——深圳市工程实验室主任,深圳市高层次人才,工商管理博士,曾担任国内通信行业头部企业(A 股上市公司)研发负责人,在多年实践中筑造了核心研发的能力底盘,也掌握了产品从技术蓝图到市场落地的全链路逻辑。
此次,他跳出成熟平台的舒适区,牵头组建专业团队投身创业,没有跟风追逐热点,而是重点布局四大核心技术,直指行业现存困局:
垂类大模型重组端云协同架构,把爱因斯坦级的思考留给云端,高中生级的任务放在本地处理;
36 种小语种离线语音识别算法,让义乌的小家电能听懂 6 亿西班牙语用户的 "Hola";
0.6mA 唤醒电流的存算一体 AI 芯片,能让耳机盒里的电池撑起一个月随时待命的 "AI 秘书 ";
全无线设计,让蓝牙连接手机,让 WiFi 随心提速,让 5G 适配户外,让充电摆脱线缆。
作为新创公司,艾聆科技凭借其端侧 AI 芯片技术和场景化方案,在与众多老牌智能硬件公司的竞争中脱颖而出,赢得某头部手机厂商的合作。
其最新推出的 AI 随身助理 -Note Pro 录音卡更以 2.89mm 全球最薄机身 + 磁吸无线充,在多项产品性能上超越行业同行,树立了行业新标杆。
作为 AI 行业的新锐力量,艾聆的定位并非 ToC 而是 ToB。在朱余浩看来,ToB 并不亚于 ToC,艾聆的客户群体比 Plaud 更广,增量更多。" 我们的对标公司并非 Plaud,艾聆要的是更大的市场。" 朱余浩说道。
早在 10 年前,朱余浩就看到了第一波智能硬件创业机会,当时石头科技、云知声等创业公司已相继冒头。"10 年前这一波智能硬件,主要给硬件带来了连接能力,有了自己的 APP",朱余浩说," 但这一波 AI 硬件的机会更大,人工智能赋能硬件有非常大的想象空间。"
十年磨一剑,当朱余浩带领团队正式入局时,石头科技早就凭借亮眼的市场表现,成为二十年来首支与茅台并肩、股价曾突破千元的个股,被资本市场赋予 " 扫地茅 " 的称号。而聚焦 " 日常生活 + 医疗健康 " 双场景的 AI 解决方案商云知声,市值也已稳步攀升至 400 亿以上,展现出强劲的市场认可度。
下一个十年,行业格局将如何演变?这个问题的答案,或许就藏在艾聆科技的发展轨迹中。
以下为雷峰网 · 鲸犀与艾聆科技 CEO 朱余浩的对话内容,鲸犀做了不改变原意的编辑与整理。
鲸犀:您此次选择投身 AI 硬件领域创业,最初的创业想法是如何萌发的?为什么选择这个时间节点出来创业?
朱余浩:10 年前行业里曾有过一波智能硬件创业潮,那一批智能硬件创业公司的创始人有不少是认识的朋友,对他们的故事也比较了解,也看到他们做出了成绩和对行业的贡献,那时候我心里就埋下了创业的种子。
这次选择出来创业,是天时地利人和。
天时,指的是趋势,我观察到两大产业机遇:一是传统产品正加速向 AI 赋能升级,二是产品出海浪潮下的全球市场红利持续释放。这两大趋势中蕴含着大量的机会。
地利,指的是技术沉淀。我们已自主掌握一系列具有差异化优势的关键技术,这些技术能够直击当前行业在 AI 硬件应用中面临的核心痛点。
人和,指的是团队和资源。我们组建了一支非常优秀的团队。创始团队在 AI 大模型开发与应用、声学与自然语言处理、芯片定制设计开发、低功耗技术、无线硬件产品等领域拥有深厚积累,也沉淀了许多 AI 音视频行业的上下游资源,能够快速推进技术到产品的转化。
鲸犀:艾聆科技定位 ToB,有哪些不一样的打法?
朱余浩:我对 ToB 模式有着较深的认知与实践积累,在过往担任职业经理人期间,曾先后执掌无线应用事业部与新产品发展部,有过不少成功的操盘经验,包括将新产品业务从 0 开始做到几十亿级别规模,不少产品市占率在全球 Top1 或 Top2,经历了业务从 0 到 1、从 1 到 N 的全过程。
新创办的艾聆科技同样定位 ToB,但有不一样的打法——少了工厂,多了技术。生产制造我们选择跟各家代工厂合作,他们更专业,我们也可以有更灵活的产品策略和供应链选择,这更适合 AI 硬件赛道的特点。
我们非常重视核心技术的建设,自主掌握了算法与芯片、端侧模型、低功耗、全无线等底层技术,再往上做,形成全栈的技术方案,我们希望通过技术门槛来建立持续的差异化优势。
鲸犀:我们了解到艾聆科技在端侧 AI 方向上有很清晰的布局, " 艾聆 " 这个名字听起来也很有辨识度,能和我们分享一下品牌命名的初衷吗?
朱余浩: 艾聆公司的 Slogan 是 "AI 聆听世界 / AI Listen To The World",蕴含着双向的价值表达:
一方面,它表达了技术硬实力 —— 既代表我们深耕全球语种语音算法的技术方向,也明确公司 AI 场景化解决方案从 Day1 起就面向全球市场的战略定位;
另一方面,它传递了服务软实力 —— 我们始终秉持 " 聆听至上 " 的态度,珍视每一位客户与用户的声音,这份 " 聆听 " 是我们践行 " 用户导向 " 产品设计的核心逻辑,更是 " 客户第一 " 企业宗旨的直接体现。
公司名 " 艾聆 " 取 "AI 聆听世界 " 之意,是我们理念的浓缩;"AILYWORLD" 则作为我们的技术品牌商标,成为这一理念与技术实力的具象承载。
另外,还有一层含义,源于对 AI 之父的致敬," 艾聆 " 谐音取自艾伦 · 图灵,不仅是表达了对这位先驱者的敬意,更承载着公司在人工智能领域不断探索、追求卓越的决心。
让「爱因斯坦」做科研,让「高中生」做家务
鲸犀:您提到当前 AI 硬件行业存在许多痛点并没有被很好解决,具体有哪些 ?
朱余浩: AI 与物理世界的融合蕴含着无限潜力 , 但将 AI 融入硬件的过程仍面临诸多挑战。包括效率、成本、体验等,据我所看到,AI 硬件行业存在以下四大痛点:
全球适用性,特别是小语种的需求缺口。我一直都认为语音是当前以及未来很长一段时间内跟大模型交互的主要入口,在很多场景语音都是最为便捷的互动方式。
中美人口在全球人口中占比不到 22%,其他地区许多是以各种小语种为主。使用人口最广的是西班牙语,超过了 6 亿。其它像阿拉伯语、印尼语、俄罗斯语、葡萄牙语等都有小几亿的使用人口。
这些地区 AI 语音的渗透率非常低,正处于智能化的起步阶段。而海外大厂核心市场在欧美,国内厂商出海受限,新的开发投入巨大,导致小语种的需求缺口非常大,一直得不到太好的满足。
大模型背后的诸多问题。首先,各家的大模型能力不一,如何选型是个难题;其次,付费模式不畅通,AI 产品需要持续服务,后向付费需要适配本地支付方式及税务合规性等问题;第三,要面对用户对于数据隐私的担忧以及欧美等国的合规性审查压力;第四,大模型的交互成本比较高,高频交互需要额外订阅,成本算下来 C 端用户比较难接受。
能耗和功效。穿戴设备的体积被严格限制导致电池容量极低,但端侧 AI 任务需要持续的算力支撑。此外,AI 硬件的算力浪费普遍存在,比如语音唤醒,每天唤醒次数比较少,大量时间处于空等状态。
设备接口的选择。主流的 USB 接口会增加体积和重量;频繁插拔易导致接口损坏;穿戴类设备 USB 传输缓慢,还有数据线需要随身携带的焦虑;蓝牙的传输速度瓶颈,用户的体验感不佳;集成 WiFi 和 5G 又存在设计复杂度,全球兼容性与认证等问题。
鲸犀:总结了行业当前存在的痛点,那么艾聆科技是如何解决的?
朱余浩:艾聆科技选择入局,必须要抓住当前行业存在的痛点,并且在这上面做出足够的差异化优势,才有成功的机会。
全球语种语音算法:我们团队核心成员拥有二十年以上海外市场经验,曾深度参与海外 IoT 项目,并与多家国际语音技术与数据公司建立了深度合作,为我们丰富的海外语料资源奠定了基础。
我们针对性开发了36 种小语种离线语音识别算法,应该是行业内最全的离线语种,覆盖了全球人口数较多,电子化智能化程度较高的大部分国家,希望能更好解决全球范围的适用性问题。
我们还会将一些确定场景的 AI 能力做到端侧,一是数据不上云,直接在本地处理,避免用户的隐私担忧,二是节约 AI 交互成本、算力资源。云端大模型有着高智商大脑,但有的事情并不需要爱因斯坦,只需要高中生就可以完成。
坚持第一性原理,坚持追求极致高效能是我们的设计理念。我们的垂类大模型重组端云协同的架构,更好地提升用户体验,既帮大模型厂商解决了场景落地的问题,又和他们形成持续合作关系。
低功耗技术:传统 CPU/DSP 或通用 NPU 架构运行端侧模型是大马拉小车,能效比低下;而存储与计算分离架构下,每一次计算数据在内存和计算单元间的搬运功耗是计算本身的好几倍,无效功耗浪费突出。
艾聆采取专用低功耗 NPU 与存算一体的创新芯片架构,结合轻量级端侧 AI 算法及异构计算协同技术,使得 500mAh 的锂电池可提供长达 1 个月的语音唤醒续航,录音功耗可以做到行业内平均水平的四分之一。
鲸犀:艾聆目前有对标的公司吗?
朱余浩:没有非常类同的对标公司。不过,云知声业务范围跟我们比较多相似,是我们当前阶段学习的公司,近期已经在港股上市,目前估值 400 亿以上,得到了资本市场的认可。我们会参考云知声的发展路径,但希望财务发展要走得更稳健一些。除了云知声,科大讯飞也是我们的学习的对象。
我们应该是很少提出第一年就要实现盈利的新创公司,方向上要选择正确而有潜力的赛道,财务发展上也要保持稳健。
小语种离线语音给中国制造装上「世界耳」
鲸犀:贵司主要做的是小语种离线语音识别算法,相比于在线语音识别,有哪些优势?
朱余浩:离线的好处在于用户不用配网连接,而且产品成本更低。这里要先讲一个重要现象,涂鸦智能有十几亿的无线模组出货,但在线开通率很低。市面上这么多的智能连接硬件,到了用户手上真正被配置联网的比例是很小的。大部分用户并不是 IT 背景的,稍微复杂一点的配置就会让他们止步不前,更别说无线连接存在的稳定性问题,会带来更多商用落地的困惑。
基于这个背景,我们重点强化了离线语音识别算法,专注在海外小语种国家的蓝海市场,这些国家处于电子化往智能化发展的早期。我们针对一系列主流家电品类,训练好标准词条库,客户可以直接选用,解决之前此类应用需要重新录音和训练,项目启动成本高,开发周期长等问题。还能支持全球各国用母语做本地唤醒,更广泛地作为 AI 硬件的语音交互入口,助力国内电子企业产品出海,除了欧美之外,有更广阔的全球市场。
鲸犀:科大讯飞、出门问问、Plaud.AI 等企业已经在 AI 录音笔领域深耕已久,你认为目前 AI 录音笔领域还有多少市场空间?如何占领市场份额?
朱余浩:我们曾针对传统录音笔市场做过调研,大概不到 200 亿。AI 赋能录音笔,放大了原本的市场,比如客户拜访、会议通话、课堂学习、医患沟通等更多场景的纪录,这带来了新的增量,总量可能突破 500 亿甚至更多。
录音笔被 AI 化只是一个缩影,其实它正逐渐演进成为 AI 随身助理,可以进到各式各样的智能终端里面去,市场增量空间会更大。
AI 随身助理是艾聆面向工作学习场景的重要产品线,我们除了录音笔品类做得足够全之外,还会应用到耳机、手表、眼镜等大单品上,进一步扩大我们的市场,让更多的人享受 AI 带来的效率提升。
朱余浩:首先跟市场规模有关,前面我们也聊过了原本录音笔品类市场规模并不是很大,所以大厂并没有跳进来,大厂看中的至少也是千万出货量级以上的市场。而小公司做的话又有一定的技术难度,AI 录音卡不像电子产品标准品,芯片公司会提供标准 HDK 和 SDK,方案公司参考做起来就很快,当然也容易带来同质化。
AI 录音卡有许多技术需要重新研发,到目前为止,市面上除了 Plaud,其它同类产品真正做到量产好用的其实不多。艾聆科技紧紧围饶着 Plaud 产品在市场上用户的诉求及提升建议,结合自身的底层技术,实现了十大核心功能的全面升级,给用户带来更好的体验,相信我们会促进 AI 录音卡在行业内更积极向上的良性发展。
鲸犀:跟 Plaud 的 AI 录音卡片相比,艾聆的产品有什么优势?
朱余浩:首先在厚度上,Plaud 的是 2.95mm,我们做到了 2.89mm,是目前行业的极限,更重要的还集成了磁铁和无线充电;然后我们在 WiFi 上做了许多优化设计,使得录音数据上传速度可以快好几倍。
同时,我们还独创性地取消了录音切换按纽,简洁了交互体验;引入智能高效能录音,节省存储空间,提升算力效率;支持录音标签功能,记录重要时刻与精彩瞬间;集成翻译机功能,支持多种翻译场景。并且,艾聆还拓展了更多的品类,让 AI 助理能力进入到更多场景中。
朱余浩:市场的布局我希望 7 成在海外,3 成在国内。艾聆的主要目标客户群体有两类,一是全球大品牌,比如手机 / 电脑品牌,有自己的用户群体;也包括传统大品牌往智能赛道上转身;二是各个区域的头部品牌,包括创新硬件,电商渠道,细分行业应用等。
全球来看,不同国家地区的用户需求也有差异。比如欧美对用户隐私的关注,日本地区的产品生命周期及使用频度,非洲等地区对离线的诉求等。
鲸犀:公司同时布局工作学习、情绪价值和舒适生活三个场景,艾聆跟客户的具体合作模式是什么?
朱余浩:我们构建了 "1+3+N" 的产品体系:1 是端侧 AI 技术底座;3 是 聚焦三大核心应用场景;N 是各种具体产品形态与生态合作。客户合作既可以交付整机,也可以交付模组套件。
对于重点场景,我们会直接做整机标准品,把场景做透,把产品做精。比如现在和国内某头部手机厂商的合作模式就是交付整机。对于一些衍生应用,我们也会交付模组套件,开放接口,把更多的应用空间留给客户与合作伙伴。
通讯产品的质量,消费产品的成本
鲸犀:既然产品优势如此突出,有没有考虑过直接做 ToC?
朱余浩:我们整个创始团队在 B 端的经验和能力更突出,做 C 端在品牌的建立和投入上需要花比较多的精力和资金,我们希望在初期发展阶段可以更稳健一些。公司规模达到一定程度后,我们也会考虑是否往 ToC 的方向。
另外,在我看来 ToB 并不亚于 ToC ,它的增量更大。比如以下三类:首先,一款新的 AI 硬件跑出来后,市场上会有一批创新硬件公司跳进来,做迭代、差异化、衍生,这会产生有效的增量;二是大品牌看到新品类的市场前景后选择入局,其自带大规模用户群体;三是传统企业往 AI 智能化的转身,其规模化下的一定比例也带来增量。这三类增量都是艾聆科技的目标市场,也是我们产品技术差异化的对象。
鲸犀:艾聆科技除了技术优势外,在产品出海或与头部品牌合作中,核心竞争力是什么?
朱余浩:艾聆强调差异化和价性比。一个产品如果没有差异化我们是不考虑的,做到足够差异化之后再以合适的价格进入市场,我们的价性比策略是 "同样的价位比不上我们的性能,同样的性能给不出我们的价格 "。
艾聆团队有 20 年以上通信产品的基因,做消费产品,我们希望能有降维优势。提供像通信产品一样的高性能高质量,但还是消费产品的成本,这也是我们在打造的竞争力。
鲸犀:面对穿戴类设备、智能物联网等不同场景的个性化需求,公司的 " 场景化解决方案 " 除了提供芯片产品外,还带来哪些传统电子硬件方案商难以实现的价值?
朱余浩:第一是场景化方案。传统的电子硬件方案商往往比较被动,大多都是客户提的需求规格照着做,更多是提供技术人力服务。
艾聆针对具体的场景,会把解决方案做得很深。我们会分析当前行业有哪些痛点,标杆竞品的不足,并提供艾聆的技术优势、解决方案和产品定义给到客户。我们提供的是整套有差异化竞争优势的解决方案,是给客户在市场竞争中胜出的武器。对于重点场景,我们做得也很全。以 AI 随身助理为例,艾聆有 8 款以上产品形态,基本上涵盖了市面上主流的需求,客户可以有丰富的选择,更容易产品化。
第二是技术差异化。传统的电子硬件方案商一般都在芯片 HDK 和 SDK 上做二次开发,会导致这个芯片公司所支持的方案都类似,普遍同质化。而艾聆是采用自己的算法和芯片,基于自己的底层技术来做场景化方案,Ailyworld Inside 是我们的技术商标。我们希望做的东西有自己的独特性和门槛,不易被拷贝和抄袭。
鲸犀:当前艾聆科技在资金上有压力吗?之后是否会有融资需求(产业融资还是财务融资)?
朱余浩:其实我们这个点选择创业,是为了搭建属于自己的平台,追求承载我们价值观的事业。相比年轻人创业,我们的优势就是有更丰富的经验沉淀和资金积蓄。资金上支撑公司短期内的生存和一定时间的发展是没有问题的,除了自有资金外,按我们目前客户订单排期以及市场推广情况,预计在公司成立第一年就能实现盈利。
不过 AI 硬件市场百花齐放,机会很多。如果有优秀的相关产业投资方或投资机构,有助于我们加大研发投入,引进优秀人才,快速抢占市场份额,我们是非常乐意的。
(本文作者席星,如有对 AI 硬件领域感兴趣的读者,欢迎添加微信 nebula-yee 互通有无)
雷峰网