技术原理

FFASR与传统ASR的优势对比

声学降噪方法 硬件成本 工业设计 实用效果
语智FFASR 直接接入语智专为远场声源开发的识别引擎,在云端通过深度学习模型完成降噪、识别 无需本地处理能力,所有运算都通过云端完成,BOM成本和电路板体积均大幅压缩 1个麦克风即可完成识别,无需装载多个芯片,不受设备的硬件体积、ID设计限制,万物都可以拥有语音交互能能力 可以接入任意搭载单/双/多麦克风的硬件设备,进行远场语音交互,如手机/平板电脑/loT,几乎涉及所有应用领域
传统ASR 采用传统近场的语音模型,必须通过4/6/8麦克风阵列,才能将远场声源多路合一为近场声源,接入传统识别引擎 需要本地机载端较强处理能力,每个麦克风需要一个处理芯片,BOM成本高,电路板体积大 局限性大,需要以水平、圆形阵列排布,因此现有产品多以「智能音箱」形态出现 仅能通过只能音箱实现语音交互,可升级扩展空间小,应用领域较少
语智FFASR 传统ASR
声学降噪方法
直接接入语智专为远场声源开发的识别引擎,在云端通过深度学习模型完成降噪、识别 采用传统近场的语音模型,必须通过4/6/8麦克风阵列,才能将远场声源多路合一为近场声源,接入传统识别引擎
硬件成本
无需本地处理能力,所有运算都通过云端完成,BOM成本和电路板体积均大幅压缩 需要本地机载端较强处理能力,每个麦克风需要一个处理芯片,BOM成本高,电路板体积大
工业设计
1个麦克风即可完成识别,无需装载多个芯片,不受设备的硬件体积、ID设计限制,万物都可以拥有语音交互能能力 局限性大,需要以水平、圆形阵列排布,因此现有产品多以「智能音箱」形态出现
实用效果
可以接入任意搭载单/双/多麦克风的硬件设备,进行远场语音交互,如手机/平板电脑/loT,几乎涉及所有应用领域 仅能通过只能音箱实现语音交互,可升级扩展空间小,应用领域较少

产品特点

开启远场语音识别时代,让万物具备听觉感知,为全行业赋能

  • 0成本接入
    仅需注册/登陆
    真正0成本
  • 快速部署
    快速接入语智科技API即可调用,
    将所有软硬件架构的开发、测试成本,
    压缩到仅有一个步骤
  • 高准确率
    复杂的深度学习网络与
    End-to-End全栈开发带来
    领先行业的高准确率识别

关于语智

语智科技是中国大陆地区拥有全栈式语音识别技术的新锐团队,CEO冯一曾是Google Assistant核心开发成员,其他团队成员主要来自北京大学,包括语音识别专家、深度学习专家、资深硬件工程师、ACM/ICPC World Final选手等。公司技术池全面覆盖前端声学处理、ASR引擎、NLP等语音交互关键领域。目前,语智科技正致力于推进远场语音识别FFASR(Far-Field ASR)的「AI+IoT」进程。

融资状况

目前已完成来自知名风险投资机构2000万元人民币Pre-A轮融资

媒体报道

语智科技融资进展及技术突破获得多家主流知名媒体关注

  • 语智科技 FFASR 使各类 IoT 设备摆脱目前实现远场语音识别需要复杂麦克风阵列的局限, 降低「AI+IoT」的入场门槛,缩减使用麦克风阵列的 BOM 成本及开发成本。

  • 能同时聚集在语音识别紧密相关的多个领域,有着北大优秀科研和项目能力的同学,这成为冯一与语智科技在日后一年技术快速进步的重要原因。

  • 此次投资语智科技的多家知名资本方都十分看好语智科技的团队技术实力和语音识别 AI 前景。

  • 地址

    北京市海淀区中关村 SOHO816

    电话

    010-62562680

  • 邮箱

    商务合作 bd@yuzhix.com
    技术支持 develop@yuzhix.com
    市场合作 comm@yuzhix.com
    加入语智 hr@yuzhix.com

Copyright © 2017 Beijing Yuzhi Technology Co., Ltd. 北京语智科技有限公司