您当前位置:首页 > 新闻中心 > 创始人说

谛声科技丁东亮:中国没人做企业级声学监测,这事儿说不过去

声学火了。

 

从2011年苹果的Siri语音助手开始,用户视野中就开始出现各种类型的语音产品。过去几年,伴随智能音箱赛道的爆发,国内也诞生了科大讯飞、声智科技等大批以语音交互技术为核心的声学解决方案提供商。

 

然而,声学在大众生活中的应用热潮并没有蔓延到企业领域。现阶段,围绕B端企业、产业的声学应用,尤其是声学监测领域鲜有玩家,这与行业声量和技术门槛有很大关系。而谛声科技创始人兼CEO丁东亮就是愿意投身于这个行业空白的人。

 

谛声科技是一家中国领先的企业级声学AI技术服务商,凭借团队近十年的研发沉淀,目前公司已经开发出多款成熟的声学AI监测产品。


“在企业级声学AI技术服务领域,世界的50强100强中一家中国公司都没有,这是不科学的。中国市场那么大,企业级监测领域却一家公司都说不出来,这说不过去。这件事总要有人去做的”,丁东亮说。


1604916060246880.jpg


千亿蓝海


据统计,全球B端市场中仅中国的市场规模就至少有千亿。但由于国内基础仍待建立健全、人力成本矛盾逐步显现、与产业相关的诸多B端配套服务整体发力较晚,导致中国尚未诞生大型的企业级声学AI技术服务公司。

 

简单来说,声学AI技术服务旨在通过一个或多个麦克风阵列反复不断收集声音信号,与正常工作状态下的背景噪声做对比;再通过精密算法和数据库筛选,对大型器械进行实时监控检测;最终实现在故障发生之前,发现难以被发现的疑似故障并提出智能预警。

 

尽管国内的声学AI技术囿于产业进程还未实现大规模应用,但近几年在诸多内外部因素的协同下,行业依然迎来了发展红利。

 

一方面是技术发展带来的成本降低。

 

丁东亮表示,声学AI技术对硬件的成本和架构要求很高,“以前我们做某些B端的传感器,一个麦克风就要三四万,我们一下子要上一百多个传感器,其他都不算,光传感器就要几百万。这就是我们的前辈都只做波音、空客、造船厂、汽车龙头等大客户的原因,它们可以不计成本,但稍微换一家机构就都受不了了”。

 

而边缘计算和物联网技术的发展带来了单个节点计算能力的提升,使得声学技术的价格成本降低;如今MEMS传感器,已经接近传统模拟传感器水平。

 

“算力提升之前,硬件方面恨不能用几台超级计算机才能跑起来。现在算力取得了质的提升之后,以前超级计算机才能做的,现在几片芯片就能实现。当整个体系、架构和价格下降后,你才具备了领域落地实现的可能性”。在丁东亮看来,技术的进展让声学监测摆脱了预算的钳制,使更多场景有了被探讨的可能。

 

另一方面是行业内用户对监测领域的认知程度在不断提升。

 

一般来说,国内的高铁、飞机和部分家电企业此前已经花了五六年的时间去研究NVH测试课题,他们本身是对声学设备和技术领域有一定知识储备的用户。只不过邀请高校学者做顾问,或者让自有的信号处理工程师往声学方向“硬转”的方式效果有限,最后的测试结果和预期之间必然有很大偏差。

 

值得一提的是,这些企业用户也曾经从欧美高价购买声学监测仪器,但是在实际应用过程中却发现外来设备存在售价、技术难度、使用人员操作等诸多障碍。于是这些机构对市面上的同类型解决公司基本都抱着尝试的态度,“这也是我们同比BK(Bruel&Kjr)等外企的优势”,丁东亮称。

 

目前由于领域内玩家稀少,声学AI技术市场依然是一个典型的卖方市场,这为谛声科技的发展提供了良好的市场环境。

 

“市场就是这样,别人有需求,不能说我们就没有需要。外国能做的我们一定也能做,没做出来不是人的问题就是态度问题,没有别的原因”,丁东亮如是说。


技术高墙


押注B端的企业不像C端玩家一样大多以模式取胜,产业的庞杂和精密决定了声学AI技术这片千亿蓝海的技术门槛。

 

声学的计算难度相当复杂,领域内之所以很少有人做产品,是因为声学场景比视觉场景复杂。“我们的硬件涉及到数学模型,并不是直接的纯硬件。所以不是说研究几年硬件研发的人就能做这个事,必须还有一定的数学建模技术,以及对声学有一定的理解”,丁东亮说。

 

丁东亮介绍称,声学AI技术中有一个重要的核心概念叫做“远场拾音”。简单来说,是运用麦克风阵列对远端声音进行采集、降噪、识别和判断等处理。

 

基于远场拾音,声学设备可以在不接触被测对象的前提下完成对声音的精准采集,而大部分技术手段只能贴近特殊目标物操作,这为声学AI技术在特定场景中的应用树立了竞争优势。

 

除此之外,和技术相近的震动检测对比,声学AI技术核心的优势在于可以还原设备的整体状态。震动只知道设备上点的状态,但对设备来说,即使每个零部件的点上都没有问题,组装好之后也依然可能存在故障。而声学AI技术可以做到在震源离得足够远的情况下,还是知道整个的工况环境,这也是为什么在很多场景中倾向于声学测试的原因之一。

 

“因为我们能预测出设备组装好的状态,所以我们覆盖的场景更大”,丁东亮说。

 

目前,谛声科技实践的方向基于应用场景的阵列化设计和泛机械声纹识别的技术方向。从实操反馈来说,谛声科技的产品精度已经达到90%以上。

 

尽管可适配场景广、产品能力过硬,丁东亮也并不认为在声学AI技术领域有某家公司能做到“一套设备打天下”。少部分和谛声科技一样采用声纹监测方式的企业曾经试图直接从外国批量采购通用设备,应用于所有B端场景,最后吃下国内的工业监测市场,但终究都以失败告终。

 

“声学AI技术最讲求的就是定制化能力。BK做的最好的也是阵列融合,也就是把阵列做成若干个小模块,这些阵列会根据现场情况重组重构;而国内的东西就是照猫画虎,一般都从别人那买一套组合型设备,结果组合能用就很难,还要去分析就更难了,而且成本也很高,用一款设备通吃所有场景这是声学领域的伪命题”。

 

丁东亮认为,声学是断点型的场景,“就像是穿珍珠项链,一家公司能吃下多少市场,取决于你能穿多少场景,穿的场景越多,项目就越值钱”。

 

基于此,成立至今不足两年的谛声科技已经自主研发出声学相机和工业听诊器两款主要产品,并在工业设备故障、铁路系统故障、电力系统故障、公安系统故障、智慧城市之智能安防和市政设备管理等领域落地,成为现阶段国内唯一一家非接触式故障预防解决方案提供商,也是场景穿透力和综合解决能力最强的声学AI技术服务商。

 

“我们接触的一些客户对我们完全不了解,我们也不说我们具体做什么,就直接告诉他们我们能解决问题。实践证明,这些客户直接给我们数据,我们就能通过阵列采集之后,在一两周之内提供一个他们三四年都得不到的结果”,丁东亮说。

 

中国版BK


无论是整体的市场空间还是公司自身的技术积累,丁东亮和他的谛声科技都是整体向好。当然,这并不意味着行业和公司的发展过程会一帆风顺。

 

一直以来,最显著的就是人才问题。

 

谛声科技的核心研发团队大部分来自国内声学研究方向的科研尖端——中国科学院声学研究所(以下简称“声学所”)。其核心研发团队在近十年的科研和实践历程中,参与了超过15个中科院技术的产学研转化,先后参与总装预先研究项目、横向项目多个,并作为主要参研人员参与总装973项目、中国科学院先导专项课题、总装预研项目、兵器专项预研项目等。

 

事实上,丁东亮也是其中为数不多在声学监测领域坚持下来的科研人员和创业者。

 

“现在因为语音交互的兴起才让声学领域变成了焦点,但是此前很长一段都乏人问津。后来很多声学领域的专业人才都转型了,还是因为薪资空间的问题。比如当时互联网很火,如果做其中热门的生命学习、图像处理,那么个人年薪就能一下子从二三十万涨到七八十万”,丁东亮说。

 

最终丁东亮还是拉来了自家的同门师兄弟,大家身上带着自信,还有一股子不服输的劲。

 

“我们团队不擅长‘洗脑’,最终大家能走到一起还是因为彼此的诉求差不太多。从技术上来说,我们都觉得有意思,能力可及,也能做成;从现有的背景条件来说,我们的销售渠道不少,这件事做起来有信心”,丁东亮说,“更何况市场还是有不少声学方向的前辈和同仁都取得了喜人的成绩,使得现在的市场更受大家认可,他们能做好,我们不能做,这个没道理,科研本身就是要有这样的竞争心态”。

 

此外就是资方的介入。成立至今,谛声科技已完成2轮融资。2018年4月,完成千万元级天使轮融资,投资方包括英诺天使基金、臻云创投、创势资本、AC加速器、燕清资本;2019年3月,完成千万元级Pre-A轮融资,达晨财智领投,新微资本跟投。

 

借助资本优势,谛声科技接下来要重点进行多元化产品布局和技术团队扩充。

 

丁东亮认为,合适的公司人员调配比是研发、产品、项目的比值约为1:2:3,但谛声科技目前处于1:1:1的状态,产品和项目都不够,导致研发人员会被迫去做产品和项目,研发进度就会相应受限。“以公司目前的现金流来说,我们的营收很高,养活现有团队没有什么问题。但我们现在做的东西和国外(在国外不进步的前提下)还是有3-5年的差距,产品性能差10%,可能10年都不见得追得上”。

 

基于这种判断,丁东亮没有满足于小圈子里温水煮青蛙的自给自足,而是选择全面突破。“引进团队是最高效的方式。现在声学领域太火了,抢人各方面就会很难受,不靠资本只靠订单的话,可能一年内人员扩招能力有限,对我们想要做的事情来说明显是不够的”。

 

谈及公司愿景,丁东亮并没有把做千亿企业的大旗挂上,反而只给谛声科技立了一个“中国版BK”的小目标。

 

“我们不去做一味求大但是团队并不擅长的事情,我更相信‘知己知彼、百战不殆’”,丁东亮指出。事实上,产品、技术都位居世界尖端的BK也只是一家100亿英镑的公司,这个成绩在C端企业中并不亮眼,但是BK在自己的领域几乎占据了所有高端场景,并且做到了很高的市场占有率。

 

“总有一天我们也要去动一动被国外公司长期霸占的领域,比如高端汽车制造”。按照丁东亮的预测,这个目标谛声科技用5-8年的时间就能做到。