声智科技完成 A 轮近亿融资,继续专注 AI 语音技术迭代和场景拓展

简介:

10 月 27 日上午,声智科技(SoundAI)宣布已于 2017 年 9 月份完成 A 轮近亿人民币融资,本轮融资由百度、蓝港互动、洪泰基金、峰瑞资本联合财务投资,北京银行以投贷联动方式参与。

声智科技表示,本轮融资后,将继续投入 AI 核心技术研发,持续提升远场语音交互产品的体验,同时拓展更多语音智能的垂直场景,服务更多品牌和中小企业客户,保持远场语音交互领域的领先地位。

声智科技是一家专注声学前沿技术和人工智能交互的公司,提供从软硬件到云服务的远场语音交互技术方案,以及从芯片模组、PCBA 到工业设计的 Turnkey 产品方案,其中的声学通信、麦克风阵列、远场语音唤醒和识别、端到端深度学习等软硬融合技术业内比较受到认可。

成立于 2016 年 4 月,声智科技的核心团队来自于中国科学院,拥有多年的声学和语音识别技术积累。创始人兼 CEO 陈孝良是中科院声学所博士,曾任中科院声学所副研究员和信息化办公室主任,北京市公安局首届网络应急专家。

陈孝良在雷锋网(公众号:雷锋网)有一个讨论语音交互技术的专栏,针对语音交互行业、产品和技术进行解读,文章包括《亚马逊Echo新品技术解读,如何选择合适的麦克风阵列?》《盘点麦克风技术及市场,远场语音交互如何选型麦克风?》

目前,声智的客户包括小米、360、联想等,搭载声智核心技术的产品包括 360智能摄像机、360儿童故事机和小米 AI 音箱等。后续,与声智深度合作的更多品牌产品也将陆续大规模上市。后续,声智与百度合作的 DuerOS 开发套件也将发布,这将进一步加快 AI 技术的普及。声智表示,公司是当前业界麦克风阵列型号最全、场景最多的开发套件供应商。

在 AI 开发人员的培养方面,声智联合媒体和科研高校开设普及教育课程,并且专为开发人员设计和供应 AI 开发板。

声智科技完成 A 轮近亿融资,继续专注 AI 语音技术迭代和场景拓展

图为:声智科技麦克风阵列开发套件

AI 落地关键是技术迭代和场景拓展

当前全球智能语音产品的态势,2018 年将是智能音箱市场的激烈竞争期,全球互联网巨头的入局,将进一步加速整个智能语音产业的成熟。然而,当前的语音交互技术距离全面应用还有一定的差距,特别是兼顾近场和远场的语音前端、语音识别和语义理解的通用性技术。因此,声智科技将持续更新和迭代技术,致力于解决更复杂声学场景下的远场语音唤醒和识别、远场声纹识别、声视频融合交互、多人追踪和识别等影响用户体验的关键问题。

声智科技完成 A 轮近亿融资,继续专注 AI 语音技术迭代和场景拓展

图为:声智科技当前核心技术体系

场景拓展是 AI 落地中尤为重要的环节,用户场景的核心差异造成算法和数据诉求方面的巨大不同,其实,创业公司的算法和数据已经不再是关键性问题,而能否落地更多场景才是核心问题。所以,声智科技一直重点投入在这方面。从成立之初,就深耕智能家居、智能汽车、智能安防、智能金融、智能教育和机器人等行业,与行业领军企业建立合作关系,共同致力于在行业场景中落地声学通信、声学降噪、声学检测和远场语音交互技术。

定位于人工智能交互方案提供商

人工智能时代,智能语音作为 AI 最先落地的突破口,迅速成为全球互联网巨头关注的焦点和角逐的战场。众多AI创业公司纷纷转型,甚至成为 AI 全栈公司,这样的环境下,声智科技仍坚持初心。声智坚信在AI产业初具规模的赛道中,技术才是核心驱动力,特别是融合场景的规模验证技术,而创业公司找准自己在产业链的定位也是尤为重要的事情。

声智科技始终定位于人工智能交互方案提供商,专注于声学前沿和人工智能交互核心技术。目前,声智科技已经与 ARM、NVIDIA、Xilinx、Cypress、Knowles 等芯片和器件厂商合作,同时,与百度、阿里、腾讯、思必驰等 AI 平台企业合作,构建起产业伙伴间的桥梁,共同帮助客户细致打磨产品,赋予语音智能极致的用户体验,携手构建智能交互产业的闭环生态。

下一代远场语音交互技术

此轮融资后,声智科技表示,未来将继续致力于利用人工智能创新技术,服务和带动实体行业合作伙伴的技术升级。

声智科技的创新技术,首先将推动麦克风器件、专用AI芯片等基础产业技术的升级。通过声智在麦克风技术领域的积累,推动麦克风从精准到智能的升级,给国内的基础产业带来全新的机会,同时,也将与全球著名麦克风器件厂商和芯片厂商合作,联手研发生产下一代人工智能交互的专用器件和芯片。

其次,声智将释放自身软硬一体的技术综合能力,为合作伙伴和生产厂商带来更多全球客户,并且,进一步帮助传统制造产业进行产品设计和生产的技术升级。

另外,基于数据清洗和数据标注的大量需求,以及对于声学实验和语音测试的专业需求,声智科技正与地方政府合作,筹建地区性研发和营运中心,也将持续拉动人工智能领域的地方人员就业。

作为一家专注技术的 to B 厂商,声智表示,自己的目标是携手合作伙伴,服务众多客户,共同打磨下一代远场语音交互技术,致力于实现“听你所言,知你所想”的人工智能愿景。



本文作者:刘芳平
本文转自雷锋网禁止二次转载, 原文链接
相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
目录
相关文章
|
1天前
|
机器学习/深度学习 人工智能 自然语言处理
转载:【AI系统】AI的领域、场景与行业应用
本文概述了AI的历史、现状及发展趋势,探讨了AI在计算机视觉、自然语言处理、语音识别等领域的应用,以及在金融、医疗、教育、互联网等行业中的实践案例。随着技术进步,AI模型正从单一走向多样化,从小规模到大规模分布式训练,企业级AI系统设计面临更多挑战,同时也带来了新的研究与工程实践机遇。文中强调了AI基础设施的重要性,并鼓励读者深入了解AI系统的设计原则与研究方法,共同推动AI技术的发展。
转载:【AI系统】AI的领域、场景与行业应用
|
22小时前
|
人工智能 API 语音技术
TEN Agent:开源的实时多模态 AI 代理框架,支持语音、文本和图像的实时通信交互
TEN Agent 是一个开源的实时多模态 AI 代理框架,集成了 OpenAI Realtime API 和 RTC 技术,支持语音、文本和图像的多模态交互,具备实时通信、模块化设计和多语言支持等功能,适用于智能客服、实时语音助手等多种场景。
33 15
TEN Agent:开源的实时多模态 AI 代理框架,支持语音、文本和图像的实时通信交互
|
1天前
|
机器学习/深度学习 人工智能 物联网
AI赋能大学计划·大模型技术与应用实战学生训练营——电子科技大学站圆满结营
12月05日,由中国软件行业校园招聘与实习公共服务平台携手阿里魔搭社区共同举办的AI赋能大学计划·大模型技术与产业趋势高校行AIGC项目实战营·电子科技大学站圆满结营。
AI赋能大学计划·大模型技术与应用实战学生训练营——电子科技大学站圆满结营
|
5天前
|
机器学习/深度学习 存储 人工智能
【AI系统】离线图优化技术
本文回顾了计算图优化的各个方面,包括基础优化、扩展优化和布局与内存优化,旨在提高计算效率。基础优化涵盖常量折叠、冗余节点消除、算子融合、算子替换和算子前移等技术。这些技术通过减少不必要的计算和内存访问,提高模型的执行效率。文章还探讨了AI框架和推理引擎在图优化中的应用差异,为深度学习模型的优化提供了全面的指导。
20 5
【AI系统】离线图优化技术
|
7天前
|
机器学习/深度学习 人工智能 JSON
【实战干货】AI大模型工程应用于车联网场景的实战总结
本文介绍了图像生成技术在AIGC领域的发展历程、关键技术和当前趋势,以及这些技术如何应用于新能源汽车行业的车联网服务中。
|
2天前
|
人工智能 Cloud Native 调度
阿里云容器服务在AI智算场景的创新与实践
本文源自张凯在2024云栖大会的演讲,介绍了阿里云容器服务在AI智算领域的创新与实践。从2018年推出首个开源GPU容器共享调度方案至今,阿里云容器服务不断推进云原生AI的发展,包括增强GPU可观测性、实现多集群跨地域统一调度、优化大模型推理引擎部署、提供灵活的弹性伸缩策略等,旨在为客户提供高效、低成本的云原生AI解决方案。
|
2天前
|
机器学习/深度学习 人工智能 边缘计算
24/7全时守护:AI视频监控技术的深度实现与应用分享
本文深入解析了AI视频监控系统在车间安全领域的技术实现与应用,涵盖多源数据接入、边缘计算、深度学习驱动的智能分析及高效预警机制,通过具体案例展示了系统的实时性、高精度和易部署特性,为工业安全管理提供了新路径。
|
8天前
|
机器学习/深度学习 人工智能 TensorFlow
探索AI技术在医疗健康领域的应用
随着人工智能技术的不断发展,其在医疗健康领域的应用也日益广泛。本文将介绍AI技术在医疗健康领域的应用,包括医学影像分析、智能诊断和治疗建议、药物研发等方面。通过代码示例,我们将展示如何使用Python和TensorFlow构建一个简单的神经网络模型来进行医学影像分析。
35 13
|
7天前
|
机器学习/深度学习 人工智能 自然语言处理
AI技术在自然语言处理中的应用
随着人工智能技术的不断发展,自然语言处理(NLP)已经成为了一个重要的应用领域。本文将介绍一些常见的NLP任务和算法,并通过代码示例来展示如何实现这些任务。我们将讨论文本分类、情感分析、命名实体识别等常见任务,并使用Python和相关库来实现这些任务。最后,我们将探讨NLP在未来的发展趋势和挑战。
|
3天前
|
人工智能 搜索推荐 安全
数百名研发人员用通义灵码,33%新增代码由AI生成,信也科技研发模式焕新升级
目前,信也科技数百名研发人员正在使用通义灵码,周活跃用户占比70%,新增代码中有33%由通义灵码编写,整体研发效率提升了11%,真正实现了数百研发人员开发效能的全面提升。