云知声发布多模态AI战略,欲依托算法与芯片构建场景优势

简介: 云知声在北京召开新闻发布会,正式公布了其多模态AI芯片战略与规划,并同步曝光了在研的三款定位不同场景的AI芯片

雷锋网消息,当前我们正处于5G爆发的边缘,5G与AI的结合将真正促使AIoT智慧物联的落地与实现。可以预见的是,未来巨量的多维数据(如语音、图像、视频等)集中处理与边缘式分布计算的需求,将进一步挑战AI芯片的计算能力。

2019年1月2日,云知声在北京召开新闻发布会,正式公布了其多模态AI芯片战略与规划,并同步曝光了在研的三款定位不同场景的AI芯片。

AIoT造就AI芯片新形态

2018年,“多模态”逐渐成为了业界研究的一个重点。如果把模态理解为感官,那么多模态即是调用多种感官的交互方式,它跨过了自然语言,其方式也更加贴近人,是AI未来的一个发展方向。

TB1kNH2z9zqK1RjSZFpXXakSXXa.jpg

云知声创始人兼CEO黄伟认为,随着AIoT场景的逐渐丰富,未来应用对于端云互动有更强的需求,二者需要紧密结合,这要求对芯片设计和云端架构进行统一考量,具备多维度AI数据集中处理能力的多模态AI芯片将成必由之路。云知声接下来将依托AI算法与AI芯片构建场景优势,关键就在于多模态AI芯片战略。

基于此,云知声进一步对传统SoC(System on Chip)概念提出全新定义,其中S代表不同的AI服务能力即Skills,O代表云端与边缘侧的互动On/Off Cloud,C代表具备智能处理能力的AI芯片。

同时,云知声发布了DeepNet2.0多模态人工智能核心IP,其AI处理能力也从1.0的语音进化到2.0的多模态,支持语音、图像等处理能力。DeepNet2.0可兼容LSTM/CNN/RNN/TDNN等多种推理网络,支持可重构计算与Winograd处理,最高可配置算力达4Tops。目前云知声DeepNet2.0已在FPGA上得到验证,将在今年的全新多模态AI芯片海豚(Dolphin)上落地。

TB1Bs61zZbpK1RjSZFyXXX_qFXa.jpg

在会后的交流中,黄伟特别向雷锋网强调“多模态不是为了做视觉而做视觉,而是产品真正需要这种能力”。他以自动驾驶为例,可以通过面部图像识别司机注意力是否集中、是否疲劳驾驶,并根据识别结果提醒司机安全驾驶。“又如夜间行车时视野不如白天清晰,这时如果有实时图像增强的帮助就能大大提升安全性。”

多模态演进之路

作为一家国内领先的AI企业,云知声2014年开始切入物联网AI硬件芯片方案(IVM),并于2015年开始量产出货。在深入场景提供服务的过程中,为弥补通用芯片方案在给定成本和功耗条件下的能效比问题,以及在边缘算力、多模态AI数据处理方面的能力短板,2015年云知声正式启动自研AI芯片计划。

去年5月,云知声推出业内首款面向IoT的AI芯片UniOne及其解决方案雨燕(Swift),加速商业扩张与应用。该芯片采用云知声自主AI指令集,拥有具备完整自主知识产权的DeepNet1.0、uDSP(数字信号处理器),并支持DNN/LSTM/CNN等多种深度神经网络模型,性能较通用方案提升超50倍。

TB1HZ61zZbpK1RjSZFyXXX_qFXa.jpg

云知声联合创始人李霄寒曾指出,“UniOne不是一颗芯片,而是一系列芯片,它代表了云知声对于物联网AI芯片发展战略的整体构想”。在今天的发布会上,李霄寒再次从三方面论证了物联网多模态AI芯片的必要性。他认为,当前物联网产品线的AI芯片越来越明显地体现出三个趋势:

场景化:芯片设计正在由原来的片面追求PPA,即性能(Power)、功耗(Performance)和面积(Area),逐渐演变成基于软硬一体,甚至包括云端服务的方式来解决某个垂直领域的具体问题,芯片本身上升成为整个解决方案中的重要部分,而非唯一;

端云互动:在物联网的不同应用场景下,海量终端设备要实现功能智能化必须端云配合,即形成边缘算力和云端算力的动态平衡。端云互动的命题需要AI芯片的强有力支持,进一步也深刻影响到芯片的设计,以及最终的交付;

数据多模态:在以5G驱动的万物智联场景下,芯片所接触到的数据维度将由原来的单一化走向多元化,芯片所需处理的数据也由单模态变成多模态,这对芯片尤其是物联网人工智能芯片的设计提出了新的挑战。

以此来看,面向物联网终端场景的AI芯片核心是解决垂直场景问题的能力,其呈现形式将不再是一个单一的硬件,而是承载着边缘能力与云端能力的多模态AI软硬一体解决方案。

三款芯片蓄势待发

在首款量产芯片雨燕已有大批客户导入,占领市场先发优势的背景下,2019年云知声在芯片落地规划方面仍将保持积极态度。

TB18OIlz4naK1RjSZFBXXcW7VXa.jpg

李霄寒向雷锋网(公众号:雷锋网)透露,在持续迭代升级现有雨燕芯片的性能与服务之外,目前云知声多款面向不同方向的芯片也已在研发中,包括适用性更广的超轻量级物联网语音AI芯片雨燕Lite、可面向智慧城市场景提供对语音和图像等多模态计算支持的多模态AI芯片海豚(Dolphin),以及与吉利集团旗下生态链企业亿咖通科技共同打造的面向智慧出行场景的多模态车规级AI芯片雪豹(Leopard),三款芯片计划于2019年启动量产。

为实现多模态AI芯片的战略落地,目前云知声已在加速技术布局,并在机器视觉方面取得飞速进展。其中,面向机器视觉的轻量级图像信号处理器已可实现在不依赖外部内存的情况下,在30fps的速率下实时对传感器的图片进行预处理,以进一步提高后续机器视觉处理模块的处理速度和效果。

据悉,借助基于人脸信息分析的多模态技术,已可实现人脸/物体识别、表情分析、标签化、唇动状态跟踪等功能,可为产品交互和用户体验提供更多的可玩性和灵活性。

TB1xw_3z7voK1RjSZFDXXXY3pXa.jpg

此外,在图像与芯片技术的产学研合作方面,云知声还与杜克大学所领导的美国自然科学基金旗下唯一人工智能计算中心ASIC达成深度合作,致力于AI芯片算法压缩与量化技术,以及非冯·诺依曼架构的新型AI芯片计算架构研究,将进一步为云知声多模态AI芯片战略的推进夯实基础。

目前,依托在家居、车载等真实场景下丰富的产品经验,以及具备先发优势的AI芯片能力,云知声将业务覆盖到包括智能家居、智能汽车、智能儿童机器人、智慧酒店、智慧交通等诸多场景。未来云知声将持续发力多模态AI芯片,不断拓展技术与场景生态,以实现面向未来AIoT时代的全面赋能。

相关实践学习
钉钉群中如何接收IoT温控器数据告警通知
本实验主要介绍如何将温控器设备以MQTT协议接入IoT物联网平台,通过云产品流转到函数计算FC,调用钉钉群机器人API,实时推送温湿度消息到钉钉群。
阿里云AIoT物联网开发实战
本课程将由物联网专家带你熟悉阿里云AIoT物联网领域全套云产品,7天轻松搭建基于Arduino的端到端物联网场景应用。 开始学习前,请先开通下方两个云产品,让学习更流畅: IoT物联网平台:https://iot.console.aliyun.com/ LinkWAN物联网络管理平台:https://linkwan.console.aliyun.com/service-open
目录
相关文章
|
6天前
|
机器学习/深度学习 人工智能 自然语言处理
转载:【AI系统】AI的领域、场景与行业应用
本文概述了AI的历史、现状及发展趋势,探讨了AI在计算机视觉、自然语言处理、语音识别等领域的应用,以及在金融、医疗、教育、互联网等行业中的实践案例。随着技术进步,AI模型正从单一走向多样化,从小规模到大规模分布式训练,企业级AI系统设计面临更多挑战,同时也带来了新的研究与工程实践机遇。文中强调了AI基础设施的重要性,并鼓励读者深入了解AI系统的设计原则与研究方法,共同推动AI技术的发展。
转载:【AI系统】AI的领域、场景与行业应用
|
12天前
|
机器学习/深度学习 人工智能 JSON
【实战干货】AI大模型工程应用于车联网场景的实战总结
本文介绍了图像生成技术在AIGC领域的发展历程、关键技术和当前趋势,以及这些技术如何应用于新能源汽车行业的车联网服务中。
177 32
|
9天前
|
机器学习/深度学习 缓存 人工智能
【AI系统】QNNPack 算法
QNNPACK是Marat Dukhan开发的量化神经网络计算加速库,专为移动端优化,性能卓越。本文介绍QNNPACK的实现,包括间接卷积算法、内存重排和间接缓冲区等关键技术,有效解决了传统Im2Col+GEMM方法存在的空间消耗大、缓存效率低等问题,显著提升了量化神经网络的计算效率。
23 6
【AI系统】QNNPack 算法
|
9天前
|
存储 人工智能 缓存
【AI系统】Im2Col 算法
Caffe 作为早期的 AI 框架,采用 Im2Col 方法优化卷积计算。Im2Col 将卷积操作转换为矩阵乘法,通过将输入数据重排为连续内存中的矩阵,减少内存访问次数,提高计算效率。该方法首先将输入图像转换为矩阵,然后利用 GEMM 库加速计算,最后将结果转换回原格式。这种方式显著提升了卷积计算的速度,尤其适用于通道数较多的卷积层。
22 5
【AI系统】Im2Col 算法
|
9天前
|
存储 机器学习/深度学习 人工智能
【AI系统】Winograd 算法
本文详细介绍Winograd优化算法,该算法通过增加加法操作来减少乘法操作,从而加速卷积计算。文章首先回顾Im2Col技术和空间组合优化,然后深入讲解Winograd算法原理及其在一维和二维卷积中的应用,最后讨论算法的局限性和实现步骤。Winograd算法在特定卷积参数下表现优异,但其应用范围受限。
20 2
【AI系统】Winograd 算法
|
4天前
|
机器学习/深度学习 人工智能 监控
AI视频监控技术的核心优势与实践
AI视频监控技术结合了计算机视觉、深度学习和大数据分析,能够实时分析监控画面,识别异常行为和场景变化。其核心在于从“被动记录”转型为“主动识别”,提升监控效率并减少安全隐患。主要应用场景包括泳池管理、健身器械区域、人员密度预警和异常事件检测。系统架构支持多种摄像头设备,采用边缘计算和Docker部署,具备实时性、高准确率和扩展性等优势。未来将优化复杂场景适应性和实时计算负载,进一步提高系统性能。
|
6天前
|
人工智能 Cloud Native 调度
阿里云容器服务在AI智算场景的创新与实践
本文源自张凯在2024云栖大会的演讲,介绍了阿里云容器服务在AI智算领域的创新与实践。从2018年推出首个开源GPU容器共享调度方案至今,阿里云容器服务不断推进云原生AI的发展,包括增强GPU可观测性、实现多集群跨地域统一调度、优化大模型推理引擎部署、提供灵活的弹性伸缩策略等,旨在为客户提供高效、低成本的云原生AI解决方案。
|
16天前
|
人工智能 并行计算 程序员
【AI系统】SIMD & SIMT 与芯片架构
本文深入解析了SIMD(单指令多数据)与SIMT(单指令多线程)的计算本质及其在AI芯片中的应用,特别是NVIDIA CUDA如何实现这两种计算模式。SIMD通过单指令对多个数据进行操作,提高数据并行处理能力;而SIMT则在GPU上实现了多线程并行,每个线程独立执行相同指令,增强了灵活性和性能。文章详细探讨了两者的硬件结构、编程模型及硬件执行模型的区别与联系,为理解现代AI计算架构提供了理论基础。
54 12
|
13天前
|
人工智能 数据安全/隐私保护 数据中心
“芯片围城”下国产AI要放缓?答案或截然相反
12月2日,美国对华实施新一轮出口限制,将140余家中国企业列入贸易限制清单。对此,中国多个行业协会呼吁国内企业谨慎选择美国芯片。尽管受限企业表示影响有限,但此事件引发了关于AI领域芯片供应的担忧。华为云推出的昇腾AI云服务,提供全栈自主的算力解决方案,包括大规模算力集群、AI框架等,旨在应对AI算力需求,确保算力供给的稳定性和安全性,助力中国AI产业持续发展。
|
14天前
|
存储 人工智能 缓存
【AI系统】布局转换原理与算法
数据布局转换技术通过优化内存中数据的排布,提升程序执行效率,特别是对于缓存性能的影响显著。本文介绍了数据在内存中的排布方式,包括内存对齐、大小端存储等概念,并详细探讨了张量数据在内存中的排布,如行优先与列优先排布,以及在深度学习中常见的NCHW与NHWC两种数据布局方式。这些布局方式的选择直接影响到程序的性能,尤其是在GPU和CPU上的表现。此外,还讨论了连续与非连续张量的概念及其对性能的影响。
36 3