云知声发布多模态AI芯片战略,同步曝光三款在研芯片

简介: 未来,云知声的AI芯片将不仅仅局限于语音处理。

未来,云知声的AI芯片将不仅仅局限于语音处理。

继去年5月在行业率先推出首款面向物联网的AI芯片——雨燕(Swift)及其系统解决方案之后,1月2日,国内领先的人工智能企业云知声在京召开新闻发布会,正式公布了其多模态AI芯片战略与规划。会上同步曝光了其正在研发中的多款定位不同场景的AI芯片,包括第二代物联网语音AI芯片雨燕Lite、面向智慧城市的支持图像与语音计算的多模态AI芯片海豚(Dolphin),以及面向智慧出行的车规级多模态AI芯片雪豹(Leopard)。

TB1p24dzMHqK1RjSZFEXXcGMXXa.png

5G推动AIoT落地,多模态AI芯成必然

云知声创始人/CEO黄伟认为,当前我们正处于5G爆发的边缘,5G与人工智能的结合将真正促使万物智联(AIoT)的落地与实现。可以预见的是,未来巨量的多维数据(如语音、图像、视频等)集中处理与边缘式分布计算的需求,势必将进一步挑战AI底层支持硬件——芯片的计算能力。

与此同时,AIoT场景下人工智能应用对于端云互动有着强需求。强大的云会让端能力更强,而强大的端则可提升数据处理的实时性和有效性,进而增强云的能力。二者需要紧密结合,这要求对芯片设计和云端架构进行统一考量。传统的通用方案架构由于在高实时性、高智能化场景中的算力有限,且无法平衡好成本、功耗、安全性等诸多现实需求,因此具备多维度AI数据集中处理能力的多模态AI芯片将成必由之路。

TB1zaM3zrPpK1RjSZFFXXa5PpXa.png

图 |云知声创始人兼CEO黄伟

黄伟同时指出,面向5G万物智联时代,人工智能服务需提供更加场景化的解决方案,云+芯一体化的服务模式将成为行业主流。基于此,他进一步对传统SOC(System On Chip)概念提出全新定义,其中S代表不同的AI服务能力即Skills,O代表云端与边缘侧的互动On/off Cloud,C代表具备智能处理能力的AI芯片。

从IVM到雨燕,云知声的造芯之路

云知声2014年开始切入物联网AI硬件芯片方案(IVM),并于2015年开始形成量产出货,其中家居领域客户覆盖格力、美的、海尔、长虹、海信、华帝等几乎所有国内一线家电厂商。在深入场景提供服务的过程中,为弥补通用芯片方案在给定成本和功耗条件下的能效比问题,以及在边缘算力、多模态AI数据处理方面的能力短板,2015年云知声正式启动自研AI芯片计划。

去年5月16日,云知声正式发布了旗下耗时近三年自主研发打造的首款物联网AI芯片。该芯片采用云知声自主AI指令集,拥有具备完整自主知识产权的DeepNet1.0、uDSP(数字信号处理器),并支持DNN/LSTM/CNN等多种深度神经网络模型,性能较通用方案提升超50倍。

发布芯片后仅四个月,云知声便选择将基于雨燕的解决方案进行开源,于去年9月正式推出智能家居、智能音箱的两套标杆解决方案。通过“云端芯”结合,提供给客户与合作伙伴面向具体场景的软硬件一体化Turnkey解决方案,可让客户站在更高的设计起点、以更低的成本,在更短的时间周期内打造出更稳定可靠的产品。同时,开源的方案也可确保客户基于已提供的AI能力自行设计其它各种长尾产品形态,构建更为丰富的AIoT生态。

目前,基于雨燕芯片的全栈解决方案已导入的各类方案商及合作伙伴已超过10家,包括美的、奥克斯、海信、京东、360、中国平安、硬蛋科技等,相关产品最早将于Q1量产上市。

TB1UgBXzQvoK1RjSZFDXXXY3pXa.png

物联网 AI 芯片的多模态演进之路

在第一代UniOne芯片雨燕的发布会上,云知声联合创始人李霄寒曾指出,UniOne并不是一颗芯片,而是一系列芯片,代表了云知声对于物联网AI芯片发展战略的整体构想。在今日举行的云知声2019多模态AI芯片战略发布会上,李霄寒再次从三方面论证了物联网多模态AI芯片的必要性。他认为,当前物联网产品线的AI芯片越来越明显地体现出三个趋势:

首先是场景化。芯片设计正在由原来的片面追求PPA ,即性能(Power)、功耗(Performance)和面积(Area)逐渐演变成基于软硬一体,甚至包括云端服务的方式来解决某个垂直领域的具体问题,芯片本身上升成为整个解决方案中的重要部分,而非唯一;

其次,端云互动。在物联网的不同应用场景下,海量终端设备要实现功能智能化必须端云配合,即形成边缘算力和云端算力的动态平衡。端云互动的命题需要AI芯片的强有力支持,进一步也深刻影响到芯片的设计,以及最终的交付;

再者,数据多模态。在以5G驱动的万物智联场景下,芯片所接触到的数据维度将由原来的单一化走向多元化,芯片所需处理的数据也由单模态变成多模态,这对芯片尤其是物联网人工智能芯片的设计提出了新的挑战。

TB1xzs9zpzqK1RjSZSgXXcpAVXa.png

图 |云知声联合创始人李霄寒

结合以上三点,李霄寒认为,物联网AI芯片的最终呈现形式将不再是一个单一的硬件,而必然是承载着边缘能力与云端能力的多模态AI软硬一体解决方案。

云知声多模态AI芯片技术布局

为实现多模态AI芯片的战略落地,目前云知声已在加速技术布局,并在机器视觉方面取得飞速进展。其中,面向机器视觉的轻量级图像信号处理器已可实现在不依赖外部内存的情况下,在30 fps的速率下实时对传感器的图片进行预处理,以进一步提高后续机器视觉处理模块的处理速度和效果。借助基于人脸信息分析的多模态技术,已可实现人脸/物体识别、表情分析、标签化、唇动状态跟踪等功能,可为产品交互和用户体验提供更多的可玩性和灵活性。

尤为值得一提的是,云知声多模态人工智能核心IP——DeepNet2.0的发布,标志着云知声人工智能处理核心由1.0语音时代全面迈入2.0融合语音、图像等处理能力的多模态时代。DeepNet2.0可兼容LSTM/CNN/RNN/TDNN等多种推理网络,支持可重构计算与Winograd处理,最高可配置算力达4T,达行业一流水平。目前云知声DeepNet2.0已在FPGA上得到验证,将在2019年落地的全新多模态AI芯片海豚(Dolphin)上落地。

TB1s4.6zxTpK1RjSZR0XXbEwXXa.png

除此之外,在图像与芯片技术的产学研合作方面,云知声还与杜克大学所领导的美国自然科学基金旗下唯一人工智能计算中心——ASIC达成深度合作,致力于AI芯片算法压缩与量化技术,以及非冯新型AI芯片计算架构研究,将进一步为云知声多模态AI芯片战略的推进夯实基础。

三款在研芯片曝光,2019年启动量产

在首款量产芯片雨燕已有大批客户导入,占领市场先发优势的背景下,2019年云知声在芯片落地规划方面仍将保持积极态度。

李霄寒透露,在持续迭代升级现有雨燕芯片的性能与服务之外,目前云知声多款面向不同方向的芯片也已在研发中,包括适用性更广的超轻量级物联网语音AI芯片雨燕Lite,集成云知声最先进神经网络处理器DeepNet2.0,可面向智慧城市场景提供对语音和图像等多模态计算支持的多模态AI芯片海豚(Dolphin),以及与吉利集团旗下生态链企业亿咖通科技共同打造的面向智慧出行场景的多模态车规级AI芯片雪豹(Leopard)。以上三款芯片计划于2019年启动量产。

TB15NZ8zxTpK1RjSZFKXXa2wXXa.png

目前,依托在家居、车载等真实场景下丰富的产品经验,以及具备先发优势的AI芯片能力,云知声将业务覆盖到包括智能家居、智能汽车、智能儿童机器人、智慧酒店、智慧交通等诸多场景。未来云知声将持续发力多模态AI芯片,不断拓展技术与场景生态,以实现面向未来AIoT时代的全面赋能。

相关实践学习
钉钉群中如何接收IoT温控器数据告警通知
本实验主要介绍如何将温控器设备以MQTT协议接入IoT物联网平台,通过云产品流转到函数计算FC,调用钉钉群机器人API,实时推送温湿度消息到钉钉群。
阿里云AIoT物联网开发实战
本课程将由物联网专家带你熟悉阿里云AIoT物联网领域全套云产品,7天轻松搭建基于Arduino的端到端物联网场景应用。 开始学习前,请先开通下方两个云产品,让学习更流畅: IoT物联网平台:https://iot.console.aliyun.com/ LinkWAN物联网络管理平台:https://linkwan.console.aliyun.com/service-open
相关文章
|
4月前
|
存储 数据采集 人工智能
AI时代:云存储加速多模态数据存储与管理创新
阿里云存储产品高级解决方案架构师欧阳雁(乐忱)分享了中国企业在全闪存高端存储市场的快速增长,指出AI大模型的发展推动了企业级存储市场。去年,高端企业级存储闪存占比约为25%,相较于欧美50%的比例,显示出中国在AI领域的巨大增长潜力。演讲涵盖AI业务流程,包括数据预处理、训练和推理的痛点,以及针对这些环节的存储解决方案,强调了稳定、高性能和生命周期管理的重要性。此外,还介绍了数据预处理的全球加速和弹性临时盘技术,训练阶段的高性能存储架构,推理场景的加速器和AI Agent的应用,以及应对大数据业务的存储考量,如对象存储、闪电立方和冷归档存储产品。
38453 20
|
2天前
|
人工智能 安全 芯片
【通义】AI视界|谷歌 Tensor G5 芯片揭秘:1+5+2 八核 CPU,支持光线追踪
本文由【通义】自动生成,涵盖黄仁勋宣布台积电协助修复Blackwell AI芯片设计缺陷、苹果分阶段推出Apple Intelligence、OpenAI保守派老将辞职、英伟达深化与印度合作推出印地语AI模型,以及谷歌Tensor G5芯片支持光线追踪等最新科技资讯。点击链接或扫描二维码,获取更多精彩内容。
|
1月前
|
人工智能 JSON 数据格式
RAG+Agent人工智能平台:RAGflow实现GraphRA知识库问答,打造极致多模态问答与AI编排流体验
【9月更文挑战第6天】RAG+Agent人工智能平台:RAGflow实现GraphRA知识库问答,打造极致多模态问答与AI编排流体验
RAG+Agent人工智能平台:RAGflow实现GraphRA知识库问答,打造极致多模态问答与AI编排流体验
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
赋能百业:多模态处理技术与大模型架构下的AI解决方案落地实践
【9月更文挑战第4天】赋能百业:多模态处理技术与大模型架构下的AI解决方案落地实践
赋能百业:多模态处理技术与大模型架构下的AI解决方案落地实践
|
1月前
|
人工智能
防AI换脸视频诈骗,中电金信联合复旦提出多模态鉴伪法,还入选顶会ACM MM
【9月更文挑战第26天】中电金信与复旦大学合作,提出一种基于身份信息增强的多媒体伪造检测方法,并入选ACM MM国际会议。该方法利用身份信息作为检测线索,构建了含54位名人324个视频的多模态伪造数据集IDForge,设计了参考辅助的多模态伪造检测网络R-MFDN,显著提升了检测性能,准确率达到92.90%。尽管如此,该方法仍存在一定局限性,如对非英语国家数据及无明确身份信息的视频检测效果可能受限。
37 4
|
1月前
|
人工智能 测试技术
语言图像模型大一统!Meta将Transformer和Diffusion融合,多模态AI王者登场
【9月更文挑战第20天】Meta研究人员提出了一种名为Transfusion的创新方法,通过融合Transformer和Diffusion模型,实现了能同时处理文本和图像数据的多模态模型。此模型结合了语言模型的预测能力和Diffusion模型的生成能力,能够在单一架构中处理混合模态数据,有效学习文本与图像间的复杂关系,提升跨模态理解和生成效果。经过大规模预训练,Transfusion模型在多种基准测试中表现出色,尤其在图像压缩和模态特定编码方面具有优势。然而,其训练所需的大量计算资源和数据、以及潜在的伦理和隐私问题仍需关注。
63 7
|
2月前
|
人工智能 文字识别 算法
打造全场景、跨领域、多模态的AI工作流 | 开源图像标注工具 X-AnyLabeling v2.4.0 正式发布!
X-AnyLabeling是一款强大的辅助标注工具,集成了AI推理引擎和丰富功能,为图像数据工程师提供一站式解决方案。它支持图像和视频文件的自动标注,提供了包括矩形框、多边形在内的七种标注样式,适应多样化的训练场景需求。X-AnyLabeling内置了多种SOTA级AI模型,如YOLO、SAM系列等,并支持GPU加速和多种数据集格式的导入导出,确保高效的数据处理。此外,它还具备良好的跨平台兼容性,可在多种操作系统上运行,并提供详尽的帮助文档和社区支持,帮助用户轻松上手并解决使用过程中遇到的问题。
165 2
打造全场景、跨领域、多模态的AI工作流 | 开源图像标注工具 X-AnyLabeling v2.4.0 正式发布!
|
1月前
|
机器学习/深度学习 人工智能 自动驾驶
【通义】AI视界|马斯克:特斯拉计划2025年末批量装备AI训练芯片Dojo2
本文精选了24小时内的重要AI新闻,包括特斯拉计划2025年批量装备Dojo 2芯片、英伟达股价大涨、谷歌联合创始人积极参与AI项目、中科院女工程师开源AI模型保护女性,以及快手旗下可灵AI与蓝色光标达成战略合作。更多内容敬请访问通义官网体验。
|
2月前
|
人工智能
多模态AI单词助记模型体验
一文带你了解多模态AI单词助记模型的优与劣
207 1
|
3月前
|
人工智能
魔搭多模态AI单词助记&通义APP即时口语练习,你从未体验过的全新版本!
首次接触魔搭多模态AI单词助记工具让我颇感惊喜。传统背单词方式枯燥低效,而该工具通过生成关联图像、短语或故事,让记忆变得生动有趣。访问[Word-wizard](https://modelscope.cn/studios/makabakaing/Word-wizard)体验其图文记忆和视觉学习功能。目前图文记忆功能似乎存在问题,但视觉学习功能仍可正常使用,能识别图片特征并生成释义和例句,辅助学习效果不错。此外,可通过通义APP实现即时口语练习,尽管缺乏上下文记忆功能,但仍是一个优秀的练习工具。