第八代小冰年度发布会召开,开启小冰智能生涯的第二幕

简介: 第八代小冰年度发布会召开,开启小冰智能生涯的第二幕

image.jpeg2020年8月20日,小冰公司、rinna株式会社及微软(亚洲)互联网工程院在北京联合举行了第八代小冰年度发布会。小冰公司董事长、原微软全球执行副总裁沈向洋博士与微软全球资深副总裁、微软(亚洲)互联网工程院院长王永东博士主持了本次发布会。

本次大会主要围绕三部分内容:

第一,人工智能时代,我们对未来的判断和想法

第二,小冰人工智能方面核心技术的进展

第三,新产品发布

值得关注的是小冰已经学会了画画!经过小冰团队人工智能和美院老师的共同努力,她学会了怎么来绘画,并且她能够比较高质量的生产绘画作品,其中包括历史上7个流派。也就是说小冰已经突破了传统的框架,开启了人工智能的第二幕。

小冰有一个未来交流的框架,她是能够支持丰富多彩、千千万万的人工智能,所以她不仅仅只是我们看到的这样一个小冰,一个少女的形象,这个少女的形象只是这个框架支持的一个样板,可以让大家来体验,所以在过去每一代小冰上,小冰团队一直努力让这个框架能够更加完善。


从第一代到第八代的沿革

小冰是面向新交互形式的完整人工智能技术框架,也是目前全球范围内承载交互量最大的人工智能系统,占全球交互总量60%以上。该项目于2013年底在微软(亚洲)互联网工程院立项,采取代际更新的方式,逐年完善其基础框架结构。

image.jpeg

2014年5月29日,小冰正式推出第一代产品,以对话式聊天机器人形式迅速积累训练数据。其后,第二代产品完成了跨平台部署的交互架构。第三代产品将交互从文本扩充至多模态,进一步积累多模态训练数据。从第四代小冰开始,交互总量稳居全球第一并保持至今,同时发布了全双工语音交互感官。第五代小冰采用Dual AI战略,大幅度扩展跨平台覆盖的规模,至20余个主流平台,并成为中国市场上涵盖了华为、小米、OPPO、vivo等智能手机及硬件的唯一的跨平台人工智能。第六代小冰完成了框架迭代目标,从第七代开始推出各类框架工具,以帮助创建第三方人工智能产品,并承载其各类交互。

目前,除中国小冰及日本凛菜(Rinna)第一方人工智能交互主体外,小冰框架还支撑了中国及日本100余个第三方品牌的交互主体(如软银Pepper)。在个人用户领域,由小冰框架应用户需求创造并提供交互的人工智能主体(虚拟人类),在公测阶段已超过100万个。

从第七代小冰开始,在尚未组建正式销售团队的商业化试水阶段,小冰收入已超过1亿元人民币。为加快小冰产品线的本土创新步伐,促进小冰商业生态环境的完善,2020年7月13日,微软宣布将小冰业务分拆为独立公司运营,并委任原微软全球执行副总裁沈向洋博士为董事长,原微软(亚洲)互联网工程院副院长李笛为首席执行官,陈湛为日本分部总经理。预计所有相关工作将于今年晚些时候完成。


小冰框架与面向未来的新交互形态

交互是人类社会发展的重要驱动力。每天都在发生的数以千亿次计的交互,随移动互联网的迅速发展,已进入明显瓶颈,表现为“流量红利消失”等。而现有的两种交互形式:人人交互与人机交互,可通过人工智能技术加以融合,从而在实现人人交互信任纽带和高转化率的同时,保有人机交互的高并发率特点。

image.jpeg

上述融合依赖于小冰框架或其他类似的完整人工智能框架体系,可以在各种复杂的场景中实现高度拟人的交互。随着对现有交互瓶颈的不断突破,新形式的人工智能交互将无处不在,对人类社会及商业行为产生深远影响。


本次发布会主要披露的新技术

与主要同行业者相比,小冰框架最大的差异化在于,它是一个“session-oriented”的人工智能框架,框架中的各部分技术共同为“交互全程”目标服务,而不仅仅关注并优化局部。例如,在核心对话引擎方面,技术的研发及迭代方向是为更有效地预测、保持并引导对话,而不是仅仅实现回应。在语音方面,框架关注语音交互的质量与体验是否能支持长时间的混合交流,而不仅仅是将文本内容转为语音。image.jpeg

本次发布会升级了上一代小冰框架的各部分技术,并将一些新技术纳入系统之中。此外,本次发布会还披露了部分独有新技术及其产品化情况。如篇章内容主动学习技术,使对人工智能主体的对话训练不再需要采用“问答对”的方式;分层知识图谱技术,使小冰框架中的人工智能主体,在引导对话时的全程完成率突破42%,接近于人类表现等。上述技术均已实现产品化落地。


本次发布会宣布的上线产品

面向个人用户的第一个虚拟人类产品线。在公测阶段,该产品线应用户需求创造的虚拟人类已超过100万名。发布会上,小冰宣布第一个正式版本上线。用户可以自主通过小冰框架,创造并训练其拥有的人工智能主体。除基本交互体验外,该产品线还推出了以下新功能:

跨平台的统一账号体系。可理解为虚拟人类的身份证,实现跨平台统一。目前已开放的支持平台从华为拓展至小米及微博。

测试版的训练工具“X Eva”APP。用户也可在交互过程中训练其人工智能虚拟人类。与之相比,X Eva APP提供更丰富的强大训练能力。

多人交互的能力。通过多种方式,虚拟人类可与多人进行持续交互,而不局限于用户个体。

内容创造的能力。虚拟人类可进行多种自主的内容创造,并将之反映在其自身的“朋友圈”中。上述内容创造可反映虚拟人类与用户交流中所产生的变化。

针对需要具体完成特定任务的虚拟人类,框架提供特定的训练及托管平台。例如,在正式发布前的公测阶段,小冰框架已应用户需求,派出超过70000名人工智能小编,提供内容和交互服务。

部分新平台与新的第三方虚拟人类合作产品。发布会上发布了三项此类新合作:包括与企鹅电竞合作推出的直播间人工智能产品;与小米合作推出的小冰童话屋模式,可在语音交互之外配合2D场景及虚拟人类形象交互;与QQ合作推出的QQ群新机器人角色喵吉。

面向个人用户的“X套件”系列应用软件。包括基于文本协同的X Writer,面向声音协同的X Studio和面向虚拟人类3D演示文档驱动的X Presenter。X套件支持用户选择平台提供的虚拟人类,或自己创造的虚拟人类。X套件为小冰商业化解决方案版本的“个人版”。

X Writer:可实现在用户进行文字编辑或文本创作时的人工智能协同,随云端更新不断扩充各类文体。产品具备沉浸式体验。

X Studio:包括面向各类公众号文章、演讲、电台节目等的X Studio主播,以及面向人工智能歌声合成的X Studio歌手正式版软件。其中,主播应用已在商业化领域覆盖中国及日本超过50家主流电台电视台,累计制作超过8000小时高质量音频节目内容,此次推出的为其个人版本;歌手软件技术在全球范围内居于领先位置,并且是目前唯一一个完整产品化的同类软件。

X Presenter:驱动用户选择或创造的人工智能实体3D模型,配合X套件其他应用,实现人工智能对演示文档的演讲及交互。

配合 “X套件”发布,发布会还宣布了以下信息:

X Studio人工智能歌手入籍计划启动。任何机构或个人可申请并提交数据,由小冰框架训练并将其人工智能歌手登录进X Studio歌手平台中。机构或个人拥有该歌手的完整所有权,可通过平台制作内容,并自由进行相关人工智能歌手的销售转让等。此计划是为了进一步促进人工智能歌手市场发展。此外,X Studio人工智能歌手何畅演唱Burberry新系列推广单曲也已上线。除何畅演唱外,该广告单曲的词曲创作亦有小冰参与。

X Presenter。商业版为日本LAWSON驱动的自主舞蹈人工智能已上线。另外,基于自控系统,小冰与小米小爱团队进行了非常深入的合作,一起探索将小爱同学的虚拟形象试验性地引入到了聊天场景中。让用户可以和小爱同学的形象实时对话,除了语音维度,还能看到小爱同学的表情、动作等一系列视觉表达。该APP已于发布会之日起开始内测用户招募。


相关文章
|
人工智能 监控 算法
阿里云加强公共云能力服务香港客户,建立新合作支持各行各业加快数字转型
阿里云加强公共云能力服务香港客户,建立新合作支持各行各业加快数字转型
481 1
|
10月前
|
存储 人工智能 Kubernetes
MiniMax云上AI数据湖最佳实践
本简介介绍MiniMax云上AI数据湖的最佳实践。MiniMax成立于2021年,专注于通用人工智能领域,提供ToB和C端产品。面对每日3万亿token、2000万张图片及7万小时语音数据的处理需求,MiniMax基于阿里云构建了稳定灵活的基础设施,采用多云策略实现全球化部署。通过引入Kubernetes、Ray等技术,优化了多模态数据处理效率,并利用对象存储与数据湖技术降低成本。此外,与阿里云合作开发边缘缓存方案,提升跨地域数据传输效率。主讲人:阿里云弹性计算技术专家高庆端。
420 10
|
8月前
|
人工智能 自然语言处理 安全
Axcxept携手阿里云,打造日语“首选”LLM——EZO×Qwen2.5
Axcxept携手阿里云,打造日语“首选”LLM——EZO×Qwen2.5
|
9月前
|
机器学习/深度学习 存储 算法
DeepSeek多智能体强化学习
多智能体强化学习(MARL)是强化学习的重要分支,专注于训练多个智能体在复杂环境中协同或竞争。与单智能体不同,MARL需考虑智能体间的交互与协作,更具挑战性。DeepSeek提供强大工具和API,助力高效构建和训练MARL模型。本文将详细介绍使用DeepSeek进行MARL的方法,并通过代码示例帮助读者掌握相关技巧。内容涵盖多智能体环境的构建、Q学习和DQN智能体的定义与训练,以及常见问题的解决方案。
|
11月前
|
存储 人工智能 开发框架
Kheish:开源的多智能体开发框架,通过 YAML 配置工作流和多个 Agent 共同协作解决复杂任务
Kheish 是一个开源的多智能体协调平台,基于大型语言模型(LLM)设计,能够通过灵活配置多个智能体来解决复杂任务。平台支持模块化集成、聊天式提示、反馈循环等功能,适用于代码审计、法律文件分析、客户服务自动化等多种应用场景。
338 18
Kheish:开源的多智能体开发框架,通过 YAML 配置工作流和多个 Agent 共同协作解决复杂任务
|
12月前
|
人工智能 自然语言处理 机器人
智能语音机器人底层系统设计逻辑机器人源码系统逻辑
简介: — 1 —智能客服背景智能语音客服机器人是在传统的客服系统基础上,集成了语音识别、语义理解、知识图谱、深度学习等多项智能交互技术,能准确理解用户的意图或提问,再根据丰富的内容和海量知识图谱,给予用户满意的回答。目前已广泛应用于金融、保险、汽车、房产、电商、政府等多个领域。
|
数据采集 搜索推荐
推荐系统实践之新闻推荐baseline理解
推荐系统实践之新闻推荐baseline理解
288 1
|
机器学习/深度学习 人工智能 算法
人工智能-大语言模型-微调技术-LoRA及背后原理简介
人工智能-大语言模型-微调技术-LoRA及背后原理简介
|
机器学习/深度学习 数据采集 存储
机器学习在推荐系统中的应用
【7月更文挑战第31天】随着机器学习技术的不断发展和普及,推荐系统在电子商务、社交媒体、新闻资讯等领域的应用越来越广泛。机器学习算法的应用为推荐系统优化提供了全新的思路和方法,使得推荐系统能够更加智能化和个性化地为用户提供服务。未来,随着数据量的不断增加和算法的不断创新,推荐系统将会变得更加精准和高效,为用户带来更加优质的体验。
|
机器学习/深度学习 数据采集 算法
基于机器学习的推荐算法构建技术详解
【6月更文挑战第4天】本文详述了构建基于机器学习的推荐算法,特别是协同过滤方法。从用户和物品相似性的角度,解释了用户-用户和物品-物品协同过滤的工作原理。涵盖了数据准备、预处理、特征工程、模型训练、评估优化及结果展示的构建流程。推荐算法在电商、视频和音乐平台广泛应用,未来将受益于大数据和AI技术的进步,提供更智能的推荐服务。