一周AI最火论文 | 比男朋友更会聊天的机器人指日可待?谷歌AI发布新款Chatbot

简介: 一周AI最火论文 | 比男朋友更会聊天的机器人指日可待?谷歌AI发布新款Chatbot

本周关键词:chatbot、数据流分析、边缘计算

本周最佳学术研究

Google AI Meena:可以聊天聊地聊一切的机器人

Google Research Brain Team推出了一款基于AI的聊天机器人,名叫Meena。与此前最新的聊天机器人相比,它可以进行更合理、更具体的对话。

Meena有26亿个参数,并接受了341 GB文本的训练,这些文本从公共领域的社交媒体对话中被筛选出来。与现有最新的生成模型OpenAI GPT-2相比,Meena具有1.7倍的模型容量,并接受了8.5倍的数据进行训练。为了改进性能,研究人员应用了他们针对开放域聊天机器人提出的一种新的人类评估指标,称为“敏感度和特异性平均值(SSA)”,它捕获了人类对话中基础却重要的属性。

长期以来,研究人员一直在寻找一种自动评估指标,该指标能够与更准确的人工评估相关联、从而更快地开发对话模型,但这一直是充满挑战的。出乎意料的是,他们在训练Meena模型时发现了一种可以用于任何神经seq2seq模型的自动指标——困惑值,该值与人类评估(例如SSA值)具有很强的相关性。

Meena的困惑值为10.2,转换成SSA值就是72%.与其他聊天机器人获得的SSA值相比,SSA 值72%与普通人类达到的SSA值 86%相差不远。完整版Meena具有过滤机制和可调谐解码功能,可将SSA值进一步提高到79%。

有了如此引人入胜的结果,像人与人之间对话那样与现代机器人对话似乎离我们越来越近了。Meena无疑是一项惹人注目的研究成果,它可能带来人机交互中许多有趣且强大的应用。

原文:

https://arxiv.org/abs/2001.09977

数据科学的团队协作模式用于数据流批量分析的Stream-learn的Python包

弗罗茨瓦夫科技大学的研究人员介绍了名为Stream-learn的Python包,用以进行漂移和不平衡的数据流分析。该软件包与Scikit-learn兼容,其主要组件是一个流生成器,允许合成数据流的生成。该合成数据流可以在其循环或非循环版本中结合三种主要的概念漂移类型(即突然漂移、渐进漂移和增量漂移)中的每一个。

Python包允许按照既定的评估方法(Test-Then-Train和Prequential)进行实验。此外,研究人员已经实现了适用于数据流分类的估计器,包括简单分类器、最新的基于块的分类器和在线分类器的集合。为了提高计算效率,该包将其自带的预测指标实现方式用于不平衡的二进制分类任务。

Stream-learn Python包是一个方便使用的开源库,用于困难的数据流分类。它可以根据不同的特征生成流,这些特征由各种类型的概念漂移和类不平衡水平组成,其中包括先前类概率中可能出现的漂移。

附加模块允许使用大众熟知的估算方法实现分类器和分类器集合,从而对数据流进行实验。它的主要想法是使得用户即刻熟悉数据流分类任务。该软件包已经在多篇科学论文的研究过程中得到了测试。对于那些偏好简单的处理过程、容易的操作方法、并与Scikit-learn机器学习库集成使用的用户而言,这是一个理想的工具。

原文:

https://arxiv.org/abs/2001.11077v1

一种衡量品牌重要性和品牌定位的创新型工具

在本文中,研究人员描述了SBS品牌智能应用程序(SBS BI)的功能,该功能旨在评估品牌重要性并通过文本数据分析提供品牌分析。为了更好地描述SBS BI的功能,他们提供了一个针对2020年美国民主总统初选的案例研究。

研究人员从Event Registry数据库下载了5万篇在线文章,其中包括从全球收集的主流新闻和博客新闻。这些在线新闻文章被转换为共现单词网络,并与社交网络分析和文本挖掘中的方法和工具相结合进行分析。

通过全面分析人们(包括新闻记者、评论员、选民等在内)对网上候选人的评论,这项工作中描述的方法在补充传统的民意调查上展现出了巨大的潜力。本文所提出的方法基于对大量文本数据的自动挖掘,这可以帮助抵消所谓的“民意调查疲劳”(在这种情况下,选民开始避免接听民意测验者的电话,从而影响了样本的代表性)。

本文提议的SBS工具中的组件可以被完全转换为品牌经理和数字营销专家可以使用的报告。SBS的预测能力及其三个维度(即流行性、多样性和连通性)已在包括旅游管理和政治预测在内的各种环境中得到了证明。

原文:

https://arxiv.org/abs/2001.11479v1

边缘计算与深度学习的融合调查

这是一个以信息为中心的时代,从个人计算机,智能手机和云数据中心服务器群集,到可穿戴设备和其他物联网(IoT)设备,用于运算和存储的设备数量激增。运算设备的增长激发了人们对边缘智能的关注,希望通过边缘计算促进DL服务的部署。

深度学习可以集成于边缘计算框架中,从而有助于构建一个动态且自适应的边缘维护和管理系统。本文介绍了相应的实现方法和支持技术的应用场景,即定制边缘计算框架中的深度学习训练和推理。此外, 本文还进一步描述了更加普及和细化的情报所面临的挑战和未来趋势。

随着边缘计算能力的提高,边缘智能将变得不在罕见。这项工作介绍和讨论了边缘智能和智能边缘的各种方案和基本启用技术。

通过合并散布在通信,网络和深度学习领域中的信息,此调查可以帮助读者理解技术之间的联系,同时促进有关边缘智能与智能边缘融合的进一步讨论。

原文:

https://arxiv.org/abs/1907.08349v3

表示学习已实现无监督无反向传播CNN

这项新研究提出了一种无监督,无反向传播的学习算法。在没有明确定义的损失函数的情况下,该算法使用两个学习规则,逐层更新权重,从而减少了标量领结问题。研究人员认为,这是有史以来,第一个将CNN,SOM和Hebbian Learning原理结合到单个深度学习模型中的方法。

主要贡献:

  • 用于训练CSNN模型,该算法使得研究人员可以获得与很多无监督训练模型相当的性能;
  • 通过呈现两种类型的权重来掩盖输入和神经元活动,从而克服SOM在图像补丁上训练的问题;
  • 建议使用多头版本以进一步提高性能。

这项工作介绍了CSNN的模块化构建基块,可以在无反向传播的情况下以无监督的方式实现表示学习。

通过结合CNN,SOM和Hebbian掩码学习的CSNN模块,用于学习无监督特征层次结构的新的替代方法一直在被探索中。标量领结问题和目标函数不匹配都可以一起解决,并提出引出了有趣的未来研究方向。

阅读更多:

https://arxiv.org/abs/2001.10388v1

其他爆款论文

Google AI发布了苍蝇大脑中神经元连接的超详细地图,同时发布了用于可视化分析的工具套件:

https://ai.googleblog.com/2020/01/releasing-drosophila-hemibrain.html

想要追踪多个对象?你可以使用这个操作简便的基于云的应用程序:

https://arxiv.org/abs/2001.10072v1

为新闻报道创造代表性的头条新闻而奋斗:

https://arxiv.org/abs/2001.09386v2

Deep NRSfM ++,一种可以从2D地标联合恢复3D形状和相机姿势的通用框架:

https://arxiv.org/abs/2001.10090v1

为什么要用最新的ML分析历史照片档案:

https://arxiv.org/abs/1904.09811v3

数据集

航空视频事件识别的大规模数据集和深度学习基准:

https://arxiv.org/abs/2001.11394v1

用于视频异常检测的新数据集和评估协议:

https://arxiv.org/abs/1902.05872v3

AI大事件

上海利用面部识别技术帮助抓获毒犯:

https://artificialintelligence-news.com/2020/01/17/shanghai-uses-facial-recognition-to-help-catch-drug-offenders/



相关文章
|
5天前
|
机器学习/深度学习 人工智能 自然语言处理
PeterCat:一键创建开源项目 AI 问答机器人,自动抓取 GitHub 仓库信息、文档和 issue 等构建知识库
PeterCat 是一款开源的智能答疑机器人,能够自动抓取 GitHub 上的文档和 issue 构建知识库,提供对话式答疑服务,帮助开发者和社区维护者高效解决技术问题。
49 7
PeterCat:一键创建开源项目 AI 问答机器人,自动抓取 GitHub 仓库信息、文档和 issue 等构建知识库
|
2月前
|
人工智能 自然语言处理 算法
具身智能高校实训解决方案 ----从AI大模型+机器人到通用具身智能
在具身智能的发展历程中,AI 大模型的出现成为了关键的推动力量。高校作为培养未来科技人才的摇篮,需要紧跟这一前沿趋势,开展具身智能实训课程。通过将 AI 大模型与具备 3D 视觉的机器人相结合,为学生搭建一个实践平台。
204 64
|
23天前
|
机器学习/深度学习 人工智能 自然语言处理
Gemini 2.0:谷歌推出的原生多模态输入输出 + Agent 为核心的 AI 模型
谷歌最新推出的Gemini 2.0是一款原生多模态输入输出的AI模型,以Agent技术为核心,支持多种数据类型的输入与输出,具备强大的性能和多语言音频输出能力。本文将详细介绍Gemini 2.0的主要功能、技术原理及其在多个领域的应用场景。
132 20
Gemini 2.0:谷歌推出的原生多模态输入输出 + Agent 为核心的 AI 模型
|
22天前
|
存储 人工智能 自然语言处理
ChatMCP:基于 MCP 协议开发的 AI 聊天客户端,支持多语言和自动化安装 MCP 服务器
ChatMCP 是一款基于模型上下文协议(MCP)的 AI 聊天客户端,支持多语言和自动化安装。它能够与多种大型语言模型(LLM)如 OpenAI、Claude 和 OLLama 等进行交互,具备自动化安装 MCP 服务器、SSE 传输支持、自动选择服务器、聊天记录管理等功能。
137 15
ChatMCP:基于 MCP 协议开发的 AI 聊天客户端,支持多语言和自动化安装 MCP 服务器
|
17天前
|
机器学习/深度学习 人工智能 运维
阿里云技术公开课直播预告:基于阿里云 Elasticsearch 构建 AI 搜索和可观测 Chatbot
阿里云技术公开课预告:Elastic和阿里云搜索技术专家将深入解读阿里云Elasticsearch Enterprise版的AI功能及其在实际应用。
117 2
阿里云技术公开课直播预告:基于阿里云 Elasticsearch 构建 AI 搜索和可观测 Chatbot
|
30天前
|
人工智能 编解码 网络架构
GenCast:谷歌DeepMind推出的AI气象预测模型
GenCast是由谷歌DeepMind推出的革命性AI气象预测模型,基于扩散模型技术,提供长达15天的全球天气预报。该模型在97.2%的预测任务中超越了全球顶尖的中期天气预报系统ENS,尤其在极端天气事件的预测上表现突出。GenCast能在8分钟内生成预报,显著提高预测效率,并且已经开源,包括代码和模型权重,支持更广泛的天气预报社区和研究。
169 14
GenCast:谷歌DeepMind推出的AI气象预测模型
|
22天前
|
人工智能 自然语言处理 API
Multimodal Live API:谷歌推出新的 AI 接口,支持多模态交互和低延迟实时互动
谷歌推出的Multimodal Live API是一个支持多模态交互、低延迟实时互动的AI接口,能够处理文本、音频和视频输入,提供自然流畅的对话体验,适用于多种应用场景。
69 3
Multimodal Live API:谷歌推出新的 AI 接口,支持多模态交互和低延迟实时互动
|
13天前
|
人工智能 安全 机器人
OpenAI重拾规则系统,用AI版机器人定律守护大模型安全
在人工智能领域,大语言模型(LLM)展现出强大的语言理解和生成能力,但也带来了安全性和可靠性挑战。OpenAI研究人员提出“规则基于奖励(RBR)”方法,通过明确规则引导LLM行为,确保其符合人类价值观和道德准则。实验显示,RBR方法在安全性与有用性之间取得了良好平衡,F1分数达97.1。然而,规则制定和维护复杂,且难以完全捕捉语言的多样性。论文:https://arxiv.org/pdf/2411.01111。
53 13
|
1月前
|
人工智能 自然语言处理 前端开发
Lobe Vidol:AI数字人交互平台,可与虚拟人和3D模型聊天互动
Lobe Vidol是一款开源的AI数字人交互平台,允许用户创建和互动自己的虚拟偶像。该平台提供流畅的对话体验、丰富的动作姿势库、优雅的用户界面设计以及多种技术支持,如文本到语音和语音到文本技术。Lobe Vidol适用于娱乐互动、在线教育、客户服务、品牌营销和社交媒体等多个应用场景。
106 7
Lobe Vidol:AI数字人交互平台,可与虚拟人和3D模型聊天互动
|
1月前
|
人工智能 自然语言处理 安全
谷歌版贾维斯即将问世,最强Gemini 2.0加持!AI自主操控电脑时代来临
谷歌发布的Gemini 2.0标志着AI新时代的到来,被誉为“谷歌版贾维斯”。该系统在自然语言处理、图像识别及自主操控电脑等方面取得重大进展,尤其在多模态数据处理上表现出色,能更准确理解用户需求并执行复杂任务。尽管存在对AI自主操控可能带来的负面影响的担忧,谷歌强调Gemini 2.0旨在辅助而非替代人类工作,且已采取多项措施保障其安全性和可靠性。
29 5