本周关键词:chatbot、数据流分析、边缘计算
本周最佳学术研究
Google AI Meena:可以聊天聊地聊一切的机器人
Google Research Brain Team推出了一款基于AI的聊天机器人,名叫Meena。与此前最新的聊天机器人相比,它可以进行更合理、更具体的对话。
Meena有26亿个参数,并接受了341 GB文本的训练,这些文本从公共领域的社交媒体对话中被筛选出来。与现有最新的生成模型OpenAI GPT-2相比,Meena具有1.7倍的模型容量,并接受了8.5倍的数据进行训练。为了改进性能,研究人员应用了他们针对开放域聊天机器人提出的一种新的人类评估指标,称为“敏感度和特异性平均值(SSA)”,它捕获了人类对话中基础却重要的属性。
长期以来,研究人员一直在寻找一种自动评估指标,该指标能够与更准确的人工评估相关联、从而更快地开发对话模型,但这一直是充满挑战的。出乎意料的是,他们在训练Meena模型时发现了一种可以用于任何神经seq2seq模型的自动指标——困惑值,该值与人类评估(例如SSA值)具有很强的相关性。
Meena的困惑值为10.2,转换成SSA值就是72%.与其他聊天机器人获得的SSA值相比,SSA 值72%与普通人类达到的SSA值 86%相差不远。完整版Meena具有过滤机制和可调谐解码功能,可将SSA值进一步提高到79%。
有了如此引人入胜的结果,像人与人之间对话那样与现代机器人对话似乎离我们越来越近了。Meena无疑是一项惹人注目的研究成果,它可能带来人机交互中许多有趣且强大的应用。
原文:
https://arxiv.org/abs/2001.09977
数据科学的团队协作模式用于数据流批量分析的Stream-learn的Python包
弗罗茨瓦夫科技大学的研究人员介绍了名为Stream-learn的Python包,用以进行漂移和不平衡的数据流分析。该软件包与Scikit-learn兼容,其主要组件是一个流生成器,允许合成数据流的生成。该合成数据流可以在其循环或非循环版本中结合三种主要的概念漂移类型(即突然漂移、渐进漂移和增量漂移)中的每一个。
Python包允许按照既定的评估方法(Test-Then-Train和Prequential)进行实验。此外,研究人员已经实现了适用于数据流分类的估计器,包括简单分类器、最新的基于块的分类器和在线分类器的集合。为了提高计算效率,该包将其自带的预测指标实现方式用于不平衡的二进制分类任务。
Stream-learn Python包是一个方便使用的开源库,用于困难的数据流分类。它可以根据不同的特征生成流,这些特征由各种类型的概念漂移和类不平衡水平组成,其中包括先前类概率中可能出现的漂移。
附加模块允许使用大众熟知的估算方法实现分类器和分类器集合,从而对数据流进行实验。它的主要想法是使得用户即刻熟悉数据流分类任务。该软件包已经在多篇科学论文的研究过程中得到了测试。对于那些偏好简单的处理过程、容易的操作方法、并与Scikit-learn机器学习库集成使用的用户而言,这是一个理想的工具。
原文:
https://arxiv.org/abs/2001.11077v1
一种衡量品牌重要性和品牌定位的创新型工具
在本文中,研究人员描述了SBS品牌智能应用程序(SBS BI)的功能,该功能旨在评估品牌重要性并通过文本数据分析提供品牌分析。为了更好地描述SBS BI的功能,他们提供了一个针对2020年美国民主总统初选的案例研究。
研究人员从Event Registry数据库下载了5万篇在线文章,其中包括从全球收集的主流新闻和博客新闻。这些在线新闻文章被转换为共现单词网络,并与社交网络分析和文本挖掘中的方法和工具相结合进行分析。
通过全面分析人们(包括新闻记者、评论员、选民等在内)对网上候选人的评论,这项工作中描述的方法在补充传统的民意调查上展现出了巨大的潜力。本文所提出的方法基于对大量文本数据的自动挖掘,这可以帮助抵消所谓的“民意调查疲劳”(在这种情况下,选民开始避免接听民意测验者的电话,从而影响了样本的代表性)。
本文提议的SBS工具中的组件可以被完全转换为品牌经理和数字营销专家可以使用的报告。SBS的预测能力及其三个维度(即流行性、多样性和连通性)已在包括旅游管理和政治预测在内的各种环境中得到了证明。
原文:
https://arxiv.org/abs/2001.11479v1
边缘计算与深度学习的融合调查
这是一个以信息为中心的时代,从个人计算机,智能手机和云数据中心服务器群集,到可穿戴设备和其他物联网(IoT)设备,用于运算和存储的设备数量激增。运算设备的增长激发了人们对边缘智能的关注,希望通过边缘计算促进DL服务的部署。
深度学习可以集成于边缘计算框架中,从而有助于构建一个动态且自适应的边缘维护和管理系统。本文介绍了相应的实现方法和支持技术的应用场景,即定制边缘计算框架中的深度学习训练和推理。此外, 本文还进一步描述了更加普及和细化的情报所面临的挑战和未来趋势。
随着边缘计算能力的提高,边缘智能将变得不在罕见。这项工作介绍和讨论了边缘智能和智能边缘的各种方案和基本启用技术。
通过合并散布在通信,网络和深度学习领域中的信息,此调查可以帮助读者理解技术之间的联系,同时促进有关边缘智能与智能边缘融合的进一步讨论。
原文:
https://arxiv.org/abs/1907.08349v3
表示学习已实现无监督无反向传播CNN
这项新研究提出了一种无监督,无反向传播的学习算法。在没有明确定义的损失函数的情况下,该算法使用两个学习规则,逐层更新权重,从而减少了标量领结问题。研究人员认为,这是有史以来,第一个将CNN,SOM和Hebbian Learning原理结合到单个深度学习模型中的方法。
主要贡献:
- 用于训练CSNN模型,该算法使得研究人员可以获得与很多无监督训练模型相当的性能;
- 通过呈现两种类型的权重来掩盖输入和神经元活动,从而克服SOM在图像补丁上训练的问题;
- 建议使用多头版本以进一步提高性能。
这项工作介绍了CSNN的模块化构建基块,可以在无反向传播的情况下以无监督的方式实现表示学习。
通过结合CNN,SOM和Hebbian掩码学习的CSNN模块,用于学习无监督特征层次结构的新的替代方法一直在被探索中。标量领结问题和目标函数不匹配都可以一起解决,并提出引出了有趣的未来研究方向。
阅读更多:
https://arxiv.org/abs/2001.10388v1
其他爆款论文
Google AI发布了苍蝇大脑中神经元连接的超详细地图,同时发布了用于可视化分析的工具套件:
https://ai.googleblog.com/2020/01/releasing-drosophila-hemibrain.html
想要追踪多个对象?你可以使用这个操作简便的基于云的应用程序:
https://arxiv.org/abs/2001.10072v1
为新闻报道创造代表性的头条新闻而奋斗:
https://arxiv.org/abs/2001.09386v2
Deep NRSfM ++,一种可以从2D地标联合恢复3D形状和相机姿势的通用框架:
https://arxiv.org/abs/2001.10090v1
为什么要用最新的ML分析历史照片档案:
https://arxiv.org/abs/1904.09811v3
数据集
航空视频事件识别的大规模数据集和深度学习基准:
https://arxiv.org/abs/2001.11394v1
用于视频异常检测的新数据集和评估协议:
https://arxiv.org/abs/1902.05872v3
AI大事件
上海利用面部识别技术帮助抓获毒犯: