一周AI最火论文 | 比男朋友更会聊天的机器人指日可待?谷歌AI发布新款Chatbot

简介: 一周AI最火论文 | 比男朋友更会聊天的机器人指日可待?谷歌AI发布新款Chatbot

本周关键词:chatbot、数据流分析、边缘计算

本周最佳学术研究

Google AI Meena:可以聊天聊地聊一切的机器人

Google Research Brain Team推出了一款基于AI的聊天机器人,名叫Meena。与此前最新的聊天机器人相比,它可以进行更合理、更具体的对话。

Meena有26亿个参数,并接受了341 GB文本的训练,这些文本从公共领域的社交媒体对话中被筛选出来。与现有最新的生成模型OpenAI GPT-2相比,Meena具有1.7倍的模型容量,并接受了8.5倍的数据进行训练。为了改进性能,研究人员应用了他们针对开放域聊天机器人提出的一种新的人类评估指标,称为“敏感度和特异性平均值(SSA)”,它捕获了人类对话中基础却重要的属性。

长期以来,研究人员一直在寻找一种自动评估指标,该指标能够与更准确的人工评估相关联、从而更快地开发对话模型,但这一直是充满挑战的。出乎意料的是,他们在训练Meena模型时发现了一种可以用于任何神经seq2seq模型的自动指标——困惑值,该值与人类评估(例如SSA值)具有很强的相关性。

Meena的困惑值为10.2,转换成SSA值就是72%.与其他聊天机器人获得的SSA值相比,SSA 值72%与普通人类达到的SSA值 86%相差不远。完整版Meena具有过滤机制和可调谐解码功能,可将SSA值进一步提高到79%。

有了如此引人入胜的结果,像人与人之间对话那样与现代机器人对话似乎离我们越来越近了。Meena无疑是一项惹人注目的研究成果,它可能带来人机交互中许多有趣且强大的应用。

原文:

https://arxiv.org/abs/2001.09977

数据科学的团队协作模式用于数据流批量分析的Stream-learn的Python包

弗罗茨瓦夫科技大学的研究人员介绍了名为Stream-learn的Python包,用以进行漂移和不平衡的数据流分析。该软件包与Scikit-learn兼容,其主要组件是一个流生成器,允许合成数据流的生成。该合成数据流可以在其循环或非循环版本中结合三种主要的概念漂移类型(即突然漂移、渐进漂移和增量漂移)中的每一个。

Python包允许按照既定的评估方法(Test-Then-Train和Prequential)进行实验。此外,研究人员已经实现了适用于数据流分类的估计器,包括简单分类器、最新的基于块的分类器和在线分类器的集合。为了提高计算效率,该包将其自带的预测指标实现方式用于不平衡的二进制分类任务。

Stream-learn Python包是一个方便使用的开源库,用于困难的数据流分类。它可以根据不同的特征生成流,这些特征由各种类型的概念漂移和类不平衡水平组成,其中包括先前类概率中可能出现的漂移。

附加模块允许使用大众熟知的估算方法实现分类器和分类器集合,从而对数据流进行实验。它的主要想法是使得用户即刻熟悉数据流分类任务。该软件包已经在多篇科学论文的研究过程中得到了测试。对于那些偏好简单的处理过程、容易的操作方法、并与Scikit-learn机器学习库集成使用的用户而言,这是一个理想的工具。

原文:

https://arxiv.org/abs/2001.11077v1

一种衡量品牌重要性和品牌定位的创新型工具

在本文中,研究人员描述了SBS品牌智能应用程序(SBS BI)的功能,该功能旨在评估品牌重要性并通过文本数据分析提供品牌分析。为了更好地描述SBS BI的功能,他们提供了一个针对2020年美国民主总统初选的案例研究。

研究人员从Event Registry数据库下载了5万篇在线文章,其中包括从全球收集的主流新闻和博客新闻。这些在线新闻文章被转换为共现单词网络,并与社交网络分析和文本挖掘中的方法和工具相结合进行分析。

通过全面分析人们(包括新闻记者、评论员、选民等在内)对网上候选人的评论,这项工作中描述的方法在补充传统的民意调查上展现出了巨大的潜力。本文所提出的方法基于对大量文本数据的自动挖掘,这可以帮助抵消所谓的“民意调查疲劳”(在这种情况下,选民开始避免接听民意测验者的电话,从而影响了样本的代表性)。

本文提议的SBS工具中的组件可以被完全转换为品牌经理和数字营销专家可以使用的报告。SBS的预测能力及其三个维度(即流行性、多样性和连通性)已在包括旅游管理和政治预测在内的各种环境中得到了证明。

原文:

https://arxiv.org/abs/2001.11479v1

边缘计算与深度学习的融合调查

这是一个以信息为中心的时代,从个人计算机,智能手机和云数据中心服务器群集,到可穿戴设备和其他物联网(IoT)设备,用于运算和存储的设备数量激增。运算设备的增长激发了人们对边缘智能的关注,希望通过边缘计算促进DL服务的部署。

深度学习可以集成于边缘计算框架中,从而有助于构建一个动态且自适应的边缘维护和管理系统。本文介绍了相应的实现方法和支持技术的应用场景,即定制边缘计算框架中的深度学习训练和推理。此外, 本文还进一步描述了更加普及和细化的情报所面临的挑战和未来趋势。

随着边缘计算能力的提高,边缘智能将变得不在罕见。这项工作介绍和讨论了边缘智能和智能边缘的各种方案和基本启用技术。

通过合并散布在通信,网络和深度学习领域中的信息,此调查可以帮助读者理解技术之间的联系,同时促进有关边缘智能与智能边缘融合的进一步讨论。

原文:

https://arxiv.org/abs/1907.08349v3

表示学习已实现无监督无反向传播CNN

这项新研究提出了一种无监督,无反向传播的学习算法。在没有明确定义的损失函数的情况下,该算法使用两个学习规则,逐层更新权重,从而减少了标量领结问题。研究人员认为,这是有史以来,第一个将CNN,SOM和Hebbian Learning原理结合到单个深度学习模型中的方法。

主要贡献:

  • 用于训练CSNN模型,该算法使得研究人员可以获得与很多无监督训练模型相当的性能;
  • 通过呈现两种类型的权重来掩盖输入和神经元活动,从而克服SOM在图像补丁上训练的问题;
  • 建议使用多头版本以进一步提高性能。

这项工作介绍了CSNN的模块化构建基块,可以在无反向传播的情况下以无监督的方式实现表示学习。

通过结合CNN,SOM和Hebbian掩码学习的CSNN模块,用于学习无监督特征层次结构的新的替代方法一直在被探索中。标量领结问题和目标函数不匹配都可以一起解决,并提出引出了有趣的未来研究方向。

阅读更多:

https://arxiv.org/abs/2001.10388v1

其他爆款论文

Google AI发布了苍蝇大脑中神经元连接的超详细地图,同时发布了用于可视化分析的工具套件:

https://ai.googleblog.com/2020/01/releasing-drosophila-hemibrain.html

想要追踪多个对象?你可以使用这个操作简便的基于云的应用程序:

https://arxiv.org/abs/2001.10072v1

为新闻报道创造代表性的头条新闻而奋斗:

https://arxiv.org/abs/2001.09386v2

Deep NRSfM ++,一种可以从2D地标联合恢复3D形状和相机姿势的通用框架:

https://arxiv.org/abs/2001.10090v1

为什么要用最新的ML分析历史照片档案:

https://arxiv.org/abs/1904.09811v3

数据集

航空视频事件识别的大规模数据集和深度学习基准:

https://arxiv.org/abs/2001.11394v1

用于视频异常检测的新数据集和评估协议:

https://arxiv.org/abs/1902.05872v3

AI大事件

上海利用面部识别技术帮助抓获毒犯:

https://artificialintelligence-news.com/2020/01/17/shanghai-uses-facial-recognition-to-help-catch-drug-offenders/



相关文章
|
1月前
|
人工智能 C语言 Windows
Ollama部署在线ai聊天
本文介绍了如何在Windows系统上安装和部署AI聊天模型Ollama,包括安装步骤、模型安装、运行模型项目,以及使用Ollama生成C语言平衡二叉树的完整代码。
77 2
Ollama部署在线ai聊天
|
26天前
|
机器学习/深度学习 人工智能 自动驾驶
2024.10|AI/大模型在机器人/自动驾驶/智能驾舱领域的最新应用和深度洞察
本文介绍了AI和大模型在机器人、自动驾驶和智能座舱领域的最新应用和技术进展。涵盖多模态大语言模型在机器人控制中的应用、移动机器人(AMRs)的规模化部署、协作机器人的智能与安全性提升、AR/VR技术在机器人培训中的应用、数字孪生技术的优化作用、Rust语言在机器人编程中的崛起,以及大模型在自动驾驶中的核心地位、端到端自动驾驶解决方案、全球自动驾驶的前沿进展、智能座舱的核心技术演变和未来发展趋势。
50 2
|
8天前
|
存储 人工智能 搜索推荐
AI智能语音机器人的基本业务流程
简介: 先画个图,了解下AI语音机器人的基本业务流程。上图是一个AI语音机器人的业务流程,简单来说就是首先要配置话术,就是告诉机器人在遇到问题该怎么回答,这个不同公司不同行业的差别比较大,所以一般每个客户都会配置其个性化的话术。话术配置完成后,需要给账号配置线路,目的就是能够顺利的把电话打出去。线路配完后,就是建立任务了,说白了就是导入电话号码,因为资源有限,不可能导入一批立即打完,所以需要以任务的形式分配给机器人,然后机器人逐个完成。值得一提的是,如果有多条线路,创建任务时建议提供线路选择功能,很多公司的业务不止一个城市,而大家又是比较习惯接听自己所在城市的电话,所以这个选择主
|
1月前
|
机器学习/深度学习 传感器 人工智能
马斯克的AI机器人可以拯救一个陷入困境的教育系统吗?
马斯克的AI机器人可以拯救一个陷入困境的教育系统吗?
|
1月前
|
人工智能 搜索推荐 机器人
挑战未来职场:亲手打造你的AI面试官——基于Agents的模拟面试机器人究竟有多智能?
【10月更文挑战第7天】基于Agent技术,本项目构建了一个AI模拟面试机器人,旨在帮助求职者提升面试表现。通过Python、LangChain和Hugging Face的transformers库,实现了自动提问、即时反馈等功能,提供灵活、个性化的模拟面试体验。相比传统方法,AI模拟面试机器人不受时间和地点限制,能够实时提供反馈,帮助求职者更好地准备面试。
55 2
|
1月前
|
人工智能 自然语言处理 机器人
MIT新研究揭秘AI洗脑术!AI聊天诱导人类编造记忆,真假难辨
麻省理工学院的一项新研究《基于大型语言模型的对话式AI在证人访谈中加剧虚假记忆》显示,使用生成式聊天机器人进行犯罪证人访谈会显著增加参与者的虚假记忆,且影响持久。研究设置了对照组、问卷访谈、预设脚本及生成式聊天机器人四种条件,结果显示生成式聊天机器人诱导的虚假记忆数量远超其他方法。尽管AI技术在效率和准确性方面潜力巨大,但在敏感领域需谨慎应用,并需进一步评估风险,制定伦理准则和监管措施。论文详细内容见[这里](https://arxiv.org/abs/2408.04681)。
45 2
|
2月前
|
人工智能 自然语言处理 机器人
谷歌将大模型集成在实体机器人中,能看、听、说执行57种任务
【9月更文挑战第17天】近年来,人工智能在多模态大模型领域取得显著进展。谷歌最新研发的Mobility VLA系统,将大模型与实体机器人结合,实现了视觉、语言和行动的融合,使机器人能理解并执行复杂多模态指令,如“我应该把这个放回哪里?”系统在真实环境测试中表现出色,但在计算资源、数据需求及伦理问题上仍面临挑战。相关论文发布于https://arxiv.org/abs/2407.07775。
65 9
|
3月前
|
存储 人工智能 自然语言处理
无缝融入,即刻智能[二]:Dify-LLM平台(聊天智能助手、AI工作流)快速使用指南,42K+星标见证专属智能方案
【8月更文挑战第8天】无缝融入,即刻智能[二]:Dify-LLM平台(聊天智能助手、AI工作流)快速使用指南,42K+星标见证专属智能方案
无缝融入,即刻智能[二]:Dify-LLM平台(聊天智能助手、AI工作流)快速使用指南,42K+星标见证专属智能方案
|
3月前
|
JSON 自然语言处理 分布式计算
定制个机器人帮你和Ta聊天
定制个机器人帮你和Ta聊天
|
3月前
|
人工智能 API C#
动手学Avalonia:基于SemanticKernel与硅基流动构建AI聊天与翻译工具
动手学Avalonia:基于SemanticKernel与硅基流动构建AI聊天与翻译工具
59 2
下一篇
无影云桌面