本周关键词:NLP、吴恩达、机器人
AI新闻
NLP的英雄们
Heroes of NLP是一个由DeepLearning.AI的创始人吴恩达发起的采访系列视频,视频中吴恩达与诸位NLP的领军人物进行了深入交流。
DroneDeploy结合无人机和机器人,提供360度全景数据
自2013年以来,DroneDeploy就一直致力于帮助企业管理无人机来分析并分析从空中拍摄到的数据。而现在,通过与地面机器人的结合,DroneDeploy将为企业提供360度的漫游数据。
无数据学习——黑科技解决样本缺乏问题
“Less than one”-shot可以教会一个模型识别比它的训练集中对象数量更多的实体。
一种利用AI检测DDoS攻击的方法
使用AI模型来检测7种DDoS攻击,准确率超过96%。
详情:
https://towardsdatascience.com/an-approach-to-detect-ddos-attack-with-a-i-15a768998cf7
AI学术
通过添加、操作或删除对象对场景进行语义编辑
图像编辑是一项具有挑战性的任务,在媒体、电影和社交网络中受到越来越多的关注。自90年代初以来,类似Gimp和Photoshop工具已经被广泛地用于这项任务。然而,两者都需要高水平的专业知识,而且都是劳动密集型的。生成性对抗网络(GAN)提供了一种基于学习的替代方案,能够帮助非专家在编辑照片时表达他们的创造力,并且能够产生高度的真实感。然而,它们在图像编辑中的适用性还没有得到充分的探索。
本文介绍了一种新颖的语义图像编辑方法SESAME,它涵盖了添加、操作和删除等操作。这一生成器只需调整用户想要编辑的区域的语义,就可以操纵图像,而不需要关于整个布局的信息。另一方面,鉴别器在不同的流中处理语义和图像信息,克服了PatchGAN固有的级联方法的局限性。SESAME在语义图像处理和布局到图像生成的任务上产生了最先进的结果,并允许用户直观地在图像上绘制来编辑图像。
通过自我训练提升NLP的预训练
自我训练和预训练在本质上是一样的还是互补的?本研究结果显示,自我训练是另一种有效利用未标记信息的方法。为了获得特定任务的附加数据,本文引入了SentAugment,一种数据扩充方法。它从标记的数据中计算出特定于任务的查询嵌入,从而能够从一个由数十亿未标记语句组成的语句库中抓取所需信息。与现有的半监督方法不同,该方法不需要域内未标记的数据,因此具有更广泛的适用性。
测试结果表明,在各种任务上,自我训练与强大的RoBERTa基线是互补的,所提出的增强方法可以实现可伸缩和有效的自我训练,在标准文本分类基准上的改进率高达2.6%。最后,这项工作也是知识提炼和few-shot学习方面的实质性成果。