一周AI最火论文 | 讲讲话就能控制UI界面上网冲浪?

简介: 一周AI最火论文 | 讲讲话就能控制UI界面上网冲浪?

本周关键词:机器学习安全性、数据编程、对象再识别

本周最佳学术研究

提升机器学习系统的安全性:了解如何保护机器学习模型

对于任何软件系统来说安全性都至关重要,这也包括机器学习(ML)模型,因为人们可以通过对抗性示例轻松地适应从而攻击该模型。

现在研究界对于探索和发现对抗性攻击已经有了许多文献和复杂的算法,并提出了一些有可能实施的防御措施。例如,近日一些研究人员发表的这篇论文:机器学习究竟在网络安全领域中处于什么位置?

论文链接:
https://medium.com/ai%C2%B3-theory-practice-business/where-does-machine-learning-stand-in-cyber-security-670e3fe1cda2

但是,根据与华盛顿大学合作和Microsoft Research的一组研究人员的说法,之前对于ML模型安全性的研究大多数的研究对象都是独立的神经网络模型。

在这份最新的研究报告中,研究人员们评估了大规模部署的ML软件产品的安全性,希望能够扩大这一领域的研究范围,从而提供一个从系统安全性视角出发改进现有软件产品的方法。它们描述了使用ML组件在软件中实现系统安全的最佳实践,并提出了一系列的短期缓解建议,部署机器学习模块的从业人员可以参考他们的研究来保护软件系统。

原文:
https://arxiv.org/abs/2007.07205v1

将自然语言转化为移动UI操作

在ACL 2020上发表的这篇论文中,谷歌AI研究人员展示了解决自动动作序列映射问题的第一步:创建三个新的数据集,用于训练深度学习模型,将自然语言指令应用于可执行的移动用户界面操作。

他们的这一成果为移动设备上的任务自动化奠定了技术基础,从而减轻了通过UI细节进行操作的需求,这对于视力受损的用户将非常有价值。他们还开源了其模型代码和数据管道,以促进研究界的进一步发展。

Github链接:
https://github.com/google-research/google-research/tree/master/seq2act

原文:
https://arxiv.org/pdf/2005.03776.pdf

基于数据编程的工业图像标签系统

最近发布的这篇论文提出了Inspector Gadget:一种用于分类问题的可伸缩图像标签系统。该系统有效地结合了众包、数据增强和数据编程技术。Inspector Gadget的目标应用是在制造业中对大型工业图像进行部分分析,此前在这一领域很少甚至根本没有标签。

与现有的使用对象检测模型预先将图像转换为结构化数据的数据编程方法不同,Inspector Gadget通过提供众包工作流以利用人类知识来识别人们希望研究的模式来直接标记图像。然后,将图案增强并与其他图像匹配,并生成用于神经网络模型训练的相似性特征。

结果表明,Inspector Gadget优于其他图像标记方法,例如Snuba,GOGGLES以及使用CNN而不进行预训练的自习基准模型。研究人员认为,Inspector Gadget开辟了使用数据编程的新方向。

原文:
https://arxiv.org/pdf/2004.03264v2.pdf

用于通用实例再识别的Pytorch工具箱FastReID

在本文中,研究人员介绍了一个名为FastReID的开源库,该库可用于通用实例再识别。

实验结果证明了FastReID在多种任务上具有通用性和有效性,例如:人员再识别和车辆再识别等。研究人员称,共享FastReID是因为开源研究平台对整个AI社区(包括学术界和工业界的研究和从业人员)的快速进步至关重要。

他们希望通过发布FastReID来继续加速通用实例再识别领域的发展,同时也期待彼此之间的学习合作,以促进计算机视觉领域的发展。

原文:
https://arxiv.org/pdf/2006.02631v4.pdf

用于紧凑3D人脸建模的基于关节的神经装备表示(Neural Rig Representation)

本文提出了一种新的3D人脸表示方法,它使用基于关节的人脸装备(rig)搭建人脸模型。该模型非常紧凑,因此需要使用更小的数量级来保有其强大功能。这一需求可以通过学习神经蒙皮权重(neural skinning weights)来满足。研究人员还通过重新拓扑扫描、BU-3DFE、可视化Azure Kinect和2D图像等来评估模型。

该模型具有可进行人脸蒙皮编辑和装饰的优点。研究人员已经将人脸模型整合到点云和2D图像,因此未来的工作是通过学习神经网络来直接预测人脸模型参数,从而为加速实时应用重建提供可能。

原文:
https://arxiv.org/pdf/2007.06755v2.pdf

其他爆款论文

通过像素级自动图像标记实现语义图像分割,性能超过大部分已有的弱监督方法:
https://arxiv.org/pdf/2007.07415v1.pdf

有关机器学习中隐私攻击的最新调查结果:
https://arxiv.org/pdf/2007.07646v1.pdf

从平均场博弈(MFG)和最佳运输(OT)角度分别理解和分析生成对抗网络(GAN):
https://arxiv.org/abs/2002.04112v2

特征量化助力GAN训练:
https://arxiv.org/pdf/2004.02088v2.pdf

表情符号预测的拓展和基准测试:
https://arxiv.org/abs/2007.07389v1

学习资源

70多个机器学习数据集和项目构想:
https://googleweblight.com/i?u=https://data-flair.training/blogs/machine-learning-datasets/

2020年机器学习项目Top 21:
https://data-flair.training/blogs/machine-learning-project-ideas/

面向初学者的免费机器学习项目构想:
https://www.skyfilabs.com/blog/free-machine-learning-project-ideas-for-beginners

DeepMind与UCL AI中心共同打造深度学习系列讲座:
https://www.youtube.com/playlist?list=PLqYmG7hTraZCDxZ44o4p3N5Anz3lLRVZF

AI大事件

AI芯片初创公司Graphcore开启系统业务,称其比Nvidia经济适用得多:
https://www.zdnet.com/article/ai-chip-startup-graphcore-enters-the-system-business-claiming-economics-vastly-better-than-nvidias/

ICML 2020之Google篇:
https://ai.googleblog.com/2020/07/google-at-icml-2020.html

AI的超强能力能否协助人类外科医生减少医疗错误:
https://www.zdnet.com/article/big-backing-pair-doctors-ai-assist-technology/

相关文章
|
3月前
|
计算机视觉 Python
基于Dlib的人脸识别客户端(UI界面)
基于Dlib的人脸识别客户端(UI界面)
87 2
|
13天前
|
数据采集 人工智能 自然语言处理
Midscene.js:AI 驱动的 UI 自动化测试框架,支持自然语言交互,生成可视化报告
Midscene.js 是一款基于 AI 技术的 UI 自动化测试框架,通过自然语言交互简化测试流程,支持动作执行、数据查询和页面断言,提供可视化报告,适用于多种应用场景。
131 1
Midscene.js:AI 驱动的 UI 自动化测试框架,支持自然语言交互,生成可视化报告
|
15天前
|
移动开发 前端开发 Java
Java最新图形化界面开发技术——JavaFx教程(含UI控件用法介绍、属性绑定、事件监听、FXML)
JavaFX是Java的下一代图形用户界面工具包。JavaFX是一组图形和媒体API,我们可以用它们来创建和部署富客户端应用程序。 JavaFX允许开发人员快速构建丰富的跨平台应用程序,允许开发人员在单个编程接口中组合图形,动画和UI控件。本文详细介绍了JavaFx的常见用法,相信读完本教程你一定有所收获!
Java最新图形化界面开发技术——JavaFx教程(含UI控件用法介绍、属性绑定、事件监听、FXML)
|
2月前
|
开发框架 JavaScript 前端开发
HarmonyOS UI开发:掌握ArkUI(包括Java UI和JS UI)进行界面开发
【10月更文挑战第22天】随着科技发展,操作系统呈现多元化趋势。华为推出的HarmonyOS以其全场景、多设备特性备受关注。本文介绍HarmonyOS的UI开发框架ArkUI,探讨Java UI和JS UI两种开发方式。Java UI适合复杂界面开发,性能较高;JS UI适合快速开发简单界面,跨平台性好。掌握ArkUI可高效打造符合用户需求的界面。
140 8
|
3月前
|
机器学习/深度学习 数据可视化 计算机视觉
基于opencv的车牌识别系统(UI界面采用tkinter设计)
基于opencv的车牌识别系统(UI界面采用tkinter设计)
72 0
|
5月前
|
编解码 前端开发 vr&ar
从零开始的PICO教程(4)--- UI界面绘制与响应事件
这篇文章是PICO开发系列教程的第四部分,主要介绍了如何在PICO 4 VR环境中创建UI界面,包括Canvas和Panel的配置、UI元素的绘制、以及Button和Slider的事件响应绑定,并通过示例展示了数字增减和滑块功能的具体实现。
从零开始的PICO教程(4)--- UI界面绘制与响应事件
|
4月前
|
XML Android开发 UED
💥Android UI设计新风尚!掌握Material Design精髓,让你的界面颜值爆表!🎨
随着移动应用市场的蓬勃发展,用户对界面设计的要求日益提高。为此,掌握由Google推出的Material Design设计语言成为提升应用颜值和用户体验的关键。本文将带你深入了解Material Design的核心原则,如真实感、统一性和创新性,并通过丰富的组件库及示例代码,助你轻松打造美观且一致的应用界面。无论是色彩搭配还是动画效果,Material Design都能为你的Android应用增添无限魅力。
97 1
|
4月前
|
人工智能 开发者
Nature曝惊人内幕:论文被天价卖出喂AI!出版商狂赚上亿,作者0收入
【9月更文挑战第8天】《自然》杂志近日揭露,学术出版商如泰勒·弗朗西斯与微软签订千万美元合约,及威利获高额报酬,将论文提供给科技巨头训练AI模型,引发学界对版权与收益分配的热议。此现象反映了AI对高质量数据的渴求,但亦使研究人员担忧成果被无偿商用,且可能影响学术独立性。尽管AI训练使用学术资源能提升模型科学性,助力科研进展,但如何保障作者权益及维持学术纯粹性仍是亟待解决的问题。https://www.nature.com/articles/d41586-024-02599-9
83 4
|
5月前
|
容器 iOS开发 Linux
震惊!Uno Platform 响应式 UI 构建秘籍大公开!从布局容器到自适应设计,带你轻松打造跨平台完美界面
【8月更文挑战第31天】Uno Platform 是一款强大的跨平台应用开发框架,支持 Web、桌面(Windows、macOS、Linux)及移动(iOS、Android)等平台,仅需单一代码库。本文分享了四个构建响应式用户界面的最佳实践:利用布局容器(如 Grid)适配不同屏幕尺寸;采用自适应布局调整 UI;使用媒体查询定制样式;遵循响应式设计原则确保 UI 元素自适应调整。通过这些方法,开发者可以为用户提供一致且优秀的多设备体验。
209 0
|
6月前
|
XML Android开发 UED
💥Android UI设计新风尚!掌握Material Design精髓,让你的界面颜值爆表!🎨
【7月更文挑战第28天】随着移动应用市场的发展,用户对界面设计的要求不断提高。Material Design是由Google推出的设计语言,强调真实感、统一性和创新性,通过模拟纸张和墨水的物理属性创造沉浸式体验。它注重色彩、排版、图标和布局的一致性,确保跨设备的统一视觉风格。Android Studio提供了丰富的Material Design组件库,如按钮、卡片等,易于使用且美观。
179 1