一周AI最火论文 | 再见,scikit-learn!终于等到新ML Python包

简介: 一周AI最火论文 | 再见,scikit-learn!终于等到新ML Python包

本周关键词:GAN、物理建模、物联网设备识别

本周最佳学术研究

用于微调GAN的简单有效基准——冻结判别器

生成对抗网络(GANs)在大量计算机视觉问题中表现出色,但通常对训练数据和计算资源的需求量大。转移学习可以解决这个困难,但其间很容易导致过拟合或对分布转移的学习效果不好等问题。

为了应对这一挑战,研究人员现在提出了一个简单而有效的基准用于GAN的转移学习。他们发现,微调网络(生成器和判别器)的同时冻结判别器的底层效果出奇得好,因此冻结判别器就诞生了。

在StyleGAN和SNGAN投影架构下和Animal Face、Anime Face、Oxford Flower、CUB-200-2011和Caltech-256数据集中,研究人员提出的冻结判别器基准在无条件和有条件GAN中的表现均明显优于现有方法。

研究人员表示,使用者可以自行采用更复杂的设计来得到比本文提出的基准更优的结果,这表明该研究方向的前景可期。

Github传送门:

https://github.com/sangwoomo/freezeD

原文:

https://arxiv.org/abs/2002.10964v1

用于计算物理的轻量级Python框架

这项工作描述了一种新开发的计算框架turboPy。它是一个轻量级的物理建模框架,基于使用了胞中粒子法(PIC)编码的设计turboWAVE,来快速制定新的物理规范原型。

TurboPy实现了很多个类,包括驱动模拟并管理物理模块之间交流的Simulation,处理问题各部分动态细节的PhysicsModule和处理常见的各种辅助问题的Grid和Diagnostic等。

turboPy框架的使用可以减轻计算科学家的认知负担,同时实现新代码的设计来完成所需工作流程。使用者只需将工作流程描绘成一个在时间循环中重复发生的过程,再简单将其转化成turboPy框图即可。

创建GUI来开发turboPy框图并完成问题设定,进而提供python软件包便于用户的安装使用,如此turboPy可以更好地在将来的工作中发挥作用。

原文:

https://arxiv.org/abs/2002.08842

一劳永逸的两级开放式词汇语言模型

本文提出了一种神经语言模型,其中包含了用于单词拼写的生成模型。研究人员展示了在开放式词汇NLP任务中,使用已知单词的拼写帮助处理未知单词的过程。


这种方法可以用于扩展任何封闭式词汇生成模型,但是本文重点考虑了神经语言建模的情况。该贝叶斯生成模型将两个模型合并起来生成故事,其中标准的RNN语言模型用于生成每个句子中的单词标记,而基于RNN的拼写模型用于生成每种单词类型中的字母。

和语言学中一样,这两个RNN各自捕获的信息(句子结构和单词结构)是分离的。再调用第二个RNN为上下文中的新单词生成拼写,开放式词汇模型就完成了。

与基准相比,该模型的表现击败了之前的研究成果,并在多个数据集上得到了当前最优的结果。

这个两级开放式词汇生成模型不仅可以记住常用单词的拼写和嵌入信息,而且还可以根据词汇或非词汇的拼写风格,联系上下文生成新的单词类型

该方法将来可以用在其他使用单词嵌入的生成式NLP模型中,并且在诸如文本分类(特别是在资源较少的语言和领域)等任务中发挥极大作用。

原文:

https://arxiv.org/pdf/1804.08205v4.pdf


用于快速机器学习模型开发的Python API

在本文中,德国明斯特大学的研究人员介绍了他们所谓的PHOTON,它是一种高级Python应用程序编程接口(API)。针对当前最佳实践的机器学习模型,它提供了一种方便使用且灵活的方法来实现快速,可重复且无偏见的效果。 PHOTON基于三个概念:设计,自动化和集成。

PHOTON旨在简化和加速机器学习模型开发的过程。它可以设计基本和高级机器学习管道架构,并自动化重复的训练、优化和评估工作流程。 PHOTON可以轻松访问已建立的机器学习工具箱,还可以针对模型构建和评估过程的任何部分,实现集成自定义算法和解决方案。它在概念上与scikit-learn相似,但在核心功能方面进行了扩展。

PHOTON旨在简化和加速机器学习工作流程,从而实现快速,可重复且无偏见的分析。它特别适合需要迭代评估新方法的环境,例如医学和生命科学中的应用机器学习研究。研究人员未来希望扩展更多功能和可用性,并吸引更多的开发人员和用户来建立一个繁荣的开源社区。

原文:

https://arxiv.org/abs/2002.05426

使用深度学习进行物联网设备识别

广泛采用的自带设备(BYOD)策略允许员工将任何物联网设备带入工作场所,这增加了组织网络被攻击的风险。

研究人员日前第一次将深度学习技术应用于网络流量的TCP有效负载,以进行IoT设备分类和识别。在这项工作中,他们提出了一种方法,该方法使用深度学习来识别网络流量中的已知和未经授权的IoT设备,识别出10种不同的IoT设备以及智能手机和计算机的流量,其准确率超过99%,总体上达到检测连接到网络的未授权IoT设备的高于99%的平均准确度。

与以前的研究不同,该方法通过使用从物联网设备的网络流量有效载荷中构建的小图像来表示物联网设备的“通信行为”,不需要在网络流量上应用复杂的特征工程。

该方法在架构方面很简单,并且没有特征工程的开销。它可用于检测网络流量中列入白名单的IoT设备。该技术只需要一个TCP会话即可检测到源物联网设备,而现有方法则需要多个TCP会话才能进行检测。

原文:

https://arxiv.org/abs/2002.11686v1



相关实践学习
钉钉群中如何接收IoT温控器数据告警通知
本实验主要介绍如何将温控器设备以MQTT协议接入IoT物联网平台,通过云产品流转到函数计算FC,调用钉钉群机器人API,实时推送温湿度消息到钉钉群。
阿里云AIoT物联网开发实战
本课程将由物联网专家带你熟悉阿里云AIoT物联网领域全套云产品,7天轻松搭建基于Arduino的端到端物联网场景应用。 开始学习前,请先开通下方两个云产品,让学习更流畅: IoT物联网平台:https://iot.console.aliyun.com/ LinkWAN物联网络管理平台:https://linkwan.console.aliyun.com/service-open
相关文章
|
25天前
|
开发者 Python
如何在Python中管理模块和包的依赖关系?
在实际开发中,通常会结合多种方法来管理模块和包的依赖关系,以确保项目的顺利进行和可维护性。同时,要及时更新和解决依赖冲突等问题,以保证代码的稳定性和可靠性
42 4
|
28天前
|
机器学习/深度学习 数据采集 算法
深入调查研究Scikit-learn
【11月更文挑战第11天】
43 1
|
24天前
|
测试技术 Python
手动解决Python模块和包依赖冲突的具体步骤是什么?
需要注意的是,手动解决依赖冲突可能需要一定的时间和经验,并且需要谨慎操作,避免引入新的问题。在实际操作中,还可以结合使用其他方法,如虚拟环境等,来更好地管理和解决依赖冲突😉。
|
24天前
|
持续交付 Python
如何在Python中自动解决模块和包的依赖冲突?
完全自动解决所有依赖冲突可能并不总是可行,特别是在复杂的项目中。有时候仍然需要人工干预和判断。自动解决的方法主要是提供辅助和便捷,但不能完全替代人工的分析和决策😉。
|
10天前
|
人工智能 小程序 JavaScript
【一步步开发AI运动小程序】十四、主包超出2M大小限制,如何将插件分包发布?
本文介绍了如何从零开始开发一个AI运动小程序,重点讲解了通过分包技术解决程序包超过2M限制的问题。详细步骤包括在uni-app中创建分包、配置`manifest.json`和`pages.json`文件,并提供了分包前后代码大小对比,帮助开发者高效实现AI运动功能。
|
16天前
|
Python 容器
[oeasy]python048_用变量赋值_连等赋值_解包赋值_unpack_assignment _
本文介绍了Python中变量赋值的不同方式,包括使用字面量和另一个变量进行赋值。通过`id()`函数展示了变量在内存中的唯一地址,并探讨了变量、模块、函数及类类型的地址特性。文章还讲解了连等赋值和解包赋值的概念,以及如何查看已声明的变量。最后总结了所有对象(如变量、模块、函数、类)都有其类型且在内存中有唯一的引用地址,构成了Python系统的基石。
26 5
|
25天前
|
Python
Python的模块和包
总之,模块和包是 Python 编程中非常重要的概念,掌握它们可以帮助我们更好地组织和管理代码,提高开发效率和代码质量
37 5
|
24天前
|
数据可视化 Python
如何在Python中解决模块和包的依赖冲突?
解决模块和包的依赖冲突需要综合运用多种方法,并且需要团队成员的共同努力和协作。通过合理的管理和解决冲突,可以提高项目的稳定性和可扩展性
|
1月前
|
人工智能 IDE 开发工具
Python AI 编程助手
Python AI 编程助手。
47 5
|
1月前
|
机器学习/深度学习 数据采集 算法
Python机器学习:Scikit-learn库的高效使用技巧
【10月更文挑战第28天】Scikit-learn 是 Python 中最受欢迎的机器学习库之一,以其简洁的 API、丰富的算法和良好的文档支持而受到开发者喜爱。本文介绍了 Scikit-learn 的高效使用技巧,包括数据预处理(如使用 Pipeline 和 ColumnTransformer)、模型选择与评估(如交叉验证和 GridSearchCV)以及模型持久化(如使用 joblib)。通过这些技巧,你可以在机器学习项目中事半功倍。
47 3