一周AI最火论文 | 再见,scikit-learn!终于等到新ML Python包

简介: 一周AI最火论文 | 再见,scikit-learn!终于等到新ML Python包

本周关键词:GAN、物理建模、物联网设备识别

本周最佳学术研究

用于微调GAN的简单有效基准——冻结判别器

生成对抗网络(GANs)在大量计算机视觉问题中表现出色,但通常对训练数据和计算资源的需求量大。转移学习可以解决这个困难,但其间很容易导致过拟合或对分布转移的学习效果不好等问题。

为了应对这一挑战,研究人员现在提出了一个简单而有效的基准用于GAN的转移学习。他们发现,微调网络(生成器和判别器)的同时冻结判别器的底层效果出奇得好,因此冻结判别器就诞生了。

在StyleGAN和SNGAN投影架构下和Animal Face、Anime Face、Oxford Flower、CUB-200-2011和Caltech-256数据集中,研究人员提出的冻结判别器基准在无条件和有条件GAN中的表现均明显优于现有方法。

研究人员表示,使用者可以自行采用更复杂的设计来得到比本文提出的基准更优的结果,这表明该研究方向的前景可期。

Github传送门:

https://github.com/sangwoomo/freezeD

原文:

https://arxiv.org/abs/2002.10964v1

用于计算物理的轻量级Python框架

这项工作描述了一种新开发的计算框架turboPy。它是一个轻量级的物理建模框架,基于使用了胞中粒子法(PIC)编码的设计turboWAVE,来快速制定新的物理规范原型。

TurboPy实现了很多个类,包括驱动模拟并管理物理模块之间交流的Simulation,处理问题各部分动态细节的PhysicsModule和处理常见的各种辅助问题的Grid和Diagnostic等。

turboPy框架的使用可以减轻计算科学家的认知负担,同时实现新代码的设计来完成所需工作流程。使用者只需将工作流程描绘成一个在时间循环中重复发生的过程,再简单将其转化成turboPy框图即可。

创建GUI来开发turboPy框图并完成问题设定,进而提供python软件包便于用户的安装使用,如此turboPy可以更好地在将来的工作中发挥作用。

原文:

https://arxiv.org/abs/2002.08842

一劳永逸的两级开放式词汇语言模型

本文提出了一种神经语言模型,其中包含了用于单词拼写的生成模型。研究人员展示了在开放式词汇NLP任务中,使用已知单词的拼写帮助处理未知单词的过程。


这种方法可以用于扩展任何封闭式词汇生成模型,但是本文重点考虑了神经语言建模的情况。该贝叶斯生成模型将两个模型合并起来生成故事,其中标准的RNN语言模型用于生成每个句子中的单词标记,而基于RNN的拼写模型用于生成每种单词类型中的字母。

和语言学中一样,这两个RNN各自捕获的信息(句子结构和单词结构)是分离的。再调用第二个RNN为上下文中的新单词生成拼写,开放式词汇模型就完成了。

与基准相比,该模型的表现击败了之前的研究成果,并在多个数据集上得到了当前最优的结果。

这个两级开放式词汇生成模型不仅可以记住常用单词的拼写和嵌入信息,而且还可以根据词汇或非词汇的拼写风格,联系上下文生成新的单词类型

该方法将来可以用在其他使用单词嵌入的生成式NLP模型中,并且在诸如文本分类(特别是在资源较少的语言和领域)等任务中发挥极大作用。

原文:

https://arxiv.org/pdf/1804.08205v4.pdf


用于快速机器学习模型开发的Python API

在本文中,德国明斯特大学的研究人员介绍了他们所谓的PHOTON,它是一种高级Python应用程序编程接口(API)。针对当前最佳实践的机器学习模型,它提供了一种方便使用且灵活的方法来实现快速,可重复且无偏见的效果。 PHOTON基于三个概念:设计,自动化和集成。

PHOTON旨在简化和加速机器学习模型开发的过程。它可以设计基本和高级机器学习管道架构,并自动化重复的训练、优化和评估工作流程。 PHOTON可以轻松访问已建立的机器学习工具箱,还可以针对模型构建和评估过程的任何部分,实现集成自定义算法和解决方案。它在概念上与scikit-learn相似,但在核心功能方面进行了扩展。

PHOTON旨在简化和加速机器学习工作流程,从而实现快速,可重复且无偏见的分析。它特别适合需要迭代评估新方法的环境,例如医学和生命科学中的应用机器学习研究。研究人员未来希望扩展更多功能和可用性,并吸引更多的开发人员和用户来建立一个繁荣的开源社区。

原文:

https://arxiv.org/abs/2002.05426

使用深度学习进行物联网设备识别

广泛采用的自带设备(BYOD)策略允许员工将任何物联网设备带入工作场所,这增加了组织网络被攻击的风险。

研究人员日前第一次将深度学习技术应用于网络流量的TCP有效负载,以进行IoT设备分类和识别。在这项工作中,他们提出了一种方法,该方法使用深度学习来识别网络流量中的已知和未经授权的IoT设备,识别出10种不同的IoT设备以及智能手机和计算机的流量,其准确率超过99%,总体上达到检测连接到网络的未授权IoT设备的高于99%的平均准确度。

与以前的研究不同,该方法通过使用从物联网设备的网络流量有效载荷中构建的小图像来表示物联网设备的“通信行为”,不需要在网络流量上应用复杂的特征工程。

该方法在架构方面很简单,并且没有特征工程的开销。它可用于检测网络流量中列入白名单的IoT设备。该技术只需要一个TCP会话即可检测到源物联网设备,而现有方法则需要多个TCP会话才能进行检测。

原文:

https://arxiv.org/abs/2002.11686v1



相关实践学习
钉钉群中如何接收IoT温控器数据告警通知
本实验主要介绍如何将温控器设备以MQTT协议接入IoT物联网平台,通过云产品流转到函数计算FC,调用钉钉群机器人API,实时推送温湿度消息到钉钉群。
阿里云AIoT物联网开发实战
本课程将由物联网专家带你熟悉阿里云AIoT物联网领域全套云产品,7天轻松搭建基于Arduino的端到端物联网场景应用。 开始学习前,请先开通下方两个云产品,让学习更流畅: IoT物联网平台:https://iot.console.aliyun.com/ LinkWAN物联网络管理平台:https://linkwan.console.aliyun.com/service-open
相关文章
|
1月前
|
存储 人工智能 开发工具
AI助理化繁为简,速取代码参数——使用python SDK 处理OSS存储的图片
只需要通过向AI助理提问的方式输入您的需求,即可瞬间获得核心流程代码及参数,缩短学习路径、提升开发效率。
1426 4
AI助理化繁为简,速取代码参数——使用python SDK 处理OSS存储的图片
|
8天前
|
人工智能 C语言 Python
AI师傅+通义灵码=零基础小白上手python真·不是梦
作为一名不懂编程的设计师,我一直渴望掌握AI辅助设计。在快刀青衣的推荐下,我尝试了AI师傅和通义灵码,成功写出了第一个Python程序,并理解了编程的基本概念。通过AI师傅的引导和通义灵码的帮助,我顺利完成了Coursera上的Python课程,获得了两张证书。这种学习方式让编程变得不再遥不可及,为我的未来学习打开了新大门。
|
7天前
|
机器学习/深度学习 数据采集 算法
Python机器学习:Scikit-learn库的高效使用技巧
【10月更文挑战第28天】Scikit-learn 是 Python 中最受欢迎的机器学习库之一,以其简洁的 API、丰富的算法和良好的文档支持而受到开发者喜爱。本文介绍了 Scikit-learn 的高效使用技巧,包括数据预处理(如使用 Pipeline 和 ColumnTransformer)、模型选择与评估(如交叉验证和 GridSearchCV)以及模型持久化(如使用 joblib)。通过这些技巧,你可以在机器学习项目中事半功倍。
18 3
|
12天前
|
机器学习/深度学习 人工智能 算法
机器学习基础:使用Python和Scikit-learn入门
机器学习基础:使用Python和Scikit-learn入门
23 1
|
22天前
|
人工智能 自然语言处理 IDE
|
23天前
|
机器学习/深度学习 人工智能 算法
机器学习基础:使用Python和Scikit-learn入门
【10月更文挑战第12天】本文介绍了如何使用Python和Scikit-learn进行机器学习的基础知识和入门实践。首先概述了机器学习的基本概念,包括监督学习、无监督学习和强化学习。接着详细讲解了Python和Scikit-learn的安装、数据处理、模型训练和评估等步骤,并提供了代码示例。通过本文,读者可以掌握机器学习的基本流程,并为深入学习打下坚实基础。
18 1
|
25天前
|
机器学习/深度学习 人工智能 算法
机器学习基础:使用Python和Scikit-learn入门
本文介绍了如何使用Python和Scikit-learn进行机器学习的基础知识和实践。首先概述了机器学习的基本概念,包括监督学习、无监督学习和强化学习。接着详细讲解了Python和Scikit-learn的安装、数据处理、模型选择与训练、模型评估及交叉验证等关键步骤。通过本文,初学者可以快速上手并掌握机器学习的基本技能。
46 2
|
25天前
|
机器学习/深度学习 数据挖掘 Serverless
手把手教你全面评估机器学习模型性能:从选择正确评价指标到使用Python与Scikit-learn进行实战演练的详细指南
【10月更文挑战第10天】评估机器学习模型性能是开发流程的关键,涉及准确性、可解释性、运行速度等多方面考量。不同任务(如分类、回归)采用不同评价指标,如准确率、F1分数、MSE等。示例代码展示了使用Scikit-learn库评估逻辑回归模型的过程,包括数据准备、模型训练、性能评估及交叉验证。
47 1
|
29天前
|
机器学习/深度学习 人工智能 数据挖掘
机器学习基础:使用Python和Scikit-learn入门
【10月更文挑战第6天】在人工智能领域,机器学习已成为核心技术。本文指导初学者使用Python与Scikit-learn入门机器学习,涵盖基本概念、环境搭建、数据处理、模型训练及评估等环节。Python因简洁性及其生态系统成为首选语言,而Scikit-learn则提供了丰富工具,简化数据挖掘与分析流程。通过实践示例,帮助读者快速掌握基础知识,为进一步深入研究奠定坚实基础。
23 4
|
1月前
|
机器学习/深度学习 数据采集 算法
【Python篇】从零到精通:全面分析Scikit-Learn在机器学习中的绝妙应用
【Python篇】从零到精通:全面分析Scikit-Learn在机器学习中的绝妙应用
37 2