一周AI最火论文 | 童年的手绘漫画有望复兴？AI建立草稿到模型映射-阿里云开发者社区

一周AI最火论文 | 童年的手绘漫画有望复兴？AI建立草稿到模型映射

2021-10-23 255

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 一周AI最火论文 | 童年的手绘漫画有望复兴？AI建立草稿到模型映射

本周关键词：图采样、3D结构、增强学习

本周最佳学术研究

从手绘草稿重建3D形状

研究人员称，这是首次有关从单视图手绘重建3D形状的研究。他们建议使用合成草图进行训练，并引入标准化模块来处理数据不足的问题并丰富草图的样式。该模型被证明能够成功地将不同视图和不同类别的自由手绘重建为3D形状。他们希望这项研究可以在基于手绘的3D设计或游戏等应用中释放更多手绘的潜力，使大众更容易使用它们。

原文：
https://arxiv.org/abs/2006.09694v1

用于图采样的Python库

采样图是数据挖掘中的一项重要任务。本文的研究人员提供了名为Little Ball of Fur的Python库，其中包含了二十多种图采样算法。他们的目标是使大量专业人员、研究人员和学生可以在一个简化的框架中使用基于节点、边缘和探索的网络采样技术。

他们着重于创建一个具有一致的应用程序公共接口的框架，这个接口具有便利的设计、通用的输入数据要求以及合理的算法基线设置。本文通过示例性代码片段详细概述了框架设计基础，还通过估算多种社交网络和网络图的全球统计数据，证明了该库的实用性。实验表明，Little Fur of Fur 库可以大大加快节点和整个图形的嵌入技术，并且只略微降低提炼特征的预测值。

原文：
https://arxiv.org/abs/2006.04311v1

3D形状中可学习的变形

Brain、加州大学伯克利分校和斯坦福大学的研究人员近期联合发布的这篇论文提出了一种基于流的模型，名为ShapeFlow模型。该模型可用于学习3D形状的所有类的变形空间，尽管这些类具有较大类内差异。

ShapeFlow是一种基于流的模型，能够通过使用变形流来构建高质量的形状空间。研究人员分析表明，该模型可以避免自相交，并提供多种方式来规范体积、等轴测图和对称性等。ShapeFlow可用于对现有模板变形来重新构造新形状。当前框架的一个主要限制是它没有用于匹配形状的语义监督。未来的方向包括通过对相似的矢量场进行分组来分析几何形状的零件结构并探索语义感知的变形。此外，ShapeFlow可用于在给出示踪剂观测值的情况下推断螺线管流场的逆问题，这是工程物理学中的重要问题。

原文：
https://arxiv.org/abs/2006.07982v1

用于增强型机器学习的轻量级代码框架

这项工作提出了ktrain，这是一种用于机器学习的轻量级代码框。ktrain当前支持对文本、视觉和图形数据的训练模型。

作为对TensorFlow Keras框架的简单包装，它也足够灵活，可用于自定义的模型和数据格式。受其他轻量级代码（和无代码）开源ML库（例如fastai和ludwig）的启发，ktrain希望能够让数据科学的初学者和领域专家都能来用它以最少的代码量构建复杂的机器学习项目，并以此进一步使机器学习“平民化”。而即使是对于需要快速原型化深度学习解决方案的经验丰富的从业者，它也是一个强有力的工具。

原文：
https://arxiv.org/abs/2004.10703v3

使用自我监督改进语音表示和个性化模型

在本文中，Google AI为语音相关应用程序的表征学习做出了三点贡献。首先，他们提出了一种用于比较语音表征的NOn语义语音（NOSS）基准，其中包括各种数据集和基准任务，例如语音情感识别、语言识别和说话者识别。这些数据集可在TensorFlow数据集的“音频”部分获得。

其次，他们创建并开源了TRIpLet Loss网络（TRILL），这是一种新模型，其规模很小，可以在设备上执行和微调，同时仍胜过其他表征形式。第三，他们比较了不同的表征形式并进行了大规模研究，还开源了用于计算新表征形式性能的代码。

评估NOSS的代码位于GitHub上，数据集位于TensorFlow数据集上，而TRILL模型位于AI Hub上。

Github：
https://github.com/google-research/google-research/tree/master/non_semantic_speech_benchmark

TensorFlow数据集:
https://www.tensorflow.org/datasets/catalog/overview#audio

AI Hub:
https://aihub.cloud.google.com/u/0/s?q=nonsemantic-speech-benchmark

原文：
https://arxiv.org/abs/2002.12764

其他爆款论文

利用离线数据集加速在线强化学习：
https://arxiv.org/abs/2006.09359v1

既然我能看见，我就能改进它，在边缘上启用CNN数据驱动的微调：
https://arxiv.org/abs/2006.08554v1