一周AI最火论文 | 童年的手绘漫画有望复兴?AI建立草稿到模型映射

简介: 一周AI最火论文 | 童年的手绘漫画有望复兴?AI建立草稿到模型映射

本周关键词:图采样、3D结构、增强学习

本周最佳学术研究

从手绘草稿重建3D形状

研究人员称,这是首次有关从单视图手绘重建3D形状的研究。他们建议使用合成草图进行训练,并引入标准化模块来处理数据不足的问题并丰富草图的样式。该模型被证明能够成功地将不同视图和不同类别的自由手绘重建为3D形状。他们希望这项研究可以在基于手绘的3D设计或游戏等应用中释放更多手绘的潜力,使大众更容易使用它们。

原文:
https://arxiv.org/abs/2006.09694v1

用于图采样的Python库

采样图是数据挖掘中的一项重要任务。本文的研究人员提供了名为Little Ball of Fur的Python库,其中包含了二十多种图采样算法。他们的目标是使大量专业人员、研究人员和学生可以在一个简化的框架中使用基于节点、边缘和探索的网络采样技术。

他们着重于创建一个具有一致的应用程序公共接口的框架,这个接口具有便利的设计、通用的输入数据要求以及合理的算法基线设置。本文通过示例性代码片段详细概述了框架设计基础,还通过估算多种社交网络和网络图的全球统计数据,证明了该库的实用性。实验表明,Little Fur of Fur 库可以大大加快节点和整个图形的嵌入技术,并且只略微降低提炼特征的预测值。

原文:
https://arxiv.org/abs/2006.04311v1

3D形状中可学习的变形

Brain、加州大学伯克利分校和斯坦福大学的研究人员近期联合发布的这篇论文提出了一种基于流的模型,名为ShapeFlow模型。该模型可用于学习3D形状的所有类的变形空间,尽管这些类具有较大类内差异。

ShapeFlow是一种基于流的模型,能够通过使用变形流来构建高质量的形状空间。研究人员分析表明,该模型可以避免自相交,并提供多种方式来规范体积、等轴测图和对称性等。ShapeFlow可用于对现有模板变形来重新构造新形状。当前框架的一个主要限制是它没有用于匹配形状的语义监督。未来的方向包括通过对相似的矢量场进行分组来分析几何形状的零件结构并探索语义感知的变形。此外,ShapeFlow可用于在给出示踪剂观测值的情况下推断螺线管流场的逆问题,这是工程物理学中的重要问题。

原文:
https://arxiv.org/abs/2006.07982v1

用于增强型机器学习的轻量级代码框架

这项工作提出了ktrain,这是一种用于机器学习的轻量级代码框。ktrain当前支持对文本、视觉和图形数据的训练模型。

作为对TensorFlow Keras框架的简单包装,它也足够灵活,可用于自定义的模型和数据格式。受其他轻量级代码(和无代码)开源ML库(例如fastai和ludwig)的启发,ktrain希望能够让数据科学的初学者和领域专家都能来用它以最少的代码量构建复杂的机器学习项目,并以此进一步使机器学习“平民化”。而即使是对于需要快速原型化深度学习解决方案的经验丰富的从业者,它也是一个强有力的工具。

原文:
https://arxiv.org/abs/2004.10703v3

使用自我监督改进语音表示和个性化模型

在本文中,Google AI为语音相关应用程序的表征学习做出了三点贡献。首先,他们提出了一种用于比较语音表征的NOn语义语音(NOSS)基准,其中包括各种数据集和基准任务,例如语音情感识别、语言识别和说话者识别。这些数据集可在TensorFlow数据集的“音频”部分获得。

其次,他们创建并开源了TRIpLet Loss网络(TRILL),这是一种新模型,其规模很小,可以在设备上执行和微调,同时仍胜过其他表征形式。第三,他们比较了不同的表征形式并进行了大规模研究,还开源了用于计算新表征形式性能的代码。

评估NOSS的代码位于GitHub上,数据集位于TensorFlow数据集上,而TRILL模型位于AI Hub上。

Github:
https://github.com/google-research/google-research/tree/master/non_semantic_speech_benchmark

TensorFlow数据集:
https://www.tensorflow.org/datasets/catalog/overview#audio

AI Hub:
https://aihub.cloud.google.com/u/0/s?q=nonsemantic-speech-benchmark

原文:
https://arxiv.org/abs/2002.12764

其他爆款论文

利用离线数据集加速在线强化学习:
https://arxiv.org/abs/2006.09359v1

既然我能看见,我就能改进它,在边缘上启用CNN数据驱动的微调:
https://arxiv.org/abs/2006.08554v1

Raspberry Pi上的Google Assistant和Amazon Alexa:
https://arxiv.org/abs/2006.08220v1

当神经网络无法学习周期函数时我们应该如何修复:
https://arxiv.org/abs/2006.08195v1

3D斑马鱼跟踪基准数据集:
https://vap.aau.dk/3d-zef/

AI大事件

机器学习的“奥德赛”:专访Kaggle大师Luca Massaron:
https://analyticsindiamag.com/kaggle-luca-massaron-interview/

将公司价值提高到1亿美元的人工智能专家Mike Bugembe:
https://www.blackenterprise.com/mike-bugembe-artificial-intelligence-got-company-sold-100-million/

李开复表示,美国在人工智能应用领域正在赶超中国:
https://time.com/5851734/kai-fu-lee-ai-us-catching-up-to-china/

拉筹伯大学使用人工智能为癌症患者提供心理健康护理:
https://www.zdnet.com/article/la-trobe-university-uses-ai-to-bring-mental-health-care-to-cancer-patients/

相关文章
|
2天前
|
人工智能 编解码 算法
ENEL:3D建模革命!上海AI Lab黑科技砍掉编码器,7B模型性能吊打13B巨头
ENEL是由上海AI Lab推出的无编码器3D大型多模态模型,能够在多个3D任务中实现高效语义编码和几何结构理解,如3D对象分类、字幕生成和视觉问答。
36 9
ENEL:3D建模革命!上海AI Lab黑科技砍掉编码器,7B模型性能吊打13B巨头
|
2天前
|
机器学习/深度学习 人工智能 机器人
TIGER:清华突破性模型让AI「听觉」进化:参数量暴降94%,菜市场都能分离清晰人声
TIGER 是清华大学推出的轻量级语音分离模型,通过时频交叉建模和多尺度注意力机制,显著提升语音分离效果,同时降低参数量和计算量。
55 6
TIGER:清华突破性模型让AI「听觉」进化:参数量暴降94%,菜市场都能分离清晰人声
|
6天前
|
人工智能 Linux 开发工具
Kiln AI:零代码实现微调模型!自动生成合成数据与微调模型的开源平台
Kiln AI 是一款开源的 AI 开发工具,支持零代码微调多种语言模型,生成合成数据,团队协作开发,自动部署。帮助用户快速构建高质量的 AI 模型。
396 7
Kiln AI:零代码实现微调模型!自动生成合成数据与微调模型的开源平台
|
8天前
|
人工智能 Linux iOS开发
exo:22.1K Star!一个能让任何人利用日常设备构建AI集群的强大工具,组成一个虚拟GPU在多台设备上并行运行模型
exo 是一款由 exo labs 维护的开源项目,能够让你利用家中的日常设备(如 iPhone、iPad、Android、Mac 和 Linux)构建强大的 AI 集群,支持多种大模型和分布式推理。
239 100
|
8天前
|
人工智能 Java 语音技术
【最佳实践系列】零基础上手百炼语音AI模型
阿里云百炼语音AI服务提供了丰富的功能,包括语音识别、语音合成、实时翻译等。通过`alibabacloud-bailian-speech-demo`项目,可以一键调用这些服务,体验语音及大模型的魅力,降低接入门槛。该项目支持Python和Java,涵盖从简单的一句话合成到复杂的同声传译等多个示例,助力开发者快速上手并进行二次开发。
|
9天前
|
机器学习/深度学习 人工智能 编解码
Lumina-Image 2.0:上海 AI Lab 开源的统一图像生成模型,支持生成多分辨率、多风格的图像
Lumina-Image 2.0 是上海 AI Lab 开源的高效统一图像生成模型,参数量为26亿,基于扩散模型和Transformer架构,支持多种推理求解器,能生成高质量、多风格的图像。
120 17
Lumina-Image 2.0:上海 AI Lab 开源的统一图像生成模型,支持生成多分辨率、多风格的图像
|
13天前
|
人工智能 搜索推荐 Docker
手把手教你使用 Ollama 和 LobeChat 快速本地部署 DeepSeek R1 模型,创建个性化 AI 助手
DeepSeek R1 + LobeChat + Ollama:快速本地部署模型,创建个性化 AI 助手
3416 117
手把手教你使用 Ollama 和 LobeChat 快速本地部署 DeepSeek R1 模型,创建个性化 AI 助手
|
14天前
|
人工智能 物联网 开发者
Oumi:开源的AI模型一站式开发平台,涵盖训练、评估和部署模型的综合性平台
Oumi 是一个完全开源的 AI 平台,支持从 1000 万到 4050 亿参数的模型训练,涵盖文本和多模态模型,提供零样板代码开发体验。
204 43
Oumi:开源的AI模型一站式开发平台,涵盖训练、评估和部署模型的综合性平台
|
16天前
|
机器学习/深度学习 人工智能 自然语言处理
YuE:开源AI音乐生成模型,能够将歌词转化为完整的歌曲,支持多种语言和多种音乐风格
YuE 是香港科技大学和 M-A-P 联合开发的开源 AI 音乐生成模型,能够将歌词转化为完整的歌曲,支持多种音乐风格和多语言。
204 23
YuE:开源AI音乐生成模型,能够将歌词转化为完整的歌曲,支持多种语言和多种音乐风格
|
16天前
|
机器学习/深度学习 人工智能 API
Aligner:自动修正AI的生成结果,北大推出残差修正模型对齐技术
介绍北大团队提出的 Aligner 模型对齐技术,通过学习对齐答案与未对齐答案之间的修正残差,提升大语言模型的性能。
78 28

热门文章

最新文章