一周AI最火论文 | 移动端的3D实时CNN正在成为现实,加速框架细节起底

简介: 一周AI最火论文 | 移动端的3D实时CNN正在成为现实,加速框架细节起底

本周关键词:推荐系统、3D建模、BERT

本周最佳学术研究

新一代推荐系统实验工具

如果你关注推荐系统,那么python版的LensKit推荐系统引擎库(LKPY)可能会引起你的兴趣。这是一个开源工具包,可用于构建、研究及学习推荐系统。

2010年LensKit 的Java版本首次发布,目前该工具已经应用于各种研究的发表、小规模生产部署以及线上(MOOC)和线下(传统教室)教育中。

在本文中,美国博伊西州立大学的研究人员提出了LensKit for Python项目,将原始工具重新构建为灵活易用的Python插件,用于推荐系统研发。

Python版的LensKit(LKPY)使研究人员和学生能够利用强大且不断发展的PyData和Python科学生态圈(包括scikit-learn,TensorFlow和PyTorch),构建健壮、灵活且可重复的实验系统。

原文:
https://arxiv.org/pdf/1809.03125v3.pdf

Python的度量学习算法

Metric-learn是一个开源Python库,包含几种流行的有监督和弱监督度量学习算法的高效Python实现。

作为scikit-learn-contrib的一部分,metric-learn提供了一个与scikit-learn兼容的统一接口,可以很方便地与其他机器学习库进行交叉验证、模型选择和串联。Metric-learn遵从MIT许可,并已在PyPi上进行了全面测试。

github链接:
https://github.com/scikit-learn-contrib/metric-learn

原文:
https://arxiv.org/pdf/1908.04710v2.pdf

3D卷积神经网络的移动端加速框架

目前,许多移动终端都配备了强大的高端移动CPU和GPU,这使得它们逐步成为深度学习的重要平台。

本文介绍了RT3D,一种用于3D CNN(卷积神经网络)的移动端加速框架,它由两个新型且适用于移动设备的结构化稀疏方案(Vanilla和KGS)和最佳修剪算法组成,并且有一个编译器辅助的代码生成框架将对网络的修剪转化为性能的提升。

评测结果显示,RT3D击败了两个最先进的加速框架,加速高达29.1倍。这是RT3D首次在150 毫秒内预测16个视频帧,即通过纯软件解决方案在现成的移动设备上实现3D CNN的实时预测。

原文:
https://arxiv.org/abs/2007.09835v1

用于结构化3D建模的大型逼真数据集

研究人员创建了一个大型的Structured3D综合数据集,其中提供了21835个房间地面详细真实的3D结构批注,和超过196k的2D渲染。

他们引入了统一的“原始+关系”的表示方法,这使他们能够有效地捕获各种各样的半全局或全局的3D结构,及其相互关系。该数据集可用于训练深层网络以进行房间布局预测,并在公共基准上证明其性能得到改善,此数据集也可能有益于图像合成。

研究人员认为这项工作是构建智能机器重要且令人振奋的一步,该机器可以实现人类水平的整体3D场景理解。

他们将继续为数据集添加更多场景和对象的3D结构注释,并探索使用数据集的新方法,以推进用于结构化3D建模和理解的技术。

项目网站:
https://structured3d-dataset.org/

原文:
https://arxiv.org/pdf/1908.00222v3.pdf

使用BERT的会话系统生成产品标题

一组研究人员研究了在标签有限的情况下,为大型电子商务目录里的产品生成简明,语法正确的语音标题的问题。

在本文中,他们提出了一种使用BERT从输入Web标题生成简短、自然、口头化的标题序列到序列方法。即使在数据极其有限的情况下,他们仍通过指标和人工评估了4种不同的基准。

他们在现实世界的行业数据集上进行了广泛的实验,并对模型输出进行了人工评估,结果表明,BERT汇总优于可比较的基准模型。

基于丰富的用户元数据,来生成不同用户细分的个性化标题,并将Web数据与可能依赖于产品的其他产品属性结合在一起,是扩展此工作的一些方向。

原文:
https://arxiv.org/abs/2007.11768

其他爆款论文

用于R和Python的高维数据分析的稀疏学习库:毕加索项目:
https://arxiv.org/abs/2006.15261v1

自动单眼3D狗重建的端到端方法:谁把狗拒之门外?
https://arxiv.org/pdf/2007.11110v1.pdf

一种新的训练程序,可以减少3D检测任务所需的3D标签工作量:
https://arxiv.org/pdf/2004.02693v2.pdf

从单个2D偏振图像估计穿衣的人体形状的问题:
https://arxiv.org/pdf/2007.09268v1.pdf

学习资源

深度学习:
https://lme.tf.fau.de/teaching/free-deep-learning-resources/

65个最好的深度学习课程:
https://www.classcentral.com/subject/deep-learning

AI大事件

亚马逊为Alexa开发者推出了一系列新功能:
https://www.zdnet.com/article/amazons-new-tools-for-alexa-developers-hints-at-whats-next-for-the-voice-assistant/

人工智能降低了用户体验,但这一定是坏事吗?
https://www.zdnet.com/article/artificial-intelligence-drives-new-user-experiences/

相关文章
|
30天前
|
机器学习/深度学习 Web App开发 编解码
论文精度笔记(四):《Sparse R-CNN: End-to-End Object Detection with Learnable Proposals》
Sparse R-CNN是一种端到端的目标检测方法,它通过使用一组可学习的稀疏提议框来避免传统目标检测中的密集候选框设计和多对一标签分配问题,同时省去了NMS后处理步骤,提高了检测效率。
39 0
论文精度笔记(四):《Sparse R-CNN: End-to-End Object Detection with Learnable Proposals》
|
5天前
|
存储 人工智能 安全
从梦想到现实:十年见证AI自动化漏洞修复的演变
2014年,我怀揣着利用科技创造更安全数字世界的梦想,提出了通过云平台自动化修复第三方网站漏洞的构想。十年后的2024年,随着AI技术的崛起,这一梦想已成为现实。如今,用户只需简单注册并安装插件,AI系统就能自动检测、修复漏洞,整个过程高效、智能。AI不仅提升了系统的可靠性和效率,还具备自我学习能力,使安全防护更加主动。未来,我将继续用AI探索更多可能,推动技术的发展,不断完善这个充满智慧与安全的数字世界。
25 3
从梦想到现实:十年见证AI自动化漏洞修复的演变
|
5天前
|
传感器 机器学习/深度学习 人工智能
自动驾驶汽车中的AI:从概念到现实
【10月更文挑战第31天】自动驾驶汽车曾是科幻概念,如今正逐步成为现实。本文探讨了自动驾驶汽车的发展历程,从早期的机械控制到现代的AI技术应用,包括传感器融合、计算机视觉、路径规划和决策控制等方面。尽管面临安全性和法规挑战,自动驾驶汽车在商用运输、公共交通和乘用车领域展现出巨大潜力,未来将为人类带来更安全、便捷、环保的出行方式。
|
29天前
|
机器学习/深度学习 Web App开发 人工智能
轻量级网络论文精度笔(一):《Micro-YOLO: Exploring Efficient Methods to Compress CNN based Object Detection Model》
《Micro-YOLO: Exploring Efficient Methods to Compress CNN based Object Detection Model》这篇论文提出了一种基于YOLOv3-Tiny的轻量级目标检测模型Micro-YOLO,通过渐进式通道剪枝和轻量级卷积层,显著减少了参数数量和计算成本,同时保持了较高的检测性能。
32 2
轻量级网络论文精度笔(一):《Micro-YOLO: Exploring Efficient Methods to Compress CNN based Object Detection Model》
|
22天前
|
人工智能 安全 决策智能
OpenAI推出实验性“Swarm”框架,引发关于AI驱动自动化的争论
OpenAI推出实验性“Swarm”框架,引发关于AI驱动自动化的争论
|
16天前
|
人工智能 API 决策智能
swarm Agent框架入门指南:构建与编排多智能体系统的利器 | AI应用开发
Swarm是OpenAI在2024年10月12日宣布开源的一个实验性质的多智能体编排框架。其核心目标是让智能体之间的协调和执行变得更轻量级、更容易控制和测试。Swarm框架的主要特性包括轻量化、易于使用和高度可定制性,非常适合处理大量独立的功能和指令。【10月更文挑战第15天】
114 6
|
24天前
|
人工智能 开发框架 Java
总计 30 万奖金,Spring AI Alibaba 应用框架挑战赛开赛
Spring AI Alibaba 应用框架挑战赛邀请广大开发者参与开源项目的共建,助力项目快速发展,掌握 AI 应用开发模式。大赛分为《支持 Spring AI Alibaba 应用可视化调试与追踪本地工具》和《基于 Flow 的 AI 编排机制设计与实现》两个赛道,总计 30 万奖金。
|
25天前
|
人工智能 Java API
阿里云开源 AI 应用开发框架:Spring AI Alibaba
近期,阿里云重磅发布了首款面向 Java 开发者的开源 AI 应用开发框架:Spring AI Alibaba(项目 Github 仓库地址:alibaba/spring-ai-alibaba),Spring AI Alibaba 项目基于 Spring AI 构建,是阿里云通义系列模型及服务在 Java AI 应用开发领域的最佳实践,提供高层次的 AI API 抽象与云原生基础设施集成方案,帮助开发者快速构建 AI 应用。本文将详细介绍 Spring AI Alibaba 的核心特性,并通过「智能机票助手」的示例直观的展示 Spring AI Alibaba 开发 AI 应用的便利性。示例源
|
30天前
|
人工智能 Java API
阿里云开源 AI 应用开发框架:Spring AI Alibaba
阿里云开源 Spring AI Alibaba,旨在帮助 Java 开发者快速构建 AI 应用,共同构建物理新世界。
|
2月前
|
存储 人工智能 测试技术
Minstrel自动生成结构化提示,让AI为AI写提示词的多代理提示生成框架
在人工智能迅速发展的背景下,有效利用大型语言模型(LLMs)成为重要议题。9月发布的这篇论文提出了LangGPT结构化提示框架和Minstrel多代理提示生成系统,旨在帮助非AI专家更好地使用LLMs。LangGPT通过模块化设计提高提示的泛化能力和可重用性,Minstrel则通过多代理协作自动生成高质量提示。实验结果显示,这两种方法显著提升了LLMs的性能,特别是在大规模模型上效果显著。
75 2
Minstrel自动生成结构化提示,让AI为AI写提示词的多代理提示生成框架

热门文章

最新文章

下一篇
无影云桌面