兼容PyTorch、TF,史上最灵活Python机器学习框架发布 | 一周AI最火论文

简介: 兼容PyTorch、TF,史上最灵活Python机器学习框架发布 | 一周AI最火论文

本周最佳学术研究

编写与PyTorch,TensorFlow,JAX和NumPy均兼容的代码

深度学习(DL)的进步正日益促进着越来越多DL框架的发展。这类框架提供了用于自动区分和GPU加速的高级且高效的API,并使得使用相对较少而直接的代码来实现异常复杂且功能强大的深度学习模型成为可能。

EagerPy是一个Python框架,可用于编写自动与PyTorch、TensorFlow、JAX和NumPy兼容的代码,而无需牺牲性能。

库开发人员不必选择仅支持这些框架之一而为每个框架重新实现库,或是选择处理代码重复问题。因此这类库的用户可以更轻松地切换框架,而不会被一个第三方库锁定。除了支持多框架之外,EagerPy还对链接到所有框架的方法都提供了详尽的类型注释和一致的支持。

Github传送门:
https://github.com/jonasrauber/eagerpy

EagerPy传送门:
https://eagerpy.jonasrauber.de/

原文:
https://arxiv.org/pdf/2008.04175v1.pdf

用于图无监督学习的面向API的开源Python框架

在这项工作中,研究人员介绍了一个Python框架Karate Club。它结合了30多种可用于无监督机器学习任务的最新的图挖掘算法。具体来说,它支持社区检测、节点嵌入和整个图嵌入技术。它建立在NetworkX、PyGSP、Gensim、NumPy和SciPy Sparse等对图形数据进行无监督学习的开源包的基础上。

本文还运用实例讨论了该框架背后的设计原理。研究人员还展示了Karate Club在学习广泛的现实世界中的聚类问题和分类任务等中高效的学习性能,并证明了其具有竞争力的速度。

该软件包的主要目标是使广泛的机器学习研究人员和从业人员可以使用社区检测、节点和整个图形嵌入技术。

Github传送门:
https://github.com/benedekrozemberczki/karateclub

原文:
https://arxiv.org/abs/2003.04819v3

帮助RL落地应用:易于使用且灵活的仿真套件

强化学习(RL)已证明其在解决多个AI领域复杂问题中的价值。但是,由于在实际应用时一系列假设很少能被满足,将RL部署到实际产品和系统中仍然面临很大的挑战。为了强调RL算法发展中的的核心问题、鼓励人们研究这些问题、并加快未来RL应用的实现进度,Google AI研究人员提出并讨论了九种不同的挑战,这些挑战阻碍了当前RL算法在应用系统中的应用。他们也使用最新的RL算法对这些挑战的模拟版本进行了实证研究,并对每种挑战的效果进行了基准测试。

研究人员已为读者提供了每种挑战的相关参考文献,用于指导相关从业者将RL应用于生产系统,并为相关研究人员提供了一个示例环境和评估标准来衡量这些挑战的进展。

挑战:
https://github.com/google-research/realworldrl_suite

原文:
https://ai.googleblog.com/2020/08/a-simulation-suite-for-tackling-applied.html

使用张量(Tensor)网络进行自适应学习

在本文中,蒙特利尔大学的研究人员利用张量网络的形式开发了一种通用且高效的张量学习自适应算法。所提出的方法基于一种简单的“贪心算法”,该“贪心算法”从一阶张量优化了可微分的损失函数,并针对小等级增量依次识别了最有希望的张量网络边缘。

该算法可以通过少量参数自适应地识别张量网络结构,从而有效地从数据中优化目标函数。这一框架相当全面,并且包含许多常见的张量优化问题。在张量分解和完成任务的综合数据方面都有实验能证明该算法的有效性,以及它优于传统方法的有效性。

原文:
https://arxiv.org/abs/2008.05437v1

Google Lookout:设备上的超市产品识别

随着现代智能手机上的计算能力不断增强,许多计算机视觉任务现在有可能完全在移动设备上高性能运行。通过结合MnasNet和MobileNets等设备上模型并结合设备上索引,可以实时运行完整的计算机视觉系统,例如对带有标签的产品进行识别。

利用此类技术,Google AI最近发布了Lookout,这是一个使用计算机视觉使视障用户可以更轻松地访问物理世界的安卓应用程序。当用户将智能手机的相机对准产品时,Lookout会识别它并大声说出品牌名称和产品尺寸。

为了实现这一强大功能,Lookout包括带有产品上商品索引的超市产品检测和识别模型,以及MediaPipe对象跟踪和光学字符识别模型。由此产生的架构足以在整个设备上实时运行,研究人员很期待能够继续探索这一技术在未来的应用,同时继续进行研究以提高底层设备模型的质量和健壮性。

阅读更多:
https://ai.googleblog.com/2020/07/on-device-supermarket-product.html

其他爆款论文

Google AI:我们将虹膜和深度估计模型作为跨平台的MediaPipe管道发布:
https://ai.googleblog.com/2020/08/mediapipe-iris-real-time-iris-tracking.html

用于徽标(Logo)检测的大规模图像数据集:
https://github.com/Wangjing1551/LogoDet-3K-Dataset

Google进行语言模型预训练的新范例:
https://github.com/google-research/language/tree/master/language/realm

具有强大功能的高效Visual SLAM系统——DXSLAM简介:
https://arxiv.org/abs/2008.05416v1

多模式深度学习符合遥感影像分类:
https://arxiv.org/abs/2008.05457v1

学习资源

统计机器学习课程链接:
http://www.it.uu.se/edu/course/homepage/sml/lectures/

Google,Facebook,Amazon,Microsoft,Kaggle,GE和Cornerstone中的ML用例:
https://www.bernardmarr.com/img/bigdata-case-studybook_final.pdf?fbclid=IwAR0JCmOFEQ3ztA7eOBszuhascmSPW20laiklWAOWcbyJvjF-CV6r9FrfRS4

AI大事件

一个大学生用假冒的AI生成的博客诈骗:
https://www.technologyreview.com/2020/08/14/1006780/ai-gpt-3-fake-blog-reached-top-of-hacker-news/

零售商如何使用AI来预测你何时会剁手:
https://www.forbes.com/sites/johnkoetsier/2020/08/13/how-retailers-use-ai-to-predict-when-youll-buy/#2feb85e75421

量子计算对人工智能来说意味着什么?
https://www.forbes.com/sites/tomtaulli/2020/08/14/quantum-computing-what-does-it-mean-for-ai-artificial-intelligence/#3db9fe23b4c8

相关文章
|
6月前
|
人工智能 JavaScript 测试技术
Cradle:颠覆AI Agent 操作本地软件,AI驱动的通用计算机控制框架,如何让基础模型像人一样操作你的电脑?
Cradle 是由 BAAI‑Agents 团队开源的通用计算机控制(GCC)多模态 AI Agent 框架,具备视觉输入、键鼠操作输出、自主学习与反思能力,可操作各类本地软件及游戏,实现任务自动化与复杂逻辑执行。
764 6
|
5月前
|
人工智能 Java 开发者
阿里出手!Java 开发者狂喜!开源 AI Agent 框架 JManus 来了,初次见面就心动~
JManus是阿里开源的Java版OpenManus,基于Spring AI Alibaba框架,助力Java开发者便捷应用AI技术。支持多Agent框架、网页配置、MCP协议及PLAN-ACT模式,可集成多模型,适配阿里云百炼平台与本地ollama。提供Docker与源码部署方式,具备无限上下文处理能力,适用于复杂AI场景。当前仍在完善模型配置等功能,欢迎参与开源共建。
2298 58
阿里出手!Java 开发者狂喜!开源 AI Agent 框架 JManus 来了,初次见面就心动~
|
5月前
|
人工智能 运维 Java
Flink Agents:基于Apache Flink的事件驱动AI智能体框架
本文基于Apache Flink PMC成员宋辛童在Community Over Code Asia 2025的演讲,深入解析Flink Agents项目的技术背景、架构设计与应用场景。该项目聚焦事件驱动型AI智能体,结合Flink的实时处理能力,推动AI在工业场景中的工程化落地,涵盖智能运维、直播分析等典型应用,展现其在AI发展第四层次——智能体AI中的重要意义。
1834 27
Flink Agents:基于Apache Flink的事件驱动AI智能体框架
|
5月前
|
人工智能 数据可视化 数据处理
AI智能体框架怎么选?7个主流工具详细对比解析
大语言模型需借助AI智能体实现“理解”到“行动”的跨越。本文解析主流智能体框架,从RelevanceAI、smolagents到LangGraph,涵盖技术门槛、任务复杂度、社区生态等选型关键因素,助你根据项目需求选择最合适的开发工具,构建高效、可扩展的智能系统。
1385 3
AI智能体框架怎么选?7个主流工具详细对比解析
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
AI Compass前沿速览:IndexTTS2–B站、HuMo、Stand-In视觉生成框架、Youtu-GraphRAG、MobileLLM-R1–Meta、PP-OCRv5
AI Compass前沿速览:IndexTTS2–B站、HuMo、Stand-In视觉生成框架、Youtu-GraphRAG、MobileLLM-R1–Meta、PP-OCRv5
413 10
AI Compass前沿速览:IndexTTS2–B站、HuMo、Stand-In视觉生成框架、Youtu-GraphRAG、MobileLLM-R1–Meta、PP-OCRv5
|
4月前
|
人工智能 JavaScript 前端开发
GenSX (不一样的AI应用框架)架构学习指南
GenSX 是一个基于 TypeScript 的函数式 AI 工作流框架,以“函数组合替代图编排”为核心理念。它通过纯函数组件、自动追踪与断点恢复等特性,让开发者用自然代码构建可追溯、易测试的 LLM 应用。支持多模型集成与插件化扩展,兼具灵活性与工程化优势。
351 6
|
6月前
|
人工智能 自然语言处理 机器人
AI Compass前沿速览:Jetson Thor英伟达AI计算、Gemini 2.5 Flash Image、Youtu腾讯智能体框架、Wan2.2-S2V多模态视频生成、SpatialGen 3D场景生成模型
AI Compass前沿速览:Jetson Thor英伟达AI计算、Gemini 2.5 Flash Image、Youtu腾讯智能体框架、Wan2.2-S2V多模态视频生成、SpatialGen 3D场景生成模型
AI Compass前沿速览:Jetson Thor英伟达AI计算、Gemini 2.5 Flash Image、Youtu腾讯智能体框架、Wan2.2-S2V多模态视频生成、SpatialGen 3D场景生成模型
|
6月前
|
人工智能 前端开发 Java
构建能源领域的AI专家:一个多智能体框架的实践与思考
本文介绍了作者团队在能源领域构建多智能体(Multi-Agent)框架的实践经验。面对单智能体处理复杂任务时因“注意力发散”导致的效率低下问题,团队设计了一套集“规划-调度-执行-汇总”于一体的多智能体协作系统。
745 19
|
6月前
|
人工智能 自然语言处理 JavaScript
Github又一AI黑科技项目,打造全栈架构,只需一个统一框架?
Motia 是一款现代化后端框架,融合 API 接口、后台任务、事件系统与 AI Agent,支持 JavaScript、TypeScript、Python 多语言协同开发。它提供可视化 Workbench、自动观测追踪、零配置部署等功能,帮助开发者高效构建事件驱动的工作流,显著降低部署与运维成本,提升 AI 项目落地效率。
590 0

热门文章

最新文章