CNN可解释性再受关注,人类真能理解机器的思想吗? | 一周AI最火论文

简介: CNN可解释性再受关注,人类真能理解机器的思想吗? | 一周AI最火论文

本周关键词:对象识别、CNN、文本识别

本周最佳学术研究

SOLO:按位置分割对象的方法

本文提出了一种新颖且极其简单的图像实例分割方法,称为SOLO,这是一种直接实例分割框架,由澳大利亚阿德莱德大学和字节跳动 AI 实验室的研究人员合作开发。

SOLO是一种端到端的深度学习架构,可以将原始输入图像直接映射到所需的实例蒙版,无需像自底向上的方法那样进行分组后处理,也不需要像自顶向下的方法那样进行边界框检测和RoI操作,减少了处理时间。

实验结果:说明这是一个具有可靠性能且简单灵活的实例分割框架,在准确性方面与Mask R-CNN持平,并且优于最新的单阶段实例分割器。

鉴于SOLO的简单性,灵活性和强大的性能,研究人员希望SOLO可以成为实例分割和其他实例级别识别任务的基准。

Github传送门:
https://github.com/aim-uofa/AdelaiDet/
原文:
https://arxiv.org/pdf/1912.04488v3.pdf

多元假设检验Python包

hyppo的全称是HYPothesis Testing in PythOn,发音为“ Hippo”,是一个功能强大且可扩展的开源Python软件包,用于进行包括独立性、双样本和多样本等多变量假设检验。

尽管做多元独立性检验可以使用R软件包,但其大多数接口与Python不兼容,无法使用。而hyppo则包含许多最新的多元检验模块,易于使用,且可以灵活扩展。

文档及使用手册:
https://hyppo.neurodata.io/
原文:
https://arxiv.org/pdf/1907.02088v5.pdf

可进行交互式计算性能分析的深度神经网络训练工具

这篇最近发表的论文介绍了SKYLINE,一种用于DNN(深度神经网络)训练的交互式新工具,它支持编辑器内性能分析,可视化和调试等功能。

SKYLINE充分利用了DNN模型训练的特性,包括重复性,可预测性和代码结构性等,从而提供了与代码相关的交互式性能展示。本文主要阐述了:

DNN训练计算性能调试是深度学习开发人员面临的重要问题
DNN训练在计算性能上的特性可以应用于新的交互式分析
SKYLINE是开源的,可帮助深度学习开发人员提升未来研究效率。

Github传送门:
https://github.com/skylineprof/skyline
原文:
https://arxiv.org/pdf/2008.06798v2.pdf

EASTER:一个高效且可扩展的文本识别器

这项工作提出了一种高效且可扩展的文本识别器(EASTER),可以在机器上打印的文字和手写文本上执行光学字符识别。

新模型利用了不重复的一维卷积层,从而能够以更少的数据量进行并行训练。

在对该体系结构的多个变体和最小变体之一进行评估时,该识别器的性能与基于RNN的复杂选择相当。使用20层最深变体的识别器优于RNN架构,在基准测试数据集(如IIIT-5k和SVT)上有很大的优势。

研究人员还展示了在脱机手写文本识别任务上,此识别器带来的结果相比当前最佳结果有较大提升。他们介绍了具有扩充设置的数据生成管道,这个管道可以生成手写和机器打印文本的综合数据集。

原文:
https://arxiv.org/pdf/2008.07839v2.pdf

致力于CNN的准确可视化和可解释性

为了更好地理解和使用卷积神经网络(CNN),CNN的可视化和解释近年来引起了越来越多的关注。

本文介绍了一种新颖的可视化方法,称为XGrad-CAM,该方法受敏感度和守恒原理的启发。提供了清晰的数学解释,填补了CAM可视化方法可解释性的空白。

结果表明,就保守性和敏感性而言,XGrad-CAM是Grad-CAM的增强版本。与Grad-CAM ++和Ablation-CAM相比,它可以实现比Grad-CAM更好的可视化性能,并且具有区分类和易于实现的优点。

Github传送门:
https://github.com/Fu0511/XGrad-CAM
原文:
https://arxiv.org/pdf/2008.02312v4.pdf

其他爆款论文

是否将离线RL的丰富前景带入现实应用?Google AI应对离线强化学习中的开放挑战:
https://ai.googleblog.com/2020/08/tackling-open-challenges-in-offline.html

CopyPose:一致的多视图多对象6D姿势估计:
https://www.di.ens.fr/willow/research/cosypose/

我们面临的挑战以及克服这些挑战所需的专业知识——信托与医疗AI:
https://arxiv.org/pdf/2008.07734v1.pdf

保守离线强化学习Q-Learning:
https://arxiv.org/pdf/2006.04779v3.pdf

自动化机器学习评论——挑战与机遇:
https://arxiv.org/pdf/2008.08516v1.pdf

学习资源

怎样使用机器学习驱动商业价值:
https://pages.awscloud.com/glbl-gc-450-machine-learning-journey-ebook/

AI大事件

用于机器学习应用程序的谷歌笔数字墨水识别API:
https://www.electronicsweekly.com/news/products/software-products/google-pens-digital-ink-recognition-api-machine-learning-apps-2020-08/

Socionext和大阪大学开发了新的深度学习方法,用于在弱光条件下进行目标检测:
https://www.prnewswire.com/news-releases/socionext-and-osaka-university-develop-new-deep-learning-method-for-object-detection-in-low-light-conditions-301116092.html

零售行业的机器学习:
https://thedailychronicle.in/news/335883/machine-learning-in-retail-market-top-companies-trends-and-technology-2020-2029/

相关文章
|
1月前
|
机器学习/深度学习 Web App开发 编解码
论文精度笔记(四):《Sparse R-CNN: End-to-End Object Detection with Learnable Proposals》
Sparse R-CNN是一种端到端的目标检测方法,它通过使用一组可学习的稀疏提议框来避免传统目标检测中的密集候选框设计和多对一标签分配问题,同时省去了NMS后处理步骤,提高了检测效率。
43 0
论文精度笔记(四):《Sparse R-CNN: End-to-End Object Detection with Learnable Proposals》
|
17天前
|
机器学习/深度学习 人工智能 自然语言处理
机器学习之解释性AI与可解释性机器学习
随着人工智能技术的广泛应用,机器学习模型越来越多地被用于决策过程。然而,这些模型,尤其是深度学习模型,通常被视为“黑箱”,难以理解其背后的决策逻辑。解释性AI(Explainable AI, XAI)和可解释性机器学习(Interpretable Machine Learning, IML)旨在解决这个问题,使模型的决策过程透明、可信。
34 2
|
19天前
|
机器学习/深度学习 人工智能 自然语言处理
AI与艺术创作:机器的艺术天赋
【10月更文挑战第31天】本文探讨了AI在艺术创作中的应用及其独特“艺术天赋”。从绘画、音乐、文学到设计,AI通过计算机视觉、自然语言处理和生成对抗网络等技术,逐渐展现出强大的创作能力。尽管面临原创性、审美标准和法律伦理等挑战,AI艺术创作仍为艺术界带来了新的视角和灵感,未来有望与人类艺术家共同推动艺术的创新与发展。
|
1月前
|
机器学习/深度学习 Web App开发 人工智能
轻量级网络论文精度笔(一):《Micro-YOLO: Exploring Efficient Methods to Compress CNN based Object Detection Model》
《Micro-YOLO: Exploring Efficient Methods to Compress CNN based Object Detection Model》这篇论文提出了一种基于YOLOv3-Tiny的轻量级目标检测模型Micro-YOLO,通过渐进式通道剪枝和轻量级卷积层,显著减少了参数数量和计算成本,同时保持了较高的检测性能。
35 2
轻量级网络论文精度笔(一):《Micro-YOLO: Exploring Efficient Methods to Compress CNN based Object Detection Model》
|
27天前
|
人工智能 分布式计算 数据可视化
大模型私有化部署全攻略:硬件需求、数据隐私、可解释性与维护成本挑战及解决方案详解,附示例代码助你轻松实现企业内部AI应用
【10月更文挑战第23天】随着人工智能技术的发展,企业越来越关注大模型的私有化部署。本文详细探讨了硬件资源需求、数据隐私保护、模型可解释性、模型更新和维护等方面的挑战及解决方案,并提供了示例代码,帮助企业高效、安全地实现大模型的内部部署。
67 1
|
27天前
|
人工智能 分布式计算 数据可视化
大模型私有化部署全攻略:硬件需求、数据隐私、可解释性与维护成本挑战及解决方案详解,附示例代码助你轻松实现企业内部AI应用
【10月更文挑战第23天】随着人工智能技术的发展,大模型在各领域的应用日益广泛。然而,将其私有化部署到企业内部面临诸多挑战,如硬件资源需求高、数据隐私保护、模型可解释性差、更新维护成本高等。本文探讨了这些挑战,并提出了优化硬件配置、数据加密、可视化工具、自动化更新机制等解决方案,帮助企业顺利实现大模型的私有化部署。
61 1
|
2月前
|
人工智能 开发者
Nature曝惊人内幕:论文被天价卖出喂AI!出版商狂赚上亿,作者0收入
【9月更文挑战第8天】《自然》杂志近日揭露,学术出版商如泰勒·弗朗西斯与微软签订千万美元合约,及威利获高额报酬,将论文提供给科技巨头训练AI模型,引发学界对版权与收益分配的热议。此现象反映了AI对高质量数据的渴求,但亦使研究人员担忧成果被无偿商用,且可能影响学术独立性。尽管AI训练使用学术资源能提升模型科学性,助力科研进展,但如何保障作者权益及维持学术纯粹性仍是亟待解决的问题。https://www.nature.com/articles/d41586-024-02599-9
52 4
|
2月前
|
机器学习/深度学习 人工智能 算法
AI伦理边界:当机器决策超越人类认知
【9月更文挑战第5天】AI伦理边界的探索是一个复杂而艰巨的任务,需要政府、企业、学术界和社会各界的共同努力。随着AI技术的不断发展,我们有理由相信,通过不断的探索和实践,我们一定能够找到一条既符合伦理道德又能够充分发挥AI技术潜力的道路。在未来的日子里,让我们携手并进,共同迎接AI技术带来的机遇与挑战。
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
算法金 | 秒懂 AI - 深度学习五大模型:RNN、CNN、Transformer、BERT、GPT 简介
**RNN**,1986年提出,用于序列数据,如语言模型和语音识别,但原始模型有梯度消失问题。**LSTM**和**GRU**通过门控解决了此问题。 **CNN**,1989年引入,擅长图像处理,卷积层和池化层提取特征,经典应用包括图像分类和物体检测,如LeNet-5。 **Transformer**,2017年由Google推出,自注意力机制实现并行计算,优化了NLP效率,如机器翻译。 **BERT**,2018年Google的双向预训练模型,通过掩码语言模型改进上下文理解,适用于问答和文本分类。
160 9
|
4月前
|
机器学习/深度学习 人工智能 算法
AI与创意写作:机器如何学习讲故事
【7月更文挑战第8天】在数字时代的浪潮中,人工智能已经从实验室走向了文学创作的领域。本文将探讨AI在创意写作中的应用,揭示它如何通过算法模仿人类的思维模式,生成引人入胜的故事。我们将一同穿梭于代码与文字之间,见证一个由数据驱动的叙事新纪元的诞生。

热门文章

最新文章

下一篇
无影云桌面