深度学习论文集锦(中英文对照):图像分类、物体识别等

简介: Github用户SnailTyan在他构建的“深度学习论文翻译”库中,提供了图像识别、对象检测和OCR等经典DL论文的全文翻译,除了英文原版、中文译文,还有中英文对照版。最新的MobileNetV2即将发布。

论文译介是新智元最受欢迎的内容之一,这非常好理解,如今几乎每天都会新增几十乃至几百篇新的论文,其中不乏佳作,而新智元的任务则是将优秀论文和研究成果介绍给读者。

然而这只是第一步,感兴趣的读者自会搜索英文原论文阅读。虽然中文是目前世界上使用人口最多的语言,但英语才是学术界的通用语。不过,对于初学者而言,阅读英文论文还是比较困难。

因此,我们要感谢Github用户SnailTyan,他的Github库“Deep Learning Papers Translation”,提供了经典深度学习论文的英文版、中文版,以及中英文对照版。尤其是后者,对于想快速准确学习的读者而言非常适合。

微信无法外链,因此仅将该库现有内容列出,导读和文末都给出了Github库的链接,可以复制后访问。

Image Classification

• AlexNet

ImageNet Classification with Deep Convolutional Neural Networks 中文版 中英文对照
•  VGG
Very Deep Convolutional Networks for Large-Scale Image Recognition 中文版 中英文对照
•  ResNet
Deep Residual Learning for Image Recognition 中文版 中英文对照
• GoogLeNet
Going Deeper With Convolutions 中文版 中英文对照
• BN-GoogLeNet
Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift 中文版 中英文对照
• Inception-v3
Rethinking the Inception Architecture for Computer Vision 中文版 中英文对照
• SENet
Squeeze-and-Excitation Networks 中文版 中英文对照

Object Detection

• YOLO

You Only Look Once: Unified, Real-Time Object Detection 中文版 中英文对照
• SSD
SSD: Single Shot MultiBox Detector 中文版 中英文对照
• YOLO9000
YOLO9000: Better, Faster, Stronger 中文版 中英文对照
• Deformable-ConvNets
Deformable Convolutional Networks 中文版 中英文对照
• Faster R-CNN
Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 中文版 中英文对照
• R-FCN
R-FCN: Object Detection via Region-based Fully Convolutional Networks 中文版 中英文对照
• FPN

Feature Pyramid Networks for Object Detection 中文版 中英文对照

8cc584d19dd4c1134d5990bad9b6adecfd7b4a8c

FCN中英文对照版截图。来源:noahsnail.com

OCR

• CRNN

An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition 中文版 中英文对照
• CTPN
Detecting Text in Natural Image with Connectionist Text Proposal Network 中文版 中英文对照

Mobile

• MobileNetV2

To be added.

过去一年中,SnailTyan在Github做了222次贡献:

318875ed53b0a4a61af30f5bf03f15ebb9fcd181
“深度学习论文翻译”只是他Github项目其中之一。

有兴趣的读者可以访问该Github地址:

https://github.com/SnailTyan/deep-learning-papers-translation

同时,希望越来越多的中文内容出现在Github。


原文发布时间为:2018-08-20

本文作者:赵武文

本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”。

原文链接:深度学习论文集锦(中英文对照):图像分类、物体识别等

相关文章
|
机器学习/深度学习 数据采集 算法
构建高效图像分类模型:深度学习在处理大规模视觉数据中的应用
随着数字化时代的到来,海量的图像数据被不断产生。深度学习技术因其在处理高维度、非线性和大规模数据集上的卓越性能,已成为图像分类任务的核心方法。本文将详细探讨如何构建一个高效的深度学习模型用于图像分类,包括数据预处理、选择合适的网络架构、训练技巧以及模型优化策略。我们将重点分析卷积神经网络(CNN)在图像识别中的运用,并提出一种改进的训练流程,旨在提升模型的泛化能力和计算效率。通过实验验证,我们的模型能够在保持较低计算成本的同时,达到较高的准确率,为大规模图像数据的自动分类和识别提供了一种有效的解决方案。
|
机器学习/深度学习 计算机视觉 异构计算
构建高效图像分类器:深度学习在视觉识别中的应用
【5月更文挑战第30天】 在计算机视觉领域,图像分类任务是基础且关键的一环。随着深度学习技术的兴起,卷积神经网络(CNN)已成为图像识别的强有力工具。本文将探讨如何构建一个高效的图像分类器,着重分析CNN架构、训练技巧以及优化策略。通过实验对比和案例研究,我们揭示了深度学习模型在处理复杂视觉数据时的优势和挑战,并提出了改进方向,以期达到更高的准确率和更快的处理速度。
|
机器学习/深度学习 决策智能 计算机视觉
利用深度学习优化图像分类准确性的探索
【5月更文挑战第27天】 在图像处理和分析领域,准确的图像分类对于各种应用至关重要。随着深度学习技术的不断进步,卷积神经网络(CNN)已经成为提高图像分类准确性的核心工具。本文旨在探讨如何通过改进深度学习模型来优化图像分类性能,包括数据增强、网络结构优化和训练技巧等策略。我们将分析这些方法对模型泛化能力的影响,并通过实验结果证明所提出策略的有效性。
|
12月前
|
机器学习/深度学习 自然语言处理 算法
深度学习-生成式检索-论文速读-2024-09-14(下)
深度学习-生成式检索-论文速读-2024-09-14(下)
438 0
|
12月前
|
机器学习/深度学习 存储 自然语言处理
深度学习-生成式检索-论文速读-2024-09-14(上)
深度学习-生成式检索-论文速读-2024-09-14(上)
465 0
|
12月前
|
机器学习/深度学习 搜索推荐 算法
深度学习-点击率预估-研究论文2024-09-14速读
深度学习-点击率预估-研究论文2024-09-14速读
175 0
|
机器学习/深度学习 人工智能 自然语言处理
计算机视觉借助深度学习实现了革命性进步,从图像分类到复杂场景理解,深度学习模型如CNN、RNN重塑了领域边界。
【7月更文挑战第2天】计算机视觉借助深度学习实现了革命性进步,从图像分类到复杂场景理解,深度学习模型如CNN、RNN重塑了领域边界。AlexNet开启新时代,后续模型不断优化,推动对象检测、语义分割、图像生成等领域发展。尽管面临数据隐私、模型解释性等挑战,深度学习已广泛应用于安防、医疗、零售和农业,预示着更智能、高效的未来,同时也强调了技术创新、伦理考量的重要性。
231 1
|
机器学习/深度学习 数据采集 算法
构建高效图像分类器:深度学习在特征提取中的应用
【5月更文挑战第25天】 随着人工智能技术的飞速发展,深度学习已成为推动计算机视觉进步的核心力量。尤其在图像分类领域,深度学习模型通过自动学习数据的层次特征,显著提升了分类的准确率和效率。本文将探讨深度学习在图像分类中的特征提取机制,分析卷积神经网络(CNN)如何有效捕捉图像的本质属性,以及如何通过优化网络结构和训练策略进一步提高分类性能。我们将重点讨论数据预处理、网络架构设计、损失函数选择及正则化技术等关键因素对模型性能的影响,并通过实验验证所提出方法的有效性。
|
机器学习/深度学习 大数据 计算机视觉
构建高效图像分类模型:深度学习在特征提取中的应用
【5月更文挑战第21天】 当前研究探索了深度学习技术在图像分类问题中的应用,并提出了一种新型的卷积神经网络(CNN)架构。该网络通过优化传统CNN结构中的层次和参数配置,显著提升了图像识别的准确性与处理速度。实验结果表明,新提出的模型在多个标准数据集上达到了较高的分类准确率,同时保持了较低的计算成本。本研究不仅为图像分类领域提供了一种高效的解决方案,也为后续深度学习模型的设计提供了有价值的参考。
|
机器学习/深度学习 算法
基于深度学习网络的十二生肖图像分类matlab仿真
该内容是关于使用GoogLeNet算法进行十二生肖图像分类的总结。在MATLAB2022a环境下,GoogLeNet通过Inception模块学习高层语义特征,处理不同尺寸的输入。核心程序展示了验证集上部分图像的预测标签和置信度,以4x4网格显示16张图像,每张附带预测类别和概率。

热门文章

最新文章