2021年不可错过的40篇AI论文,你都读过吗?(一)

简介: 2021年不可错过的40篇AI论文,你都读过吗?(一)

720d24bfe3f20f1fd229c6d40778b87f.png


以下是每篇论文的详细信息:


1、DALL·E: Zero-Shot Text-to-Image Generation from OpenAI



f5a657e8495a7bca38d25fad5ee3bd93.png


论文链接:https://arxiv.org/pdf/2102.12092.pdf


代码地址:https://github.com/openai/DALL-E


视频解读:https://youtu.be/DJToDLBPovg


2、VOGUE: Try-On by StyleGAN Interpolation Optimization



58d9c0cb3b57c371ea77ceea4b1fa638.png


论文链接:https://vogue-try-on.github.io/static_files/resources/VOGUE-virtual-try-on.pdf


视频解读:https://youtu.be/i4MnLJGZbaM


3、Taming Transformers for High-Resolution Image Synthesis



e2cdba62ef44494b9e4e10f2a2fb9093.png


论文链接:https://compvis.github.io/taming-transformers/


代码地址:https://github.com/CompVis/taming-transformers


视频解读:https://youtu.be/JfUTd8fjtX8


4、Thinking Fast And Slow in AI



e7bd85d131f7f48868d141dd20e6ff7b.png


论文链接:https://arxiv.org/abs/2010.06002


视频解读:https://youtu.be/3nvAaVSQxs4


5、Automatic detection and quantification of floating marine macro-litter in aerial images



08e0abb4e8d942e7a0f218c5ce471e4e.png


论文链接:https://doi.org/10.1016/j.envpol.2021.116490

代码地址:https://github.com/amonleong/MARLIT

视频解读:https://youtu.be/2dTSsdW0WYI


6、ShaRF: Shape-conditioned Radiance Fields from a Single View



928683b2e3395dcf79076ecece86b3e1.png


论文链接:https://arxiv.org/abs/2102.08860

代码地址:http://www.krematas.com/sharf/index.html

视频解读:https://youtu.be/gHkkrNMlGNg


7、Generative Adversarial Transformers



a1c053b6cb040c5e2efcdc3961eec0a1.png


论文链接:https://arxiv.org/pdf/2103.01209.pdf

代码地址:https://github.com/dorarad/gansformer

视频解读:https://youtu.be/HO-_t0UArd4


8、We Asked Artificial Intelligence to Create Dating Profiles. Would You Swipe Right?



论文链接:https://studyonline.unsw.edu.au/blog/ai-generated-dating-profile

代码地址:https://colab.research.google.com/drive/1VLG8e7YSEwypxU-noRNhsv5dW4NfTGce#forceEdit=true&sandboxMode=true&scrollTo=aeXshJM-Cuaf

视频解读:https://youtu.be/IoRH5u13P-4


9、Swin Transformer: Hierarchical Vision Transformer using Shifted Windows



9e8f2cb641ca7c89f8a458ca1175eb56.png


论文链接:https://arxiv.org/abs/2103.14030v2

代码地址:https://github.com/microsoft/Swin-Transformer

视频解读:https://youtu.be/QcCJJOLCeJQ


10、IMAGE GANS MEET DIFFERENTIABLE RENDERING FOR INVERSE GRAPHICS AND INTERPRETABLE 3D NEURAL RENDERING



1afbc4ee35e39edc50e959aec0c2b855.png


论文链接:https://arxiv.org/pdf/2010.09125.pdf

视频解读:https://youtu.be/dvjwRBZ3Hnw


11、Deep nets: What have they ever done for vision?



a330fccb8195ff590963e4148e48dcb3.png


论文链接:https://arxiv.org/abs/1805.04025

视频解读:https://youtu.be/GhPDNzAVNDk


12、Infinite Nature: Perpetual View Generation of Natural Scenes from a Single Image



5b8ac91b9bcfa0fc7768414fadb78dcf.png


论文链接:https://arxiv.org/pdf/2012.09855.pdf

代码地址:https://github.com/google-research/google-research/tree/master/infinite_nature

视频解读:https://youtu.be/NIOt1HLV_Mo

在线试用:https://colab.research.google.com/github/google-research/google-research/blob/master/infinite_nature/infinite_nature_demo.ipynb#scrollTo=sCuRX1liUEVM


13、Portable, Self-Contained Neuroprosthetic Hand with Deep Learning-Based Finger Control



4588da6b321bfd31e17041b3920a25ea.png


论文链接:https://arxiv.org/abs/2103.13452

视频解读:https://youtu.be/wNBrCRzlbVw


14、Total Relighting: Learning to Relight Portraits for Background Replacement



论文链接:https://augmentedperception.github.io/total_relighting/total_relighting_paper.pdf

视频解读:https://youtu.be/rVP2tcF_yRI


15、LASR: Learning Articulated Shape Reconstruction from a Monocular Video



4af548989dc63354744fcdd9e0ca602c.png


论文链接:


https://openaccess.thecvf.com/content/CVPR2021/papers/Yang_LASR_Learning_Articulated_Shape_Reconstruction_From_a_Monocular_Video_CVPR_2021_paper.pdf


代码地址:https://github.com/google/lasr


视频解读:https://youtu.be/lac7wqjS-8E


16、Enhancing Photorealism Enhancement



7ebeed10d6d6540079923866b062731e.png


论文链接:http://vladlen.info/papers/EPE.pdf

代码地址:https://github.com/isl-org/PhotorealismEnhancement

视频解读:https://youtu.be/3rYosbwXm1w


17、DefakeHop: A Light-Weight High-Performance Deepfake Detector



e54ebe1db7e4b615f2c3eee6f18ec3b6.png


论文链接:https://arxiv.org/abs/2103.06929

视频解读:https://youtu.be/YMir8sRWRos


18、High-Resolution Photorealistic Image Translation in Real-Time: A Laplacian Pyramid Translation Network



fc9cfd93b61516a10f002f405b0c9c1c.png


论文链接:https://arxiv.org/pdf/2105.09188.pdf

代码地址:https://github.com/csjliang/LPTN

视频解读:https://youtu.be/X7WzlAyUGPo


19、Barbershop: GAN-based Image Compositing using Segmentation Masks



cf6b4f7abb31e26502eb4f246b4f0553.png


论文链接:https://arxiv.org/pdf/2106.01505.pdf

代码地址:https://github.com/ZPdesu/Barbershop

视频解读:https://youtu.be/HtqYMvBVJD8


20、TextStyleBrush: Transfer of text aesthetics from a single example



34d4105c85fbd166e5fea0fc77f4ca59.png


论文链接:https://arxiv.org/abs/2106.08385

代码地址:https://github.com/facebookresearch/IMGUR5K-Handwriting-Dataset?fbclid=IwAR0pRAxhf8Vg-5H3fA0BEaRrMeD21HfoCJ-so8V0qmWK7Ub21dvy_jqgiVo

视频解读:https://youtu.be/hhAri5fl-XI


21、Animating Pictures with Eulerian Motion Fields



e98b2a867d61d5b7f72fa63650dd555b.png



论文链接:https://arxiv.org/abs/2011.15128

代码地址:https://eulerian.cs.washington.edu/

视频解读:https://youtu.be/KgTa2r7d0I0


22、CVPR 2021 Best Paper Award: GIRAFFE - Controllable Image Generation



3cf80b464eb23b55cc983bcd9729a89a.png



论文链接:http://www.cvlibs.net/publications/Niemeyer2021CVPR.pdf

代码地址:https://github.com/autonomousvision/giraffe

视频解读:https://youtu.be/JIJkURAkCxM


23、GitHub Copilot & Codex: Evaluating Large Language Models Trained on Code



0c4cdb480f3cf9f2be57482f5a1110b2.png



论文链接:https://arxiv.org/pdf/2107.03374.pdf

代码地址:https://copilot.github.com/

视频解读:https://youtu.be/az3oVVkTFB8


24、Apple: Recognizing People in Photos Through Private On-Device Machine Learning



909105d619d7392aadf2cf83ce421222.png


论文链接:https://machinelearning.apple.com/research/recognizing-people-photos

视频解读:https://youtu.be/LIV-M-gFRFA


相关文章
|
6月前
|
人工智能 物联网 调度
边缘大型AI模型:协作部署与物联网应用——论文阅读
论文《边缘大型AI模型:协作部署与物联网应用》系统探讨了将大模型(LAM)部署于边缘网络以赋能物联网的前沿框架。针对传统云端部署高延迟、隐私差的问题,提出“边缘LAM”新范式,通过联邦微调、专家混合与思维链推理等技术,实现低延迟、高隐私的分布式智能。
1085 6
边缘大型AI模型:协作部署与物联网应用——论文阅读
|
12月前
|
人工智能 数据可视化 数据挖掘
AI竟能独立完成顶会论文!The AI Scientist-v2:开源端到端AI自主科研系统,自动探索科学假设生成论文
The AI Scientist-v2 是由 Sakana AI 等机构开发的端到端自主科研系统,通过树搜索算法与视觉语言模型反馈实现科学假设生成、实验执行及论文撰写全流程自动化,其生成论文已通过国际顶会同行评审。
1010 34
AI竟能独立完成顶会论文!The AI Scientist-v2:开源端到端AI自主科研系统,自动探索科学假设生成论文
|
12月前
|
机器学习/深度学习 人工智能 自然语言处理
还在想开题报告?SurveyGO卷姬:清华开源学术论文AI写作神器,一键生成文献综述
SurveyGO是清华与面壁智能联合开源的AI论文写作工具,采用LLMxMapReduce-V2技术实现文献智能聚合,能根据用户输入主题快速生成结构严谨、引用可靠的学术综述。
1565 1
还在想开题报告?SurveyGO卷姬:清华开源学术论文AI写作神器,一键生成文献综述
|
7月前
|
机器学习/深度学习 人工智能 资源调度
智能家居环境中的AI决策解释:实现以人为中心的可解释性——论文阅读
本文探讨智能家居中AI决策的可解释性,提出以人为中心的XAI框架。通过SHAP、DeepLIFT等技术提升模型透明度,结合用户认知与需求,构建三层解释体系,增强信任与交互效能。
475 19
智能家居环境中的AI决策解释:实现以人为中心的可解释性——论文阅读
|
人工智能 自然语言处理 机器人
今日AI论文推荐:ReCamMaster、PLADIS、SmolDocling、FlowTok
由浙江大学、快手科技等机构提出的ReCamMaster是一个相机控制的生成式视频重渲染框架,可以使用新的相机轨迹重现输入视频的动态场景。该工作的核心创新在于利用预训练的文本到视频模型的生成能力,通过一种简单但强大的视频条件机制。为克服高质量训练数据的稀缺问题,研究者使用虚幻引擎5构建了一个全面的多相机同步视频数据集,涵盖多样化的场景和相机运动。
639 2
今日AI论文推荐:ReCamMaster、PLADIS、SmolDocling、FlowTok
|
7月前
|
机器学习/深度学习 资源调度 算法框架/工具
AI-ANNE: 将神经网络迁移到微控制器的深度探索——论文阅读
AI-ANNE框架探索将深度学习模型迁移至微控制器的可行路径,基于MicroPython在Raspberry Pi Pico上实现神经网络核心组件,支持本地化推理,推动TinyML在边缘设备中的应用。
424 10
|
7月前
|
人工智能 算法 开发者
2025年高教社杯E题——AI 辅助智能体测全国大学生数学建模(思路、代码、论文)
2025年高教社杯E题——AI 辅助智能体测全国大学生数学建模(思路、代码、论文)
619 1
|
人工智能 安全 测试技术
本周 AI Benchmark 方向论文推荐
由北京大学和微软亚洲研究院的魏李等人提出的 FEA-Bench,是一个专为评估大型语言模型(LLMs)在代码库级别进行增量开发能力的基准测试。它从 83 个 GitHub 仓库中收集了 1,401 个任务实例,专注于新功能的实现。研究表明,即使是先进的 LLMs 在此任务中的表现仍远低于预期,揭示了仓库级代码开发的重大挑战。
709 0
|
人工智能 自然语言处理 算法
科研论文翻译神器!BabelDOC:开源AI工具让PDF论文秒变双语对照,公式图表全保留
BabelDOC 是一款专为科学论文设计的开源AI翻译工具,采用先进的无损解析技术和智能布局识别算法,能完美保留原文格式并生成双语对照翻译。
2887 67
科研论文翻译神器!BabelDOC:开源AI工具让PDF论文秒变双语对照,公式图表全保留
|
12月前
|
机器学习/深度学习 人工智能 JSON
这个AI把arXiv变成代码工厂,快速复现顶会算法!Paper2Code:AI论文自动转代码神器,多智能体框架颠覆科研复现
Paper2Code是由韩国科学技术院与DeepAuto.ai联合开发的多智能体框架,通过规划、分析和代码生成三阶段流程,将机器学习论文自动转化为可执行代码仓库,显著提升科研复现效率。
1571 19
这个AI把arXiv变成代码工厂,快速复现顶会算法!Paper2Code:AI论文自动转代码神器,多智能体框架颠覆科研复现
下一篇
开通oss服务