【爱可可独家秘籍】仅需四步,教你高效阅读arXiv论文

简介:

长话短说,先看图:

f4899e97eaa2da293ae3d4500616516c3cba2048

总的来说,arXiv学海无涯,泛舟有道:想清楚,巧选择,多泛读,勤总结。其实不止arXiv,其他论文也一样,只是arXiv流量大,更需要技巧

有人说arXiv垃圾太多,不值一读,这种说法,我深感不以为然。我在微博上曾说过——如果你爱它,就把它发到arXiv,因为那里是圣殿;如果你恨它,就把它发到arXiv,因为那里是垃圾场。

ad5cbb6edfb340cc2a6f263e2be167b5c6b21673

arXiv就是这么个鱼龙混杂,让人又爱又恨的地方。平心而论,arXiv上高素质的论文不在少数,且有快速上升之势,废话少说,看数据:2017年,理论计算机科学与机器学习领域,超过60%的发表论文都有arXiv电子版。且不说arXiv还有最美的两点:快 & 多 。“快”自不必细表, 第一时间洞悉实力团队最新方向/成果,零延时跟踪最新问题/技术前沿,arXiv是个太理想的地方,期刊、会议绝无胜算;“多”怎么也成了优点?因为多,所以杂,统计上才能更有效代表整体趋势——占坑也好,废稿也罢,良莠不齐,总量庞大,一分析,哪有路、哪是坑、哪深哪浅自然清清楚楚——噪声不可怕,因为噪声,才真实,分布才有连续性,才可信。说arXiv全是垃圾的,八成是没深入研究、懒得淘金的人。怎么读?光靠勤奋还不够,得讲方法,讲策略。

第一步,想清楚

想什么?想定位,想目标,想方法。

为啥而看?跟踪前沿?找问题?找方法?膜拜?探坑?找人?找撕?学写作?凑谈资?打发时间?定位清楚了,题材范围自然清晰,不了解自己,只能“通吃”,结果往往是“消化不良”。

不管什么定位,有一点很重要:抱着学习的心态去读,收获往往更多。挑剔不会让你显得更有水平,取其精华,取长补短,才是成长正道。

前阵子Kyunghyun Cho在关于博士生为学之道的访谈里提到了“过度阅读”:

Excessive reading can create additional boundaries, holding a researcher away from trying out new ideas.

说的是“过度阅读”有反作用,像“砌墙”,会妨碍你尝试新想法。解决方法很简单——摆正心态,就无所谓“过度”:读论文读的不是边界,是思考,是启迪,读完该做什么坚持去做:

Pursue your direction, try yourself, no matter if someone was successful or not in this direction so far.

读论文的同时也不要忽略读书——打好基础很重要,尤其是论文作者认为“大家都懂”的“常识性”知识。基础好才有“根”,新来的知识和思考才有关联和生长的“干”,终能长成一棵健康茂密的参天之“树”。

 第二步,巧选择

读arXiv,选择很关键,选对了,就成功了一半。简言之,选择看三点:形、神、从。

形:看的是论文的表象,具体包括出处、题目、文字和图表。

无疑,题目和出处是粗筛最有效的特征——题目言之有物、简短有趣、问题方法立意新颖,作者、机构耳熟能详,可迅速排除50%的论文,当然,根据具体定位,对作者、出处相对陌生的文章,不妨多一些宽容,如果标题有趣可以泛读试试,有时也会出现“惊喜”;

文字部分,一看摘要和导言,二看全文结构。摘要开门见山,重点突出,导言对问题、难点、相关工作和本文工作交代清楚、逻辑严谨,全文结构紧凑不拖沓,引用全面的论文,可优先入选;

图表部分,要求说明完整,自成一体又与文字相呼应。好的图表,应该能体现本文的思想和特色,配合文字说明,能了解论文的角度和作者的思考。

神:看的是论文的内涵,具体包括主旨、韵律和风格。

好的论文,主旨明确,角度合理,思路清晰,一条线索贯穿全文;

论文的韵律,是对内容轻重详略的编排,好的论文焦点明确,节奏得当,一眼能找到作者重点要表达的内容;

好的论文,一定不是自说自话,更像是与读者之间的对话,对于读者关心的方面和潜在的问题,都会贴心地预先作答,用主线引领读者顺畅阅读。

从:看其他读者的推荐和反馈,可从一人,也可从众。

跟随他人,恐怕是最便捷的一条选择之路,但有时可遇不可求。

跟随一个人,看的是对方的方向和品味。选择跟着谁,这是个不小的难题,就像是推荐系统做到最后,重点不在物物关联,而在找对要协同的用户。如何衡量对方是否值得“追随”呢?可以看是不是满足多、少、信三个条件。多是指不但乐于分享,还能坚持不懈的持续分享;少是指在选读论文方面有统一的品味和态度,宁缺毋滥;信是说可信,水准稳定,不轻易“夹带私货”。如果找到一位符合以上三点的人,又恰巧和你方向相似或部分重合,那绝对是可喜可贺!我在努力寻找这样的人,也在努力做这样的人,利己,利人,希望你也一样。

从众,也许算得上是条捷径,大众关注的,必有其看点,炒作也好,批判也罢,“焦点”就是这么一种特别的东西,你不必完全“明白”,但“知道”一定有益无害。

以上所说,只是用来判断论文质量的一些粗浅“招式”,当你借助这些方法帮自己找出一定量的“好”论文,就会逐渐找到筛选论文的感觉和自信,这时候,就像习武的更高境界——“无招”胜"有招",可以轻松给论文打个比较客观的总分了,相信这一天不会太远。

第三步,多泛读

终于到了读论文的时候,别激动,也别忙着深入细节,先把策略搞清楚。建议大量泛读,极少量精读,避免走读。

泛读看什么?看问题、看难点、看相关工作、看本文的角度和特色,重在拓展视野、延伸思考、充实基本面;

精读看什么?深入学习,不错过每一点细节,避免道听途说遗漏重点。只有对自己特别“有用”的论文才精读,一旦选定切勿浅尝辄止、囫囵吞枣。

打定主意,严格区分,不要在“知道”和“明白”之间徘徊,做到精力的高效优化分配。

读论文,重在思考,因联系、深化而增值的部分是最可宝贵的。多思考,多关联,加深、拓宽,为自己的知识体系添枝散叶,才是阅读的意义所在。

第四步,勤总结

把阅读的收获及时总结、适时回顾是个很好的习惯。学习的过程,就是不断地抽象、巩固,适当的重复不但会加强你的记忆,也会启发出一些更深入的思考。

试着多和别人分享,尤其是精读的文章。就像费曼先生说的:“要是你无法用简单朴素的语言解释清楚,说明你还没有真正理解”,讲给别人听,是检验自己是否真正读懂的有效基准。

可以听别人分享,但不要迷信,更不要当做了解新知的捷径,偷懒取巧只会得不偿失,老话说得没错:“想要知道梨的滋味,就要亲口尝一尝” 再细致的阅读分享,也不如老老实实阅读一遍原文来得实在。


原文发布时间为:2018-02-12

本文作者:爱可可爱生活

本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”微信公众号

原文链接【爱可可独家秘籍】仅需四步,教你高效阅读arXiv论文

相关文章
|
2月前
|
SQL 人工智能 自然语言处理
2024年代码大模型论文精选第五期
本文整理了2024年9月至10月中旬全球各大高校与科研机构发布的70篇代码大模型相关论文,涵盖基座模型、代码微调、测试基准、代码Agent、代码生成、SQL生成、漏洞检测与修复等多个主题。文章详细介绍了各篇论文的主要内容和创新点,并提供了链接和发布机构信息。全文篇幅较长,建议电脑端阅读。若想了解更多相关内容,可关注我们的代码大模型综述和GitHub开源项目。
202 0
|
4月前
|
人工智能 自然语言处理
🚀从菜鸟到大师,一文读懂生成式大模型“提示词工程”的进阶秘籍✨
【8月更文挑战第1天】在人工智能领域,生成式大模型如GPT和DALL-E正引领着创意的新纪元。本文通过案例逐步解析“提示词工程”的精髓:从基础的直接提示,进化到富含细节与情感的进阶版本,再到结合模板与随机性的大师级应用。例如,创作环保主题文章时,从简单指示到强调个人行动与自然之美;生成印象派风格的日出海景图时,详述光线、色彩等元素。随着技巧提升,还可利用基础模板加随机提示的方式确保创意与质量并重。掌握这些秘籍,你也能驾驭AI,释放无限可能。
108 7
|
机器学习/深度学习 人工智能 自然语言处理
史上最全Transformer合集!LeCun力推:给60个模型建目录,哪篇论文你错过了?
史上最全Transformer合集!LeCun力推:给60个模型建目录,哪篇论文你错过了?
403 0
|
搜索推荐 数据库
SCI论文写作训练营笔记汇总01_概述+文献检索与管理
建议大家在读文献的过程中多记笔记。 另外, 在下一讲科技论文阅读与解析这节课中会详细讲解文献阅读技巧, 为大家解析如何提高英文论文阅读效率及如何通过阅读提高论文写作水平。
208 0
|
C++
SCI论文写作训练营笔记汇总05_英文论文投稿流程与常见问题(完)
图注是不能和图片一起上传的, 一般在投稿系统中, “figure legend” 是放在文章正文“manuscript” 的最后一页统一上传的,而图片则是一张一张单独上传的。所以图注是与正文部分一起提交的, 而图片是单独提交的。
873 0
SCI论文写作训练营笔记汇总03_科技论文写作(方法篇)
讨论部分的内容有时需要附属一下前面讨论的结果, 以精简的语言提一下即可, 后面需要有加深性的内容, 如果没有加深性的内容, 那么这篇文章里最好不要出现讨论的内容, 结果和讨论可以放在一起。结论要重点复述结果部分的内容, 讨论里的一些内容不写在结论里也是可以的。
264 0
|
存储 自然语言处理 算法
【趣学算法】第一章读书笔记
宕机就是死机,指计算机无法正常工作,包括一切原因导致的死机。计算机主机出现意外故障而死机,一些服务器死锁,服务器的某些服务停止运行等,都可以称为宕机。
|
机器学习/深度学习 数据挖掘
周志华第一章,第二章学习总结
周志华第一章,第二章学习总结
周志华第一章,第二章学习总结
|
机器学习/深度学习 人工智能
吴恩达知乎开课:谢邀,我来教你系统学习机器学习
吴恩达知乎开课:谢邀,我来教你系统学习机器学习
195 0
吴恩达知乎开课:谢邀,我来教你系统学习机器学习
|
机器学习/深度学习 人工智能 自然语言处理
撒花!《神经网络与深度学习》中文教程正式开源!全书 pdf、ppt 和代码一同放出
撒花!《神经网络与深度学习》中文教程正式开源!全书 pdf、ppt 和代码一同放出
3688 0
撒花!《神经网络与深度学习》中文教程正式开源!全书 pdf、ppt 和代码一同放出