notes on How to Read a Paper

在本周的某门研究导引课上,被推荐了一篇讲述如何读 paper 的 paper. 一直以来,其实我都觉得科研(research)明明是一个 skill, 但是一直都没有过方法或者课程的教授,也没有一个好的学习过程和机会。基本都是老师布置任务方向,交代看些什么 papers, 完成什么任务,就这样靠着所谓的做中学,靠着所谓的骚扰师兄师姐,大家就能突然领悟,就能够上手很好地完成科研工作,掌握科研的方法和技能。而领悟不到的,就只能够解释为自己不适合科研而遗憾退场,或者当一颗科研的螺丝钉来苟活着。 当然其实基本所有的事情,都有着其自身的方法论,都能够找到相关的系统的训练(maybe

回到正题,这篇 paper 主要讲了怎样读一篇 paper,以及如何判断读到什么程度和该不该读。

Why reading papers?

  • reviewing papers for a conference or a class
  • keep current in our fields
  • doing survey for exploring a new field

Three-Pass Approach

本文最主要还是提出了一个分成三个阶段阅读的方法。第一阶段的阅读获取文章的大体 idea, 第二阶段的阅读获取文章的主要内容,第三个阶段则深入了解文章,获取各种 details。

The First Pass

a quick scan to get a bird’s-eye view of the paper

第一阶段的阅读快速浏览 paper, 大概以五到十分钟的时间,了解它的大体想讲什么,从而决定后续要不要继续阅读。主要通过以下部分获取信息:

  1. 仔细阅读文章的 title, sub-title, abstract 和 introduction
  2. 阅读各个章节的标题(仅标题
  3. 跳到最后仔细阅读 conclusion 部分
  4. 扫一下 references, 看看有无熟悉/看过的

通过第一阶段的略读,应该能够回答以下的问题:

  • 文章的类别:本文是什么类型的文章?measurement paper, analysis of systems, description of prototype
  • Context: 文章属于什么领域?与什么方向相关?
  • 正确性
  • contribution
  • 写得怎么样(从行文的角度来看

如果出现以下情况,就可以选择 stop 不看了:(如果不是被安排了必须完成的任务

  1. 不感兴趣
  2. 没有相关的前提知识无法理解
  3. 文章存在问题

The Second Pass

第二阶段的阅读可以花上一个小时,对文字的主要内容作一个更加详细的了解,找到 paper 中的关键点。可以通过仔细浏览文章给出的图表入手,通过浏览图表的内容,找出它所表现的数据特征,它 support 的内容或结论,来发掘文章的关键点。

完成第二阶段的阅读后,应该能够把握到文章的内容,并且能够向他人进行本篇文章的 summarize. 如果所阅读的文章不是当前所研究方向的内容,仅是感兴趣的话,到这一阶段则可以结束阅读了。

如果结束第二阶段后还没理解一篇文章,则可能是:

  • 对该领域不熟悉,不了解这方向的名词概念
  • 证明或实验技巧不理解
  • 写得不行影响阅读理解

对于这些情况,我们可以:不看了;读点背景材料再来看;直接跳到第三阶段

The Third Pass

第三阶段则是通过解构重构的方法来读文章,通过由读者来在脑海中重新实现 paper 的方法来进行:基于作者提出的一些 assumptions,我们会怎样来写这篇文章,怎样来展示里面的工作。通过这样的方法,我们自然会对文章中的 assumptions 有着更深的了解,也自然地会去 challenge 它们。当我们自行 virtual re-implementing 之后,再与文章进行比对,查看一致与不一致的地方

At the end of this pass, you should be able to reconstruct the entire structure of the paper from memory, as well as be able to identify its strong and weak points

如何综述 / survey

当我们想要了解某个领域某个小的方向时,如果能够搜到 survey 自然是最好的,但有时找不到,可以通过从相关文章中的 related works 里面去找。