Chenxia Han (韩晨夏)


How to Read a Paper

2023/10/17

本科的时候我总是感觉读一篇论文非常困难,要把七八页的文章看完费时费力还记不住什么。直到后来读到了S. Keshav的”How to read a paper",才明白看文章需要先粗看后细看。可是即便如此,我依然觉得读的很累,只是不停地逼自己把文章看完而没有收获太多。

后来我意识到根本原因是因为没有带着问题去看文章,所以不知道看什么。就像Kaiming前两天给talk的时候说的,科研的初心是curiosity。对于一篇文章,我们之所以想读它总是有原因。或是因为这篇文章很有名,或是因为标题看起来很有意思,又或是因为和我们要做的项目相关不得不读。无论是什么原因,都有一个共同的出发点,就是想知道文章里讲了什么。所以拿到一篇文章应该先问几个问题:

一篇写的好的文章应该很容易就让读者抓住这几个问题。当然也有一些文章写得实在是太烂了,这个时候只能判断一下这篇文章值不值得仔细琢磨。

有了ChatPDF之后,我们也可以尝试把论文丢进去问它。比如把ResNet的paper丢进去并问它:

ChatPDF

可以看到ChatPDF的回答还是合理的。不过ChatPDF暂时还不完善,有的回答并不准确,尤其是遇到公式和图片还不能很好的解析。

找到了上面几个问题的答案后,应该再问自己几个问题:

这些问题都了解了之后,才算真正读懂了一篇论文。而带着问题读论文会让一切都变得很轻松,因为目标就是找答案,所有与答案无关的都可以暂时忽略。事实上,想一次性看懂一篇论文的所有细节是不太可能的。论文总是常看常新,有需要的时候再翻出来就是了。

虽然说上面的方法可以让看论文这件事变得更高效,但是可以看到,随着LLM的爆火,传统的把idea写成论文的形式显得有些“跟不上时代”。很多论文在发表的同时也会在推特上做宣传,而读者只需要简单看一下推文就能了解一个工作的大概。这种信息传递形式相比论文是更高效的,就像当初CS偏好会议而摒弃期刊一样。如果有一天LLM可以自己读文章想idea写代码的话,或许就不需要论文这种信息载体了,毕竟论文是给人看的。等那个时候我们或许也就不需要看论文了。

References