Chenxia Han's Homepage

本科的时候我总是感觉读一篇论文非常困难，要把七八页的文章看完费时费力还记不住什么。直到后来读到了S. Keshav的”How to read a paper"，才明白看文章需要先粗看后细看。可是即便如此，我依然觉得读的很累，只是不停地逼自己把文章看完而没有收获太多。

后来我意识到根本原因是因为没有带着问题去看文章，所以不知道看什么。就像Kaiming前两天给talk的时候说的，科研的初心是curiosity。对于一篇文章，我们之所以想读它总是有原因。或是因为这篇文章很有名，或是因为标题看起来很有意思，又或是因为和我们要做的项目相关不得不读。无论是什么原因，都有一个共同的出发点，就是想知道文章里讲了什么。所以拿到一篇文章应该先问几个问题：

它解决的是什么问题？
它的大致方法是什么？
为什么别人的方法做不到而它可以？
它的总体效果有多好？

一篇写的好的文章应该很容易就让读者抓住这几个问题。当然也有一些文章写得实在是太烂了，这个时候只能判断一下这篇文章值不值得仔细琢磨。

有了ChatPDF之后，我们也可以尝试把论文丢进去问它。比如把ResNet的paper丢进去并问它：

ChatPDF

可以看到ChatPDF的回答还是合理的。不过ChatPDF暂时还不完善，有的回答并不准确，尤其是遇到公式和图片还不能很好的解析。

找到了上面几个问题的答案后，应该再问自己几个问题：

它依赖的假设真的存在吗？
这个方法有什么局限性？
这个方法能不能被迁移到其它的领域？

这些问题都了解了之后，才算真正读懂了一篇论文。而带着问题读论文会让一切都变得很轻松，因为目标就是找答案，所有与答案无关的都可以暂时忽略。事实上，想一次性看懂一篇论文的所有细节是不太可能的。论文总是常看常新，有需要的时候再翻出来就是了。

虽然说上面的方法可以让看论文这件事变得更高效，但是可以看到，随着LLM的爆火，传统的把idea写成论文的形式显得有些“跟不上时代”。很多论文在发表的同时也会在推特上做宣传，而读者只需要简单看一下推文就能了解一个工作的大概。这种信息传递形式相比论文是更高效的，就像当初CS偏好会议而摒弃期刊一样。如果有一天LLM可以自己读文章想idea写代码的话，或许就不需要论文这种信息载体了，毕竟论文是给人看的。等那个时候我们或许也就不需要看论文了。

Chenxia Han (韩晨夏)

How to Read a Paper

2023/10/17

References