论文阅读 and so on
伴随着人工智能技术的发展,人工智能所能涉及的领域也越来越多,从本来的图像处理以及自然语言变到了如今越发宽广的模样,包括大语言/多模态模型、具身智能、3DV、图像生成以及其他的无数的领域,而再向下细分更是有无穷多的分枝。从这样一个庞杂的枝杈中找到自己感兴趣的方向并非一件易事,读者不妨给自己放一到两周的假,在大量的新闻中了解AI领域的各个方面,包括但不限于各类新闻和公众号的推送,以及各类的每日论文推荐,并且尝试从中找到自己感兴趣的方向。在这里给出一些推荐的信息渠道。
当读者找到了一个领域之后,往往就需要开始了解这个领域相关的论文,而弄懂一个领域在做什么,核心思想就是弄清楚当前的前沿工作都是用什么架构的模型,在怎样的数据上训练,并且存在哪些应用场景。人工智能本质上作为实践学科,是用方法解决某个问题,因此搞清楚这个关系就明白了大半,接下来就需要开始关注方法的细节,并且进一步精读论文了。
阅读论文的方法依然可以参考李沐的论文精读系列,只是众多论文不一定和你的口味,你只需要了解阅读的节奏,并且在熟悉一个领域之后开始加快这一节奏,同时他们的论文串讲做得非常不错,值得一听。
尽管前面给出了不少的捷径,但是到了最后这里,笔者却难以给出更快的方法,本身对于领域内方法的理解,就是在大量的阅读以及大量的实验基础上积累得到的,二者缺一不可,而在读者尚且没有进行实验的条件下,阅读也自然就成了唯一的途径。
对于如何获得需要阅读的论文列表,大多数流行的领域在 Github 上均存在对应的所谓 awesome list,如 多模态大模型、具身智能 或者 Unified Models,也就是领域中其他人为这个领域收集的论文推荐列表。这些列表往往大而全,但是并不是每一篇都有必要精读,一个很好的参考是读者可以前往 谷歌学术 查看论文的引用情况。同时读者也需要紧密关注大量人工智能相关资讯,如公众号机器之心、新智元以及量子位。关注 arxiv 上的最新论文也是一个好的习惯,同时 papers.cool 是一个每日推荐论文的网站,值得每日上去刷一刷。
而当你阅读了大量论文之后,可以前往一些租卡平台,诸如 autodl,使用按量计费的方法租卡来跑一些实验,将自己看过的领域内比较前沿的论文跑一跑,从而增加自己的上手经验。
实际上任何研究者都是从新手做起的,所以完全无需为难情绪,尽管实际上在这个介绍篇幅并不是很大的练手环节,才是篇章中可能带来最多挫折的部分,但是现在不同的领域有不同的代码体系,大量的经验只可意会不可言传,都是十分分散的,也是读者也只能在实践中自己摸索了。
不过假如读者在摸索之后获得了提升,并且按照笔者上述的建议进行了近期工作的汇总,将自己如何解决问题记录了下来,笔者自然也欢迎读者将自己的博客发在评论区,供后来者参考。笔者当前在具身智能领域进行了大量仿真器的开发,相关内容都在本站中汇总成的博客,假如读者恰好对这个领域有兴趣也可以前去一观。