最近,欧洲博士的一篇质疑,在机器学习社区火了!
欧洲博士质疑,在机器学习社区火了

我真的很困惑,这帮人是如何做到这么高效的?他们是不是有什么特殊的研究方法和资源,让他们如此迅速高产高质量研究?

自曝原因:每天工作超10小时,7天无休
有人现身说法表示,这是因为,美国大学里充满了卷王! 
首先,美国学术界存在一种很卷的发表和工作文化。 曾在美国顶尖 CS 项目之一的实验室做过本科生的层主表示,自己亲眼目睹了研究生们的工作节奏—— 一周七天都在工作,每天超过 10 小时,全年无休。 有一次,他无意中晚上 7 点去实验室,发现自己的研究生同学还在那里。 因为好奇他究竟会工作到多晚,层主干脆在实验室等他,结果是——直到凌晨 1 点,他才回家! 当然,这并非实验室的强制要求,每个人都可以和项目负责人约定自己的工作界限。 但在美国这个人才竞争如此激烈的领域,每个人都会感受到巨大的压力,没有谁能不受影响。 第二点,美国实验室的显著优势,就是吸引了来自世界各国的顶尖人才。 这里层主特意拿清华举了例子,据悉这个顶尖项目对于清华学生的录取率仅有 0.1%…… 如果能吸引到中国和其他国家的顶尖人才,还让他们每天工作 10 小时,那你很难不产生一些疯狂的成果。 总之,全球顶尖人才,汇聚在了一个高强度的工作环境里,这就造成了美国研究生惊人的学术产出。

有一次几个本科生因为在晚上十一点来到实验室。当他们看到我们这些研究生还在埋头工作时,一个个满脸震惊。但说实话,对我们来说,这种情况再平常不过了。




既不缺GPU和资源,还有大厂/大佬背书
GPU Rich vs GPU Poor
可能和大多数人一样,楼主也是「GPU 穷人」。而那些顶尖博士项目的资源,可是有着天壤之别! 他们拥有极其昂贵的 GPU 集群,因此能够快速训练或微调几乎所有的模型,甚至是超过千亿参数的大模型。 这种资源优势让他们能够大幅提升迭代速度,从而开展一些对其他人来说根本无法想象的研究。


其实是幸存者偏差
楼主关注的都是美国顶尖的机器学习项目,他们的成果自然也是世界一流的。
但如果去了解一下普通大学里博士生的情况,就会发现他们作为一作在顶会上发论文的情况并不常见。
有人对这位博士表示,你所观察到的样本,并不具有统计学意义上的随机性和代表性。
被偶然看到的美国博士生的论文或简历,几乎可以肯定地说,代表了学术成就分布中最为 top 的那一波。
这些高产出的学生,往往会被他们所在的知名实验室和机构更多地推广。
他们的成功可能源于良好的科研环境、出色的个人能力、一定的运气成分、严格的竞争性选拔以及其他因素。
其实这就类似于社交媒体会导致人们焦虑和抑郁。
在社交平台上,人们倾向于展示自己最好的一面,这导致我们常常将自己与一个经过筛选、存在偏差且被美化过的样本进行比较。
在学术界也是如此,每个研究者都在某种程度上「推销」自己的研究成果,而那些最引人注目的成果,自然会得到更多关注。
也有人指出,虽然楼主的描述有些夸大了,但的确存在一个临界点,超过这个点之后,单纯增加数量和投入时间并不能等同于提高质量。
https://www.reddit.com/r/MachineLearning/comments/1g7dzkp/d_why_do_phd_students_in_the_us_seem_like/
