原创 范阳 2025-04-08 19:25 上海
科学探索的思维革新。
今天分享的这篇文章也是最近给了我思想上许多启发的一篇短文,来自于 Sam Rodriques。在之前的文章里介绍过,他是生命科学领域的非营利新型科研组织 FutureHouse 的联合创始人和 CEO ,他对于元科学( 现代科学研究的元方法 )以及人工智能时代的科研组织形式有着最深入的思考,以及通过运营 FutureHouse 来找到崭新的“突破性研究到商业化成功”的模式。
在复杂度和混乱度越来越高的世界里,每个人都应该有意识自己的“人为预设的认知盲区”在哪里?我们过去成功的经验,或者我们向别人学习到的“成功经验”,在新的环境和更大的世界里,是不是还能奏效?我们想看到的和追求的,到底是寻找已经预想好的答案,还是勇敢地探索那些超出我们认知的崭新事物?这些问题就跟做科学实验一样,我们不带预设,到知道有一个工具能照见所有的潜藏可能,这不只是科学的革新,也是我们每个人思维的革新。
希望今天这篇文章对你有启发。
全假设研究
All-hypothesis research
作者:Sam Rodriques
编辑:范阳
发表日期:2025年1月8日
起初,我们进行的是以“假设为驱动的研究”( hypothesis-driven research )。但如今,测量技术已经高度自动化并具备高通量特性,一次只验证一个假设的做法,显得效率低下,难以应对复杂科学问题的挑战。
接着,我们进入了“去假设的研究”阶段( hypothesis-free research )。然而,如果事先没有明确的假设,就无法确保实验设计真正适合发现新的知识。
因此,最终我们将进入一个全假设研究( all-hypothesis research )的时代。实验设计将明确考量所有可能假设的概率分布,并通过最大化信息增益来优化实验方案( where experimental design will explicitly consider the entire distribution of possible hypotheses, and be chosen to maximize information gain )。
( 我认为这种方式也有助于解决“p值操纵”( p-hacking )的问题。因为当我们显式地考虑所有可能的统计分析方法所对应的整个 p 值分布,而非刻意挑选统计方法来获得特定 p 值,,p-hacking 将不再可能。)
译者注:什么是 p 值操纵?想象你在打篮球比赛,每次投篮都有可能进也可能不进。如果你每次只记下那些进球的次数,而忽略了没进球的次数,这样你就会让自己的命中率看起来比实际情况好得多。这就是“p 值操纵”:研究者可能会尝试很多种方法,只挑选那些显示“进球”( 即统计上显著 )的结果,而忽视了没有“进球”的方法,从而让结果看起来比实际更有说服力。
而“全研究假设”就像是你把每一次投篮的结果都记录下来,无论是进球还是失误。在“自动化科学”和人工智能驱动的生物学研究中,“全假设研究”可以理解为用人工智能和“机器人技术”帮助我们一次性把所有可能的答案都“测量出来”,而不是只挑其中看起来有用的部分。新的科研范式不再执着于追求绝对的"对不对",而是告诉你"有哪些全局可能,各自有多靠谱"。然后再去对比现实验证。