这是人类基因组计划留下的负面遗产之一:让人们对非编码区有错误的认识和不切实际的幻想。
「基因荒漠」的说法源自人类基因组计划的结论「人类基因组只有约 1.5% 在编码蛋白质」,一些学者将 98.5% 的非编码区里 大片没有基因的连续区域 比喻为荒漠。其实这里面许多区域装着 调控基因表达的启动子、增强子、沉默子、绝缘子,还有转录因子的连接点位 。
另一方面,人们往往以为生物身上的任何玩意都得对进化有点什么「意义」才行,并将自己一知半解或只听过个名字的功能 往非编码区里胡乱归因 ,例如「不管病毒怎么变异,我们体内总能产生相应的抗体,你觉得那些抗体的基因是哪来的呢」这样的纯粹错误。
这种「进化意义论」是十九世纪坟墓里散发的流毒与人类基因组计划起初的夸大宣传杂交的产物。自然选择塑造的 DNA 序列不要求「有意义」「功能强大」「有种种优点」,只要你没在传代过程中被任何因素打断,什么样的无功能废物都可以传下来,「在传代之前不会高概率致死」就可以算中性性状了,然后你需要的就只是一点偶然。
你当然可以期待「非编码 DNA 序列突变为有功能的序列或新的基因,发挥新的作用」,但大部分突变是无用或有害的,人对多种病原体的易感性和一些癌症的发病与非编码 DNA 序列的突变有关。而且,目前看来非编码 DNA 序列突变出任何有功能序列的概率都比「随便来了个病毒,送你个有功能序列」的概率要低。