大量的努力绘制了酵母基因组上超过400种不同蛋白质的精确结合位置,产生了迄今为止最彻底和高分辨率的染色体结构和基因调控地图。该研究揭示了两种截然不同的基因调控体系,扩展了传统的基因调控模式。所谓的组成基因,即那些执行基本的“管家”功能并且几乎总是在较低水平上活跃的基因,只需要一套基本的调控控制;而那些被环境信号激活的基因,被称为诱导性基因,登录杏耀平台有着更特殊的结构。酵母中的这一发现为更好地理解人类基因组的调控结构打开了大门。
宾夕法尼亚州立大学和康奈尔大学的科学家们在2021年3月10日发表在《自然》杂志上的一篇论文描述了这项研究。
“当我第一次了解DNA时,我被教导把基因组看作一个图书馆,里面收藏了所有写过的书,”这篇论文的第一作者、宾夕法尼亚州立大学(Penn State)的研究助理教授马修·j·罗西(Matthew J. Rossi)说。“基因组是作为DNA、RNA和蛋白质复合物的一部分存储的,称为‘染色质’。“蛋白质和DNA的相互作用调节基因何时何地表达以产生RNA(比如通过阅读来学习或制造特定的东西)。”但我一直想知道的是,在这么复杂的情况下,当你需要的时候,你如何找到合适的书呢?这就是我们在这项研究中试图回答的问题。”
一个细胞如何选择正确的书取决于调节蛋白和它们与染色质DNA的相互作用,这可以被称为基因组的调节结构。酵母细胞可以通过改变这种调节结构来响应环境的变化,从而开启或关闭不同的基因。在多细胞生物中,像人类一样,肌肉细胞、神经元和其他细胞类型之间的差异是通过调节这些细胞表达的基因来决定的。因此,破译控制这种差异基因表达的机制对于理解对环境、生物发展和进化的反应至关重要。
康奈尔大学(Cornell University)分子生物学和遗传学教授b·富兰克林·普(B. Franklin Pugh)说,“蛋白质需要在基因中被招募和组装,才能被‘打开’。”普是他在宾夕法尼亚州立大学(Penn State)担任教授时发起的一项研究项目的负责人。“我们绘制了这些蛋白质的最完整和高分辨率的地图,显示了它们与酵母基因组结合的位置,并揭示了它们如何相互作用来调节基因表达。”
该团队使用了一种名为ChIP-exo的技术,即ChIP-seq的高分辨率版本,精确且可重复地绘制了约400种不同蛋白质与酵母基因组相互作用的结合位置,有些在几个位置,有些在数千个位置。在ChIP-exo中,蛋白质与活细胞内的DNA进行化学交联,从而锁定它们的位置。然后从细胞中取出染色体,剪成更小的碎片。抗体被用来捕获特定的蛋白质和与之结合的DNA片段。蛋白质-DNA相互作用的位置可以通过对附着在蛋白质上的DNA进行测序,并将序列映射回基因组来找到。
康奈尔大学助理研究教授、论文作者之一William K.M. Lai说:“在传统的ChIP-seq中,连接到蛋白质上的DNA片段仍然很大,
杏耀平台总代 ,长度变化很大——超出实际蛋白质结合位点的范围从100到500个碱基对不等。”“在ChIP-exo中,我们增加了一个额外的步骤,用一种称为外切核酸酶的酶来修剪DNA。这消除了任何没有被交联蛋白保护的多余DNA,使我们能够得到结合事件更精确的位置,杏耀网址并更好地观察蛋白质之间的相互作用。”
该团队进行了超过1200个单独的ChIP-exo实验,产生了数十亿个单独的数据点。对大量数据的分析利用了宾夕法尼亚州立大学的超级计算集群,需要开发一些新的生物信息工具,包括一个用于识别模式和揭示酵母基因组中调控蛋白组织的多面计算工作流。
该分析类似于从数百张卫星图像中挑选出地面上重复的特征类型,揭示了在酵母基因组中重复使用的独特蛋白质组合,数量少得惊人。
宾夕法尼亚州立大学生物化学和分子生物学助理教授、论文作者Shaun Mahony说:“数据的分辨率和完整性使我们能够识别21种蛋白质组合,也能识别管家基因中特定调控信号的缺失。”“我们为分析这些数据开发的计算方法可以作为一个起点,为在更复杂的有机体中进行基因调控研究提供进一步发展。”
传统的基因调控模型涉及一种叫做“转录因子”的蛋白质,它与特定的DNA序列结合,控制附近基因的表达。然而,研究人员发现,酵母中的大多数基因并不遵循这一模式。
Pugh说:“我们惊讶地发现管家基因缺乏一种蛋白质- dna结构,这种结构允许特定的转录因子结合,这是诱导基因的标志。”“这些基因似乎只是需要一套通用的蛋白质,使其能够进入DNA并进行转录,而不需要太多的调控。”这种模式是否适用于像人类这样的多细胞生物还有待观察。这是一个复杂得多的命题,但就像酵母基因组测序先于人类基因组测序一样,我相信我们最终将能够以高分辨率看到人类基因组的调控架构。”