第三章 创世纪的工程——人类基因组计划解读
一个基因一定在基因组中有其位点,这个位点至少有两个等位基因,一个是正常的,一个是不正常的。如果这个不正常的基因不表达,这个人还是正常的,仅仅是一个携带者。这个位点和全部基因组的遗传标记存在着距离问题,如果位点接近,就会发生交换,距离较远的,交换的频率就高。科学家采用一个遗传标记,来检查家系中这个遗传标记的位点是否与致病位点发生交换。靠物理图就可以在这个遗传标志的相应距离找到这个基因。虽然疾病的原因很复杂,但是利用遗传图就可能分离到这个基因。
因此,在遗传图中,家系是一个重要分析对象。序列中的差异就成为最好的“遗传标记。”
物理图、转录图和遗传图都是序列前计划,这些图的绘制,都是为人类基因组的序列图作准备,只有序列图完成了,才能将人群内序列的差异,作为密度最高的遗传标记来完善遗传图,因此序列图是人类基因组计划中的最重要部分。
中国参加人类基因组计划的科学家在《生命大解密》一书中详细讲解了人类基因组序列图的绘制工作是如何进行的:
人类基因组DNA序列图的绘制工作,可以做这样的比喻:假说人们只穿4种颜色的衣服,红、黄、白、黑,“人类基因组计划”就相当于把世界上30亿人所穿的衣服都搞清楚,而且注明位置顺序,如所在的国家、城市、街道、楼房、房间。人类基因组DNA序列图的绘制,是在上述3张图的基础上,采用了“分而胜之”的“克隆到克隆”的策略。
科学家用已在代表人类基因组中不同区域定好位置的标记,即遗传图的“遗传标记”和物理图的“物理标记”,来找到对应的人类基因组“DNA大片段的克隆”。这些克隆都已知道是相互重叠的。再分别用机器测定每一个克隆的DNA顺序,再把它们按照相互重叠的“相邻片段群”装搭起来。
为了测定这些大片DNA克隆的序列,要将这些DNA克隆按遗传图与物理图的标记,确定在基因组中,切成1一2000核音酸长的小片段,再“装”到一种质粒“载体”上,送进细菌中克隆,大规模地培养细菌,再从细菌中提取这些“克隆’的DNA。在我国的“北京中心’,工作人员每天要制备5000一1万个克隆的DNA作为测序“模板”。这些DNA要质量上很纯,数量上准确,还不能相互混杂。
模板制备好了,就要进行测序。一第一步是“测序反应”。现在使用的方法是“酶终止法”。简单地说,是以要测的DNA为模板,重新合成一条新链,分别用不同颜色的荧光物质标记上。这样,如果一段序列的一个位点上是A,就将代表A的劳火物质标记在A的后面,由此类推。这样就形成了长度相差一个核着酸的新的DNA链,而结尾一位则可以荣火的颜色来决定是:或地或t、或动或G。
测序反应做好后,第二步是上‘咱动测序议’分析。现在的机器主要有两类,一类是“凝胶电泳”,另一类为“毛细管电泳”,它们都能将长度仅相差一个碱基的DNA片段—一分开,由于不同的片段尾巴的核着酸已标有不同颜色的荧光染料,可以很直观地读出A、t、C、G的序列。
这些“序列”通过电脑加工、检查质量,再用一些特殊的电脑程序,将相互重叠的序列装搭起来。要确定每一位置的核音酸,至少要测定5一10次。如果中间有“空洞”,还要将这些“空洞”用各种技术“补”起来,最后形成一个大片段克隆的完整序列。这些序列片段再根据“相邻片段群”的信息装搭起来,就组合成了一个染色体区域,一个染色体完整序列。
现代的基因组技术是分子生物学、遗传学、遗传工程技术、生物信息学的综合。由于整个生命科学已进入“以序列为基础的时代”,大规模基因组测序、组装与分析技术已成为