基因意思解释
基因(英语:gene),含特定遗传信息的核苷酸序列,是遗传物质的最小功能单位。除某些病毒的基因由核糖核酸(RNA)构成以外,多数生物的基因由脱氧核糖核酸(DNA)构成,并在染色体上作线状排列。基因一词通常指染色体基因。在真核生物中,由于染色体都在细胞核内,所以又称为核基因。位于线粒体和叶绿体等细胞器中的基因则称为染色体外基因、核外基因或细胞质基因,也可以分别称为线粒体基因、质粒和叶绿体基因。
“基因(gene)”一词由丹麦植物学家、植物生理学家和遗传学家威廉·约翰森于1909年提出。它的灵感来自古希腊语:γόνος(gonos),意味着后代和繁殖。
概述
在生物学中,基因是指“携带遗传信息的基本物质单位”(基本遗传单位)。而自从确定遗传信息的分子载体为核酸后,基因即指能够遗传且具功能性的一段DNA或RNA序列,详细来说,其为DNA或RNA大分子内一段编码基因产物(RNA或蛋白质)的合成的核苷酸序列。
弄清其序列本身的过程叫基因测序。基因的结构由增强子、启动子及蛋白编码序列等组成,即基因产物可以是蛋白质(蛋白质编码基因)及RNA,从而控制生物个体的性状(差异)表现。在一个个体当中所有的基因总和叫基因组。在一个物种中所有等位基因的总合叫基因库。在大多数真核生物中,基因分为细胞核基因及线粒体基因,绿色植物的叶绿体也含有独立于细胞核的叶绿体基因组。人类约有两万至两万五千个基因。
在真核生物中,染色体在体细胞中是成对存在的。每条染色体上都带有一定数量的基因。一个基因在细胞有丝分裂时有两个对列的位点,称为等位基因,分别来自父与母。依所携带性状的表现,又可分为显性基因和隐性基因。
一般来说,同一生物体中的每个细胞体都含有相同的基因(除了已经分化的免疫细胞),但并不是每个细胞中的所有基因携带的遗传信息都会被表现出来。控制基因表达的因素分为传统的遗传学(增强子,启动子序列相关)因素及表观遗传学(DNA甲基化,组蛋白乙酰化和脱乙酰化及RNA干扰相关)因素。职司不同功能的细胞或不同的细胞类型中,活化而表现的基因也不同。在某一细胞类型当中所有被表达的基因叫转录组,所有编码蛋白质的基因叫蛋白质组。通过即时聚合酶链式反应或染色质免疫沉淀-测序可得到转录组及蛋白质组的信息。用电脑处理基因序列的学科叫生物信息学。
人类基因组计划(human genome project, HGP)是一项规模宏大,跨国跨学科的生物信息学项目。其宗旨在于测定组成人类染色体(指单倍体)的30亿个碱基对形成的核苷酸序列,从而绘制人类基因组图谱,并且辨识其载有的基因,达到破译人类遗传信息的最终目的。该计划起始于公元1990年,并于公元2000年完成。
在通常的二倍体的细胞或个体中,能维持配子或配子体正常功能的最低数目的一套染色体称为染色体组或基因组,一个基因组中包含一整套基因。相应的全部细胞质基因构成一个细胞质基因组,其中包括线粒体基因组和叶绿体基因组等。原核生物的基因组是一个单纯的DNA或RNA分子,因此又称为基因带,通常也称为它的染色体。
基因在染色体上的位置称为座位,每个基因都有自己特定的座位。凡是在同源染色体上占据相同座位的基因都称为等位基因。在自然群体中往往有一种占多数的(因此常被视为正常的)等位基因,称为野生型基因;同一座位上的其他等位基因一般都直接或间接地由野生型基因通过突变产生,相对于野生型基因,称它们为突变型基因。在二倍体的细胞或个体内有两个同源染色体,所以每一个座位上有两个等位基因。如果这两个等位基因是相同的,那么就这个基因座位来讲,这种细胞或个体称为纯合体;如果这两个等位基因是不同的,就称为杂合体。在杂合体中,两个不同的等位基因往往只表现一个基因的性状,这个基因称为显性基因,另一个基因则称为隐性基因。在二倍体的生物群体中等位基因往往不止两个,两个以上的等位基因称为复等位基因。不过有一部分早期认为是属于复等位基因的基因,实际上并不是真正的等位,而是在功能上密切相关、在位置上又邻接的几个基因,所以把它们另称为拟等位基因。某些表型效应差异极少的复等位基因的存在很容易被忽视,通过特殊的遗传学分析可以分辨出存在于野生群体中的几个等位基因。这种从性状上难以区分的复等位基因称为同等位基因。许多编码同工酶的基因也是同等位基因。
属于同一染色体的基因构成一个连锁群(见连锁和交换)。基因在染色体上的位置一般并不反映它们在生理功能上的性质和关系,但它们的位置和排列也不完全是随机的。在细菌中编码同一生物合成途径中有关酶的一系列基因常排列在一起,构成一个操纵子(见基因调控);在人、果蝇和小鼠等不同的生物中,也常发现在作用上有关的几个基因排列在一起,构成一个基因复合体或基因簇或者称为一个拟等位基因系列或复合基因。
功能、类别和数目
到目前为止在果蝇中已经发现的基因不下于1000个,在大肠杆菌中已经定位的基因大约也有1000个,由基因决定的性状虽然千差万别,但是许多基因的原初功能却基本相同。
功能
1945年G.W.比德尔通过对脉孢菌的研究,提出了一个基因一种酶假设,认为基因的原初功能都是决定蛋白质的一级结构(即编码组成肽链的氨基酸序列)。这一假设在50年代得到充分的验证。
类别
60年代初F.雅各布和J.莫诺发现了调节基因。把基因区分为结构基因和调节基因是着眼于这些基因所编码的蛋白质的作用:凡是编码酶蛋白、血红蛋白、胶原蛋白或晶体蛋白等蛋白质的基因都称为结构基因;凡是编码阻遏或激活结构基因转录的蛋白质的基因都称为调节基因。但是从基因的原初功能这一角度来看,它们都是编码蛋白质。根据原初功能(即基因的产物)基因可分为:①编码蛋白质的基因。包括编码酶和结构蛋白的结构基因以及编码作用于结构基因的阻遏蛋白或激活蛋白的调节基因。②没有翻译产物的基因。转录成为RNA以后不再翻译成为蛋白质的转移核糖核酸(tRNA)基因和核糖体核酸(rRNA)基因:③不转录的DNA区段。如启动区、操纵基因等等。前者是转录时RNA多聚酶开始和DNA结合的部位;后者是阻遏蛋白或激活蛋白和DNA结合的部位。已经发现在果蝇中有影响发育过程的各种时空关系的突变型,控制时空关系的基因有时序基因、格局基因、选择基因等(见发生遗传学)。
一个生物体内的各个基因的作用时间常不相同,有一部分基因在复制前转录,称为早期基因;有一部分基因在复制后转录,称为晚期基因。一个基因发生突变而使几种看来没有关系的性状同时改变,这个基因就称为多效基因。
数目
不同生物的基因数目有很大差异,已经确知RNA噬菌体MS2只有3个基因,而哺乳动物的每一细胞中至少有100万个基因。但其中极大部分为重复序列,而非重复的序列中,编码肽链的基因估计不超过10万个。除了单纯的重复基因外,还有一些结构和功能都相似的为数众多的基因,它们往往紧密连锁,构成所谓基因复合体或叫做基因家族。
相互作用
生物的一切表型都是蛋白质活性的表现。换句话说,生物的各种性状几乎都是基因相互作用的结果。所谓相互作用,一般都是代谢产物的相互作用,只有少数情况涉及基因直接产物,即蛋白质之间的相互作用。
非等位基因的相互作用
依据非等位基因相互作用的性质可以将它们归纳为:
- 互补基因。若干非等位基因只有同时存在时才出现某一性状,其中任何一个发生突变时都会导致同一突变型性状,这些基因称为互补基因。
- 异位显性基因。影响同一性状的两个非等位基因在一起时,得以表现性状的基因称为异位显性基因或称上位基因。
- 累加基因。对于同一性状的表型来讲,几个非等位基因中的每一个都只有部分的影响,这样的几个基因称为累加基因或多基因。在累加基因中每一个基因只有较小的一部分表型效应,所以又称为微效基因。相对于微效基因来讲,由单个基因决定某一性状的基因称为主效基因。
- 修饰基因。本身具有或者没有任何表型效应,可是和另一突变基因同时存在便会影响另一基因的表现程度的基因。如果本身具有同一表型效应则和累加基因没有区别。
- 抑制基因。一个基因发生突变后使另一突变基因的表型效应消失而恢复野生型表型,称前一基因为后一基因的抑制基因。如果前一基因本身具有表型效应则抑制基因和异位显性基因没有区别。
- 调节基因。一个基因如果对另一个或几个基因具有阻遏作用或激活作用则称该基因为调节基因。调节基因通过对被调节的结构基因转录的控制而发挥作用。具有阻遏作用的调节基因不同于抑制基因,因为抑制基因作用于突变基因而且本身就是突变基因,调节基因则作用于野生型基因而且本身也是野生型基因。
- 微效多基因。影响同一性状的基因为数较多,以致无法在杂交子代中明显地区分它们的类型,这些基因统称为微效多基因或称多基因。
- 背景基因型。从理论上看,任何一个基因的作用都要受到同一细胞中其他基因的影响。除了人们正在研究的少数基因以外,其余的全部基因构成所谓的背景基因型或称残余基因型。
等位基因的相互作用
1932年H.J.马勒依据突变型基因与野生型等位基因的关系归纳为无效基因、亚效基因、超效基因、新效基因和反效基因。
- 无效基因。不能产生野生型表型的、完全失去活性的突变型基因。一般的无效基因却能通过回复突变而成为野生型基因。
- 亚效基因。表型效应在性质上相同于野生型,可是在程度上次于野生型的突变型基因。
- 超效基因。表型效应超过野生型等位基因的突变型基因。
- 新效基因。产生野生型等位基因所没有的新性状的突变型基因。
- 反效基因。作用和野生型等位基因相对抗的突变型基因。
- 镶嵌显性。对于某一性状来讲,一个等位基因影响身体的一个部分,另一等位基因则影响身体的另一部分,而在杂合体中两个部分都受到影响的现象称为镶嵌显性。
基因和环境因素的相互作用
基因作用的表现离不开内在的和外在的环境的影响。在具有特定基因的一群个体中,表现该基因性状的个体的百分数称为外显率;在具有特定基因而又表现该一性状的个体中,对于该一性状的表现程度称为表现度。外显率和表现度都受内在环境和外在环境的影响。
内在环境
指生物的性别、年龄等条件以及背景基因型。
- 性别。性别对于基因作用的影响实际上是性激素对基因作用的影响。性激素为基因所控制,所以实质上这些都是基因相互作用的结果。
- 年龄。人类中各个基因显示它的表型的年龄有很大的区别(表)。
- 背景基因型。通过选择,可以改变动植物品系的某一遗传性状的外显率和表现度,说明一些基因的作用往往受到一系列修饰基因或者背景基因型的影响。
由于背景基因型的差异而造成的影响,在下述3种情况中可以减低到最低限度:由高度近交得来的纯系;一卵双生儿;无性繁殖系(包括某些高等植物的无性繁殖系、微生物的无性繁殖系以及高等动物的细胞株)。用这些体系作为实验系统,可以更为明确地显示环境因素的影响,更为确切地说明某一基因的作用。双生儿法在人类遗传学中的应用及纯系生物在遗传学和许多生物学研究中的应用都是根据这一原理。
外在环境
- 温度。温度敏感突变型只能在某些温度中表现出突变型的性状,对于一般的突变型来说,温度对于基因的作用也有程度不等的影响。
- 营养。家兔脂肪的黄色决定于基因y的纯合状态以及食物中的叶黄素的存在。如果食物中不含有叶黄素,那么yy纯合体的脂肪也并不呈黄色。y基因的作用显然和叶黄素的同化有关。
演化
就细胞中DNA的含量来看,一般愈是低等的生物含量愈低,愈是高等的生物含量愈高。就基因的数量和种类来讲,一般愈是低等的生物愈少,愈是高等的生物愈多。DNA含量和基因数的增加与生理功能的逐渐完备是密切相关的。
基因最初是一个抽象的符号,后来证实它是在染色体上占有一定位置的遗传的功能单位。大肠杆菌乳糖操纵子中的基因的分离和离体条件下转录的实现进一步说明基因是实体。今已可以在试管中对基因进行改造(见重组DNA技术)甚至人工合成基因。对基因的结构、功能、重组、突变以及基因表达的调控和相互作用的研究始终是遗传学研究的中心课题。
历史
早期对于遗传物质的臆测
关于遗传的物质基础,科学家早就有所臆测,但在18世纪之前人们对基因遗传只有非常有限的知识。1830年左右,基因遗传“genetic”这个单词才在英语中出现。当时农业已经非常发达,通过遗传知识对牲畜育种已经开始出现,英国有个叫罗伯特·贝克韦尔绵羊育种专家培育出了一种叫莱斯特绵羊新的品种,莱贾斯特羊比以前的品种生长更快,同时可以产更多的肉。由于科学家很少,人们对遗传的很多知识是来自于牲畜育种。
1864年,英国哲学家赫伯特·史宾赛曾提出“生理单位”说。1868年,达尔文将其称为“微芽”,1884年瑞士植物学家冯内格列称之为“异胞质”,1889年荷兰学者雨果·德弗里斯称为“泛生子”。1883年德国魏斯曼称之为“种质”,并指明生殖细胞中的染色体便是种质,认为种质是遗传的,体质则不遗传,种质影响体质,而体质不影响种质。这在理论上为重新发现和广为人们接受的孟德尔遗传定律铺平了道路。
“基因”概念的提出
遗传学的奠基人奥地利人孟德尔,在布尔诺(今属捷克)的奥古斯丁教派修道院的后院里工作8年,于1865年2月的奥地利自然科学学会会议上报告了自己进行的植物杂交研究结果,第二年在奥地利自然科学学会年刊上发表了著名的《植物杂交试验》论文,阐述了遗传学的两项基本规律——基因的分离定律和基因的自由组合定律。文中指出,生物的所有性状都是通过遗传因子来传递的,遗传因子是一些独立的遗传单位。此理论把可观察的遗传性状和控制它的内在的遗传因子区分开来,遗传因子于是作为基因的雏形名词诞生了。基因的存在最早是由他在19世纪推论出来的,而不具有分子生物学的观察基础。在达尔文发表进化论后不久,孟德尔试图通过对豌豆进行试验来解释该理论。但是直到19世纪末他的研究才被人们所重视。虽然孟德尔还不知道遗传因子是以怎样的方式存在,也不了解它的结构,但确实为现代基因概念的产生奠定了基础。
可以说,遗传因子实际上是孟德尔根据其实验结果所假想的信息载体,从那时起遗传学家便踏上了寻找基因实体的艰难历程。1903年沃尔特·萨顿(Walter Sutton)和鲍维里(Theodor Boveri)两人注意到在杂交试验中遗传因子的行为与减数分裂和受精中染色体的行为非常吻合,他们于是作出“遗传因子位于染色体上”的“萨顿—鲍维里假想”:他们根据各自的研究,认为孟德尔的“遗传因子”与配子形成和受精过程中的染色体的传递行为具有平行性,并提出了遗传的染色体学说,认为孟德尔所假想的遗传因子就位于染色体上,即染色体是遗传物质的载体,第一次把遗传物质和染色体联系起来。这种假想可以圆满地解释孟德尔的两大遗传规律,在日后的科学实验中也得到了证实。1909年丹麦遗传学家威廉·约翰森(1859~1927)在《精密遗传学原理》一书中提出“基因”概念,以此来替代孟德尔假定的“遗传因子”。从此,“基因”一词一直在遗传学中被沿用至今。约翰逊还提出了“基因型”与“表现型”这两个含义不同的术语,初步阐明了基因与性状的关系。不过此时的基因仍然是一个未经观察佐证的,仅靠逻辑推理得出的概念。
基因结构和功能的探索
自1900年孟德尔定律重新发现后,“基因如何控制性状”的问题引起了许多遗传学家的浓厚兴趣。经过他们的努力,又产出了一连串重要成果。
美国实验胚胎学家、遗传学家托马斯·亨特·摩尔根和他的学生们于1908年前后开始利用果蝇作了许多实验。他在1910年通过果蝇眼球颜色突变性状的遗传实验发现了伴性遗传现象,第一次揭示出一种或多种遗传特性与某一特定染色体的明确联系;他和他的同事们进一步透过多次的果蝇杂交实验发现了遗传学的第三个基本规律——连锁互换规律,从而继承并发展了孟德尔的遗传学说。他们为遗传染色体学说提供了更充分、直接、可靠的证据,并认为染色体是盂德尔式遗传性状传递机制的物质基础。1926年托马斯的巨著《基因论》出版,建立了著名的基因学说,他并绘制了果蝇的基因位置图,首次完成当时最新的基因概念的描述,即基因以直线形式排列,它决定着一个对应的性状,而且能发生突变并随着染色体同源节段的互换而交换。
摩尔根等人还认为,基因是遗传的功能单位,它能产生特定的表型效应;基因又是一个独立的结构单位。在同源染色体之间可以发生基因的互换,但交换只能发生在基因之间而不是发生在基因之内;基因可以发生突变,由一个等位形式变为另一等位形式,因而基因又是突变单位。这就是20世纪40年代以前流行的所谓“功能、交换、突变”三位一体的基因概念。这种认识把基因与染色体联系起来,说明了基因的物质性,基因存在的场所及排列方式,基因从此不再是一个抽象的概念。当然这时人们仍然不了解基因的化学本质以及基因是如何控制生物性状的。
从20世纪40年代起,人们开始注意基因与性状的关系,即开始研究基因如何控制性状的问题,1941年,比德尔和塔特姆以红色链抱霉为材料进行生化遗传研究。他们通过诱变获得了多种氨基酸和维生素的营养缺陷突变体。这些突变基因不能产生某种酶,或只产生有缺陷的酶。(例如,有一株突变体不能合成色氨酸是由于它不能产生色氨酸合成酶。)于是,研究者提出了“一个基因一种酶”的假说,认为基因对性状的控制是通过控制酶的合成来实现的。这一假说在20世纪50年代得到充分验证,后来发现有些蛋白质不只由一种肽链组成,如血红蛋白和胰岛素,不同肽链由不同基因编码,因而在1941年比德尔和塔特姆提出一个基因一个酶的理论,证明基因通过它所控制的酶,决定着代谢中的生化反应步骤,进而决定生物性状。又提出了“一个基因一条多肽链”的假设。“一个基因一种酶”和“一个基因一条多肽链”理论的提出,大大促进了分子遗传学的发展,人们迫切期望能厘清基因的化学结构。1949年鲍林与合作者在研究镰刀型细胞贫血症时推论基因决定着多肽链的氨基酸顺序,如此这般,20世纪40年代末至50年代初,基因是通过控制蛋白质的合成以控制代谢,并决定性状的原理,变得清晰起来。
虽然DNA在细胞核中很早就被发现,但证明其为遗传物质的决定性实验是1944年艾弗里的肺炎双球菌转化实验。他和麦卡蒂(Maclyn McCarty)等人发表了关于“转化因子”的重要论文,首次用实验明确证实:DNA是遗传信息的载体。1952年赫希和蔡斯进一步证明遗传物质是DNA而不是蛋白质。
这一实验不仅证明了DNA是遗传物质,揭示了遗传物质的化学本质,也大大推动了对核酸的研究。1953年,美国分子生物学家詹姆斯·沃森和英国物理学家佛朗西斯·克里克根据威尔金斯和富兰克林所进行的X射线衍射分析,提出了著名的DNA双螺旋结构模型,进一步说明基因载体就是DNA。进一步的研究证明,基因就是DNA分子的一个区段。每个基因由成百上千个脱氧核苷酸组成,一个DNA分子可以包含几个乃至几千个基因。基因的化学本质和分子结构的确定具有划时代的意义,它为基因的复制、转录、表达和调控等方面的研究奠定了基础,开创了分子遗传学的新纪元。
基因本质的确定为分子遗传学发展拉开了序幕。1955年,美国分子生物学家本泽对大肠杆菌T4噬菌体作了深入研究,揭示了基因内部的精细结构,提出了基因的顺反子(Cistron)概念。本泽把通过顺反实验而发现的,遗传的功能单位称为顺反子,1个顺反子决定一条多肽链,顺反子即是基因。1个顺反子内存在着很多突变位点——突变子,突变子就是改变后可以产生突变型表现型的最小单位。1个顺反子内部存在着很多重组子。重组子就是不能由重组分开的基本单位。理论上每一核苷酸对的改变,就可导致一个突变的产生,每两个核苷酸对之间都可发生交换。这样看来,一个基因有多少核苷酸对就有多少突变子及重组子,突变子就等于重组子。这个学说打破了过去关于基因是突变、重组、决定遗传性状的“三位一体”概念及基因是最小的不可分割的遗传单位的观点,从而认为基因为DNA分子上一段核苷酸顺序,负责着遗传信息传递,一个基因内部仍可划分出若干个起作用的小单位,即可区分成顺反子、突变子和重组子。一个作用子通常决定一种多肽链合成,一个基因包含一个或几个作用子。突变子指基因内突变的最小单位,而重组子为最小的重组合单位,只包含一对核苷酸。以上这些均是基因概念的伟大突破。
关于基因的本质确定后,人们又把研究视线转移到基因传递遗传信息的过程上。在20世纪50年代初人们已懂得基因与蛋白质间似乎存在着相应的联系,但基因中信息怎样传递到蛋白质上这一基因功能的关键课题在20世纪60年代至20世纪70年代才得以解决。从1961年开始,尼伦伯格和科拉纳等人逐步搞清了基因以核苷酸三联体为一组编码氨基酸,并在1967年破译了全部64个遗传密码,这样把核酸密码和蛋白质合成联系起来。然后,沃森和克里克等人提出的“中心法则”更加明确地揭示了生命活动的基本过程。1970年霍华德·马丁·特明以在劳斯肉瘤病毒内发现逆转录酶这一成就进一步发展和完善了“中心法则”,至此,遗传信息传递的过程已较清晰地展示在人们的眼前。过去人们对基因的功能理解是单一的即作为蛋白质合成的模板。但是1961年法国弗朗索瓦·雅各布和雅克·莫诺的研究成果,又大大扩大了人们关于基因功能的视野。他们在研究大肠杆菌乳糖代谢的调节机制中发现了有些基因不起合成蛋白质模板作用,只起调节或操纵作用,提出了操纵子学说。从此根据基因功能把基因分为结构基因、调节基因和操纵基因。
结构基因和调控基因:根据操纵子学说,并不是所有的基因都能为肽链进行编码。于是便把能为多肽链编码的基因称为结构基因,包括编码结构蛋白和酶蛋白的基因,也包括编码阻遏蛋白或激活蛋白的调节基因。有些基因只能转录而不能转译,如tRNA基因和rRNA基因。还有些DNA区段,其本身并不进行转录,但对其邻近的结构基因的转录起控制作用,被称为启动基因和操纵基因。启动基因、操纵基因与其控制下的一系列结构基因组成一个功能单位叫做操纵子(operon)。就其功能而言,调节基因、操纵基因和启动基因都属于调控基因。这些基因的发现,大大拓宽了人们对基因功能及相互关系的认识。
断裂基因:20世纪70年代中期,法国生物化学家查姆帮(Chamobon)和波盖特(Berget)在研究鸡卵清蛋白基因的表达中发现,细胞内的结构基因并非全部由编码序列组成,而是在编码序列中间插入无编码作用的碱基序列,这类基因被称为间隔或断裂基因。这一发现于1977年被英国的查弗里斯和荷兰的弗兰威尔在研究兔β-球蛋白结构时所证实。1978年,生化学家沃特·吉尔伯特提出基因是一个转录单位的设想,他认为基因是一个DNA序列的嵌合体,同时包含两个区段:一个区段将被表达并存在于成熟的mRNA中,称为“外显子”;一个区段由虽然也同时被表达,但将在成熟mRNA中被删除,称为“内含子”。近年来的研究发现,原核生物的基因序列一般是连续的,在一个基因的内部几乎不含“内含子”,而真核生物中绝大多数基因都是由不连续DNA序列组成的断裂基因。断裂基因的表达过程是:整个基因先由DNA转录成前信使RNA,其中的内含序列会被一种称为“剪接体”的RNA/蛋白质复合物所切除,两端再相互连接成一条连续的核酸顺序,以形成成熟的mRNA。DNA分子断裂基因的存在为基因功能的展现赋予了更大的潜力。
重叠基因:长期以来,人们一直认为在同一段DNA序列内是不可能存在重叠的读码结构的。1978年,弗雷德里克·桑格在研究分析φX174噬菌体的核苷酸序列时,也发现由5375个核苷酸组成的单链DNA所包含的10个基因中有几个基因具有不同程度的重叠,但是这些重叠的基因具有不同的读码框架。以后在噬菌体G4、MS2和SV40中都发现了重叠基因。基因的重叠性使有限的DNA序列包含了更多的遗传信息,是生物对它的遗传物质经济而合理的利用。
假基因(伪基因):1977年,G·Jacp在对非洲爪赡5SrRNA基因簇的研究后提出了假基因的概念,这是一种核苷酸序列同其相应的正常功能基因基本相同,但却不能合成出功能蛋白质的失活基因。假基因的发现是真核生物应用重组DNA技术和序列分析的结果。现已在大多数真核生物中发现了假基因,如Hb的假基因、干扰素、组蛋白、α球蛋白和β球蛋白、肌动蛋白及人的rRNA和tRNA基因均含有假基因。由于假基因不工作或无效工作,故有人认为假基因,相当人的痕迹器官,或作为后补基因。
移动基因:1950年,美国遗传学家麦克林托卡在玉米染色体组中首先发现移动基因。她发现玉米染色体上有一种称为Ds的控制基因会改变位置,同时引起染色体断裂,使其离开或插入部位邻近的基因失活或恢复恬性,从而导致玉米籽粒性状改变。这一研究当时并没有引起重视。20世纪60年代未,英国生物化学家夏皮罗和前西德生物化学家西特尔分别在细菌中发现一类称为插入顺序的可移动位置的遗传因子,20世纪70年代早期又发现细菌质粒的某些抗药性可移动的基因,到20世纪80年代已发现这类基因至少有20种。20世纪90年代之前,科学家终于用实验证明了麦克林托卡的观点,移动基因不仅能在个体的染色体组内移动,并能在个体间甚至种间移动。现已了解到真核细胞中普遍存在移动基因。基因移动性的发现不仅打破了遗传的DNA恒定论,而且对于认识肿瘤基因的形成和表达,以及生物演化中信息量的扩大等研究工作也将提供新的启示和线索。
基因概念的进一步发展
70年代后,基因的概念随着多学科渗透和实验手段日新月异又有突飞猛进的发展,主要有以下几个方面:
- 基因具重叠性。1977年桑格领导的研究小组,根据大量研究事实绘制了共含有5375个核苷酸的ΦX174噬菌体DNA碱基顺序图,第一次揭示了遗传的一种经济而巧妙的编排——B和E基因核苷酸顺序分别与A和D基因的核苷酸顺序的一部分互相重叠。当然它们各有一套读码结构,且基因末端密码也有重叠现象(A基因终止密码子TGA和C基因起始密码子ATG重叠2个核苷酸;D基因的终止密码子TAA与J基因起始密码子ATG互相重叠1个核苷酸,顺序为TAATG)。
- 内含子和外显子。人们在研究小鸡卵清蛋白基因时发现其转录形成的mRNA只有该基因长度的1/4,其原因是基因中一些间隔序列的转录物在RNA成熟过程中被切除了。这些间隔序列叫内含子,基因中另一些被转录形成RNA的序列叫外显子。小鸡的卵清蛋白基因中至少含7个内含子。因而从基因转录效果看,基因由外显子和内含子构成。
- 管家基因和奢侈基因。具有相同遗传信息的同一个体细胞间其所利用的基因并不相同,有的基因活动是维持细胞基本代谢所必须的,而有的基因则在一些分化细胞中活动,这正是细胞分化、生物发育的基础。前者称为管家基因,而后者被称为奢侈基因。
- 基因的游动性。早在20世纪40年代美国遗传学家麦克林托克在玉米研究中发现“转座子”,直至1980年夏皮罗(James A. Shapiro)等人证实了可移位的遗传基因存在,说明某些基因具有游动性。为此,这位“玉米夫人”荣获了1983年度诺贝尔生理学或医学奖。
基因突变
基因突变和许多疾病的发生有涉,如与肿瘤发生有涉的癌基因和肿瘤抑制基因。
从染色体的角度来看有:
- 缺失
- 重复
- 倒位
- 易位
以功能分类 :
- 失去功能的突变
- 次形态突变
- 超形态突变
- 获得功能的突变
以突变原理分类:
- 点突变
- 沉默突变
- 错义突变
- 移码突变
- 无义突变
基因与脱氧核苷酸的牵连
- 基因的基本组成单位是脱氧核苷酸。
- 基因中脱氧核苷酸的排列顺序称为遗传信息。
- 基因中脱氧核苷酸的排列顺序的多样性决定了基因的多样性。
基因与DNA的牵连
- 基因是有遗传效应的DNA片段,每个DNA分子有许多个基因。一个DNA分子上的碱基总数大于该DNA分子上所有基因上的碱基数之和。
- 基因具有遗传效应是指其能控制生物的性状。基因是控制生物性状的结构和功能的基本单位,特定的基因控制特定的性状。
基因与染色体的牵连
- 基因在染色体上呈线性排列。
- 染色体是基因的主要载体,但不是唯一载体,如粒线体,叶绿体中也有少量的DNA,也是基因的载体。
带基因字词语
带基因字成语