遗传密码
A+医学百科 >> 遗传密码 |
英文名:codon
遗传密码又称密码子、遗传密码子、三联体密码。指信使RNA(mRNA)分子上从5'端到3'端方向,由起始密码子AUG开始,每三个核苷酸组成的三联体。它决定肽链上某一个氨基酸或蛋白质合成的起始、终止信号。
遗传密码是一组规则,将DNA或RNA序列以三个核苷酸为一组的密码子转译为蛋白质的氨基酸序列,以用于蛋白质合成。几乎所有的生物都使用同样的遗传密码,称为标准遗传密码;即使是非细胞结构的病毒,它们也是使用标准遗传密码。但是也有少数生物使用一些稍微不同的遗传密码。
目录 |
遗传密码-特点
1.连续性。mRNA的读码方向从5'端至3'端方向,两个密码子之间无任何核苷酸隔开。mRNA链上碱基的插入、缺失和重叠,均造成框移突变。
2.简并性。指一个氨基酸具有两个或两个以上的密码子。密码子的第三位碱基改变往往不影响氨基酸翻译。
3.摆动性。mRNA上的密码子与转移RNA(tRNA)J上的反密码子配对辨认时,大多数情况遵守碱基互补配对原则,但也可出现不严格配对,尤其是密码子的第三位碱基与反密码子的第一位碱基配对时常出现不严格碱基互补,这种现象称为摆动配对。
4.通用性。蛋白质生物合成的整套密码,从原核生物到人类都通用。但已发现少数例外,如动物细胞的线粒体、植物细胞的叶绿体。
遗传密码-破解历史
遗传密码的发现是20世纪50年代的一项奇妙想象和严密论证的伟大结晶。mRNA由四种含有不同碱基腺嘌呤[简称A]、尿嘧啶(简称U)、胞嘧啶(简称C)、鸟嘌呤(简称G)的核苷酸组成。最初科学家猜想,一个碱基决定一种氨基酸,那就只能决定四种氨基酸,显然不够决定生物体内的二十种氨基酸。那么二个碱基结合在一起,决定一个氨基酸,就可决定十六种氨基酸,显然还是不够。如果三个碱基组合在一起决定一个氨基酸,则有六十四种组合方式,看来三个碱基的三联体就可以满足二十种氨基酸的表示了,而且还有富余。猜想毕竟是猜想,还要严密论证才行。
自从发现了DNA的结构,科学家便开始致力研究有关制造蛋白质的秘密。伽莫夫指出需要以三个核酸一组才能为20个氨基酸编码。1961年,美国国家卫生院的Matthaei与马歇尔.沃伦.尼伦伯格在无细胞系统(Cell-free system)环境下,把一条只由尿嘧啶(U)组成的RNA转释成一条只有苯丙氨酸(Phe)的多肽,由此破解了首个密码子(UUU -> Phe)。随后哈尔.葛宾.科拉纳破解了其它密码子,接着罗伯特.W.霍利发现了负责转录过程的tRNA。1968年,科拉纳、霍利和尼伦伯格分享了诺贝尔生理学或医学奖。
1 、阅读方式
破译遗传密码,必须了解阅读密码的方式。遗传密码的阅读,可能有两种方式:一种是重叠阅读,一种是非重叠阅读。例如mRNA上的碱基排列是AUGCUACCG。若非重叠阅读为AUG、CUA、CCG、;若重叠阅读为AUG、UGC、GCU、CUA、UAC、ACC、CCG 。两种不同的阅读方式,会产生不同的氨基酸排列。克里克用T噬菌体为实验材料,研究基因的碱基增加或减少对其编码的蛋白质会有什么影响。克里克发现,在编码区增加或删除一个碱基,便无法产生正常功能的蛋白质;增加或删除两个碱基,也无法产生正常功能的蛋白质。但是当增加或删除三个碱基时,却合成了具有正常功能的蛋白质。这样克里克通过实验证明了遗传密码中三个碱基编码一个氨基酸,阅读密码的方式是从一个固定的起点开始,以非重叠的方式进行,编码之间没有分隔符。
2 、验证猜想
1959年联体密码的猜想终于被尼伦伯格(Nirenberg Marshall Warren)等人用体外无细胞体系的实验证实。尼伦伯格等人的实验用人工制成的只含一种核苷酸的mRNA作模板,给以适当的条件:提供核糖体、ATP、全套必要的酶系统和二十种氨基酸作为原料,接着观察这已知的核苷酸组成的mRNA翻译出的多肽链。结果发现形成一条多个氨基酸组成的肽链。从而表明mRNA上的碱基决定氨基酸。此外实验同时也证明了mRNA上的密码是奇数的三联体,因为只有奇数的三联体才能形成交互的二个密码。
3、 破译方法
尼伦伯格等发现由三个核苷酸构成的微mRNA能促进相应的氨基酸-tRNA和核糖体结合。但微mRNA不能合成多肽,因此不一定可靠。科兰纳(Khorana,Har Gobind)用已知组成的两个、三个或四个组的核苷酸顺序人工合成mRNA,在细胞外的转译系统中加入放射性标记的氨基酸,然后分析合成的多肽中氨基酸的组成。
通过比较,找出实验中三联码相同的部分,再找出多肽中相同的氨基酸,于是可确定该三联码就为该氨基酸的遗传密码。科兰纳用此方法破译了全部遗传密码,从而和尼伦伯格分别获得1968年诺贝尔奖金。
后来,尼伦伯格等用多种不同的人工mRNA进行实验,观察所得多肽链上的氨基酸的类别,再用统计方法推算出人工mRNA中三联体密码出现的频率,分析与合成蛋白中各种氨基酸的频率之间的相关性,以此方法也能找出20种氨基酸的全部遗传密码。最后,科学家们还用了由3个核苷酸组成的各种多核苷链来检查相应的氨基酸,进一步证实了全部密码子。
遗传密码-历史起源
除了少数的不同之外,地球上已知生物的遗传密码均非常接近;因此根据演化论,遗传密码应在生命历史中很早期就出现。现有的证据表明遗传密码的设定并非是随机的结果,对此有以下的可能解释:
最近一项研究显示,一些氨基酸与它们相对应的密码子有选择性的化学结合力,这显示现在复杂的蛋白质制造过程可能并非一早存在,最初的蛋白质可能是直接在核酸上形成。
原始的遗传密码可能比今天简单得多,随着生命演化制造出新的氨基酸再被利用而令遗传密码变得复杂。虽然不少证据证明这观点3,但详细的演化过程仍在探索之中。
经过自然选择,现时的遗传密码减低了突变造成的不良影响。
遗传密码-密码子表
此表列出了64种密码子以及氨基酸的标准配对。
- | - | 第二位碱基 | 第二位碱基 | 第二位碱基 | 第二位碱基 |
- | - | U | C | A | G |
第
一 位 碱 基 |
U | UUU (Phe/F)苯丙氨酸
UUC (Phe/F)苯丙氨酸 UUA (Leu/L)亮氨酸 UUG (Leu/L)亮氨酸 |
UCU (Ser/S)丝氨酸
UCC (Ser/S)丝氨酸 UCA (Ser/S)丝氨酸 UCG (Ser/S)丝氨酸 |
UAU (Tyr/Y)酪氨酸
UAC (Tyr/Y)酪氨酸 UAA (终止) UAG (终止) |
UGU (Cys/C)半胱氨酸
UGC (Cys/C)半胱氨酸 UGA (终止) UGG (Trp/W)色氨酸 |
第
一 位 碱 基 |
C | CUU (Leu/L)亮氨酸
CUC (Leu/L)亮氨酸 CUA (Leu/L)亮氨酸 CUG (Leu/L)亮氨酸 |
CCU (Pro/P)脯氨酸
CCC (Pro/P)脯氨酸 CCA (Pro/P)脯氨酸 CCG (Pro/P)脯氨酸 |
CAU (His/H)组氨酸
CAC (His/H)组氨酸 CAA (Gln/Q)谷氨酰胺 CAG (Gln/Q)谷氨酰胺 |
CGU (Arg/R)精氨酸
CGC (Arg/R)精氨酸 CGA (Arg/R)精氨酸 CGG (Arg/R)精氨酸 |
第
一 位 碱 基 |
A | AUU (Ile/I)异亮氨酸
AUC (Ile/I)异亮氨酸 AUA (Ile/I)异亮氨酸 AUG (Met/M)甲硫氨酸(起始) |
ACU (Thr/T)苏氨酸
ACC (Thr/T)苏氨酸 ACA (Thr/T)苏氨酸 ACG (Thr/T)苏氨酸 |
AAU (Asn/N)天冬酰胺
AAC (Asn/N)天冬酰胺 AAA (Lys/K)赖氨酸 AAG (Lys/K)赖氨酸 |
AGU (Ser/S)丝氨酸
AGC (Ser/S)丝氨酸 AGA (Arg/R)精氨酸 AGG (Arg/R)精氨酸 |
第
一 位 碱 基 |
G | GUU (Val/V)缬氨酸
GUC (Val/V)缬氨酸 GUA (Val/V)缬氨酸 GUG (Val/V)缬氨酸 |
GCU (Ala/A)丙氨酸
GCC (Ala/A)丙氨酸 GCA (Ala/A)丙氨酸 GCG (Ala/A)丙氨酸 |
GAU (Asp/D)天冬氨酸
GAC (Asp/D)天冬氨酸 GAA (Glu/E)谷氨酸 GAG (Glu/E)谷氨酸 |
GGU (Gly/G)甘氨酸
GGC (Gly/G)甘氨酸 GGA (Gly/G)甘氨酸 GGG (Gly/G)甘氨酸 |
注:(起始)标准起始编码,同时为甲硫氨酸编码。mRNA中第一个AUG就是蛋白质翻译的起始部位。
遗传密码-逆密码子表
此表列出了和20种氨基酸和密码子的标准配对。
Ala | A | GCU, GCC, GCA, GCG | Leu | L | UUA, UUG, CUU, CUC, CUA, CUG |
Arg | R | CGU, CGC, CGA, CGG, AGA, AGG | Lys | K | AAA, AAG |
Asn | N | AAU, AAC | Met | M | AUG |
Asp | D | GAU, GAC | Phe | F | UUU, UUC |
Cys | C | UGU, UGC | Pro | P | CCU, CCC, CCA, CCG |
Gln | Q | CAA, CAG | Ser | S | UCU, UCC, UCA, UCG, AGU, AGC |
Glu | E | GAA, GAG | Thr | T | ACU, ACC, ACA, ACG |
Gly | G | GGU, GGC, GGA, GGG | Trp | W | UGG |
His | H | CAU, CAC | Tyr | Y | UAU, UAC |
Ile | I | AUU, AUC, AUA | Val | V | GUU, GUC, GUA, GUG |
起始 | AUG | 终止 | UAG, UGA, UAA |
遗传密码-技术细节
1、起始和终止密码子
蛋白质的转译从初始化密码子(起始密码子)开始,但亦需要适当的初始化序列和起始因子才能使mRNA和核糖体结合。最常见的起始密码子为AUG,其同时编码的氨基酸在细菌为甲酰甲硫氨酸,在真核生物为甲硫氨酸,但在个别情况其它一些密码子也具有起始的功能。 在经典遗传学中,终止密码子各有名称:UAG为琥珀(amber),UGA为蛋白石(opal),UAA为赭石(ochre)。这些名称来源于最初发现到这些终止密码子的基因的名称。终止密码子使核糖体和释放因子结合,使多肽从核糖体分离而结束转译的程序。另外,在哺乳动物的线粒体中,AGA和AGG也充当终止密码子。
2、简并性
大部分密码子具有简并性,即两个或者多个密码子编码同一氨基酸。简并的密码子通常只有第三位碱基不同,例如,GAA和GAG都编码谷氨酰胺。如果不管密码子的第三位为哪种核苷酸,都编码同一种氨基酸,则称之为四重简并;如果第三位有四种可能的核苷酸之中的两种,而且编码同一种氨基酸,则称之为二重简并,一般第三位上两种等价的核苷酸同为嘌呤(A/G)或者嘧啶(C/T)。只有两种氨基酸仅由一个密码子编码,一个是甲硫氨酸,由AUG编码,同时也是起始密码子;另一个是色氨酸,由UGG编码。 遗传密码的这些性质可使基因更加耐受点突变。例如,四重简并密码子可以容忍密码子第三位的任何变异;二重简并密码子使三分可能的第三位的变异不影响蛋白质序列。由于转换变异(嘌呤变为嘌呤或者嘧啶变为嘧啶)比颠换变异(嘌呤变为嘧啶或者嘧啶变为嘌呤)的可能性更大,因此二重简并密码子也具有很强的对抗突变的能力。不影响氨基酸序列的突变称为沉默突变。
简并性的出现是由于tRNA反密码子的第一位碱基可以和mRNA构成摆动碱基对,常见的情况为反密码子上的次黄嘌呤(I),以及和密码子形成非标准的U-G配对。
另一种有助对抗点突变的情况,是NUN (N代表任何核苷酸) 倾向于代表疏水性氨基酸,故此即使出现突变,仍有较大机会维持蛋白质的亲水度,减低致命破坏的可能。
3、阅读框
“密码子”是由阅读的起始位点决定的。例如,一段序列GGGAAACCC,如果由第一个位置开始读,包括3个密码子GGG,AAA和CCC。如果从第二位开始读,包括GGA和AAC(忽略不完整的密码子)。如果从第三位开始读,则为GAA和ACC。故此每段序列都可以分为三个阅读框,每个都能产生不同的氨基酸序列(在上例中,相应为Gly-Lys-Pro,Gly-Asp,和Glu-Thr)。而因为DNA的双螺旋结构,每段DNA实际上有六个阅读框。 实际的框架是由起始密码子确定,通常是mRNA序列上第一个出现的AUG。 破坏阅读框架的变异(例如,插入或删除1个或2个核苷酸)称为阅读框变异,通常会严重影响到蛋白质的功能,故此并不常见,因为他们通常不能在演化中存活下来。
4、非标准的遗传密码
虽然遗传密码在不同生命之间有很强的一致性,但亦存在非标准的遗传密码。在有“细胞能量工厂”之称的线粒体中,便有和标准遗传密码数个相异的之处,甚至不同生物的线粒体有不同的遗传密码。支原体会把UGA转译为色氨酸。纤毛虫则把UAG(有时候还有UAA)转译为谷氨酰胺(一些绿藻也有同样现象),或把UGA转译为半胱氨酸。一些酵母会把GUG转译为丝氨酸。在一些罕见情况,一些蛋白质会有AUG以外的起始密码子。 真菌、原生生物和人以及其它动物的粒线体中的遗传密码与标准遗传密码的差异,主要变化如下:
密码子 | 通常的作用 | 例外的作用 | 所属的生物 |
UGA | 中止编码 | 色氨酸编码 | 人、牛、酵母线粒体,支原体(Mycoplasma)基因组,如Capricolum |
UGA | 中止编码 | 半胱氨酸编码 | 一些纤毛虫(ciliate)细胞核基因组,如游纤虫属(Euplotes) |
AGR | 精氨酸编码 | 中止编码 | 大部分动物线粒体,脊椎动物线粒体 |
AGA | 精氨酸编码 | 丝氨酸编码 | 果蝇线粒体 |
AUA | 异亮氨酸编码 | 蛋氨酸编码 | 一些动物和酵母线粒体 |
UAA | 中止编码 | 谷氨酰胺编码 | 草履虫、一些纤毛虫(ciliate)细胞核基因组,如嗜热四膜虫(ThermophAilus tetrahymena) |
UAG | 中止编码 | 谷氨酸编码 | 草履虫核细胞核基因组 |
GUG | 缬氨酸编码 | 丝氨酸编码 | 假丝酵母核基因组 |
AAA | 赖氨酸编码 | 天冬氨酸编码 | 一些动物的线粒体,果蝇线粒体 |
CUG | 亮氨酸编码 | 中止编码 | 圆柱念珠菌(Candida cylindracea)细胞核基因组 |
CUN | 亮氨酸编码 | 苏氨酸编码 | 酵母线粒体 |
按信使RNA的序列,在一些蛋白质里停止密码子会被翻译成非标准的氨基酸,例如UGA转译为硒半胱氨酸和UAG转译为吡咯赖氨酸,随着对基因组序列加深了解,科学家可能还会发现其它非标准的转译方式,以及其它未知氨基酸在生物中的应用。
遗传密码-基因组的表达
一个生物体携带的遗传信息-即基因组-被记录在DNA或RNA分子中,分子中每个有功能的单位被称作基因。每个基因均是由一连串单核苷酸组成。每个单核苷酸均由碱基,戊糖(即五碳糖,DNA中为脱氧核糖,RNA中为核糖)和磷酸三部分组成。碱基不同构成了不同的单核苷酸。组成DNA的碱基有腺嘌呤(A),鸟嘌呤(G),胞嘧啶(C)及胸腺嘧啶(T)。组成RNA的碱基以尿嘧啶(U)代替了胸腺嘧啶(T)。三个单核苷酸形成一组密码子,而每个密码子代表一个氨基酸或停止讯号。
制造蛋白质的过程中,基因先被从DNA转录为对应的RNA模板,即信使RNA(mRNA)。接下来在核糖体和转移RNA(tRNA)以及一些酶的作用下,由该RNA模板转译成为氨基酸组成的链(多肽),然后经过转译后修饰形成蛋白质。详情参阅转译。
因为密码子由三个核苷酸组成,故一共有43=64种密码子。例如,RNA序列UAGCAAUCC包含了三个密码子:UAG,CAA和UCC。这段RNA编码了代表了长度为3个氨基酸的一段蛋白质序列。(DNA也有类似的序列,但是以T代替了U)。
|
|
关于“遗传密码”的留言: | 订阅讨论RSS |
目前暂无留言 | |
添加留言 |