Mots-clés : biologiemoléculaire, annexes-2008
Il existe 4 types de nucléotides pour l’ARN mais 20 types d’acides aminés constituent les protéines. Il est donc nécessaire d’utiliser plusieurs nucléotides pour identifier l’acide aminé à utiliser. Un codon est un ensemble de trois nucléotides qui se suivent dans l’ADN ou l’ARN. Le code génétique désigne « le système de correspondance mis en jeu lors de la transformation de l’information génétique des gènes en protéines, au cours du processus de traduction [1] ».
Une série de 3 nucléotides permet 64 possibilités. Il peut donc y avoir plusieurs codons qui correspondent au même acide aminé. Ainsi par exemple la sérine peut être ajoutée dans la protéine à partir des codons « UCU », « UCC », « UCA », « UCG », AGU » et « AGC ». Il existe également trois codons spéciaux qui n’encodent aucun acide aminé mais indiquent au ribosome que la synthèse de la protéine est terminée : « « UAA », « UAG », « UGA ». Enfin le codon « AUG », outre le fait qu’il encode pour la méthionine, sert aussi de signal de départ.
Si il faut 3 nucléotides pour sélectionner un seul acide aminé, il existe un danger de se retrouver décalé de un ou de deux constituant dans la lecture de la chaîne. Pour éviter un décalage dans la lecture de l’ARN, le ribosome cherche la première occurrence « AUG » à partir de l’extrémité 5’ de l’ARN messager [2].
Le « craquage » du code génétique a commencé en 1961 avec les travaux de Marshall Nirenberg et Heinrich Matthaei qui ont découvert la correspondance entre le codon « UUU » et l’acide aminé appelé phénylalanine. Le décodage a été terminé en 1966.
Ce code n’est cependant pas absolument standard. Ainsi par exemple, les mitochondries qui stockent l’énergie dans les cellules disposent de leur propre matériel génétique mais avec quelques modifications dans la correspondance entre les codons et les acides aminés. La GenBank de la National Center for Biotechnology Information spécifie 16 codes génétiques alternatifs en plus du code standard [3].
Notes
[1] Wikipédia : http://fr.wikipedia.org/wiki/Code_g%C3%A9n%C3%A9tique[2] Ainsi la séquence CAUGCAUG… peut être comprise comme CAU GCA UG… ou CA UGC AUG ou encore C AUG CAU G… C’est donc le dernier cas qui sera sélectionné car le codon de démarrage « AUG » y est rencontré en premier dans la lecture de la chaîne.
[3] Selon la dernière mise à jour du 4 décembre 2007. NCBI Taxonomy Browser : http://www.ncbi.nlm.nih.gov/Taxonomy/Utils/wprintgc.cgi?mode=c
