Cerchiamo di capire meglio cosa intendiamo quando diciamo che un gene
codifica una proteina ovvero che definisce la sequenza di aminoacidi che
compongono la proteina. Vista la diversa natura chimica di DNA e proteine deve
esistere un meccanismo che permette di passare dalla (tradurre la) sequenza di
lettere/nucleotidi del gene alla sequenza di lettere/aminoacidi di una
proteina. Parleremo in seguito della macchina che opera questa traduzione da un
linguaggio ad un altro. Quello che per ora è importante tenere a mente sono
alcuni concetti formali che vanno al cuore formale del problema: 1) come
ripetuto più volte le proteine sono polimeri lineari che vengono sintetizzati
dall’estremità amino terminale verso quella carbossi terminale; 2) il DNA è un
polimero lineare che viene sintetizzato dall’estremità 5’ verso l’estremità 3’;
3) la sequenza di basi di in un gene è colineare alla sequenza di aminoacidici
della proteina ovvero le estremità 5’ e 3’ del gene corrispondono rispettivamente
alle estremità amino e carbossi terminali della proteina; infine 4) come nei
migliori libri di spionaggio esiste un codice preciso che permette di passare
dal (tradurre il) linguaggio a 4 lettere/nucleotidi del DNA a (in) quello a 20
lettere/aminoacidi delle proteine.
Un po’ come il codice utlizzato dai tedeschi
nella II° guerra mondiale per criptare i messaggi segreti. Il codice che
permette di tradurre l’informazione contenuta nel DNA in informazione proteica è
detto codice genetico ed è stato decifrato
più di 50 anni fa con esperimenti che nel 1968 sono valsi il premio Nobel per
la Medicina Holley a Nirenberg e
Khorana.
Qual è la base del codice genetico? Come si fa a passare da un linguaggio
a 4 lettere (i nucleotidi) ad un altro scritto con 20 lettere (gli aminoacidi).
E’ evidente che non può esistere una relazione semplice 1 nucleotide = 1
aminoacido. Il problema non si risolve neanche considerando coppie di
nucleotidi. Esistono infatti solo 16 coppie differenti di nucleotidi che sono
ancora insufficienti per i 20 aminoacidi a meno che non esistano delle
ambiguità. Il problema si risolve considerando i nucleotidi a triplette. Con 4
lettere/nucleotidi (A, G, C, T) si possono formare 43 = 64 triplette
o codoni differenti. Ogni codone è
associato ad un singolo aminoacido. Dato che ci sono 64 codoni e solo 20 aminoacidi,
alcuni aminoacidi sono associati a codoni differenti. Si dice che il codice
genetico è ”degenerato”. Ma la cosa importante è che ogni volta che c’è un
codone questo viene “tradotto” sempre in un solo e specifico aminoacido. C’è
anche spazio per alcuni codoni con una funzione di segnali di interpunzione:
“AUG” indica inizio lettura e codifica per l’amino acido Metionina presente
all’estremità Amino-terminale di tutte le proteine. “UAA”, “UAG” e “UGA”
indicano STOP – fine lettura.
Conoscendo questo codice - una specie di stele di
Rosetta – e nota la sequenza di nucleotidi di un gene (ovvero la successione di
A, G, C e T) possiamo dedurre la
sequenza aminoacidica della proteina codificata. Per far questo sia noi che la
cellula utilizziamo una semplice serie di regole: 1) leggiamo la sequenza di
DNA fino a che incontriamo il primo AUG (primo codone del gene – occupa le
posizioni +1, +2 e +3) e mettiamo il primo aminoacido della proteina che
corrisponde a Metionina; 2) ci spostiamo di tre nucleotidi leggiamo il secondo
codone (posizione +4, +5 e +6). Utilizziamo la tabella del codice genetico per
tradurre mettiamo il secondo aminoacido della proteina. Ad esempio se il
secondo codone è CTT metteremo l’aminoacido Leucina; 3) reiteriamo il processo
fino a che non incontriamo un codone di STOP. A questo punto la proteina è
finita.


Nessun commento:
Posta un commento