Cerchiamo di capire meglio cosa intendiamo quando diciamo che un gene
codifica una proteina ovvero che definisce la sequenza di aminoacidi che
compongono la proteina. Vista la diversa natura chimica di DNA e proteine deve
esistere un meccanismo che permette di passare dalla (tradurre la) sequenza di
lettere/nucleotidi del gene alla sequenza di lettere/aminoacidi di una
proteina. Parleremo in seguito della macchina che opera questa traduzione da un
linguaggio ad un altro. Quello che per ora è importante tenere a mente sono
alcuni concetti formali che vanno al cuore formale del problema: 1) come
ripetuto più volte le proteine sono polimeri lineari che vengono sintetizzati
dall’estremità amino terminale verso quella carbossi terminale; 2) il DNA è un
polimero lineare che viene sintetizzato dall’estremità 5’ verso l’estremità 3’;
3) la sequenza di basi di in un gene è colineare alla sequenza di aminoacidici
della proteina ovvero le estremità 5’ e 3’ del gene corrispondono rispettivamente
alle estremità amino e carbossi terminali della proteina; infine 4) come nei
migliori libri di spionaggio esiste un codice preciso che permette di passare
dal (tradurre il) linguaggio a 4 lettere/nucleotidi del DNA a (in) quello a 20
lettere/aminoacidi delle proteine.
Un po’ come il codice utlizzato dai tedeschi
nella II° guerra mondiale per criptare i messaggi segreti. Il codice che
permette di tradurre l’informazione contenuta nel DNA in informazione proteica è
detto codice genetico ed è stato decifrato
più di 50 anni fa con esperimenti che nel 1968 sono valsi il premio Nobel per
la Medicina Holley a Nirenberg e
Khorana.
Qual è la base del codice genetico? Come si fa a passare da un linguaggio
a 4 lettere (i nucleotidi) ad un altro scritto con 20 lettere (gli aminoacidi).
E’ evidente che non può esistere una relazione semplice 1 nucleotide = 1
aminoacido. Il problema non si risolve neanche considerando coppie di
nucleotidi. Esistono infatti solo 16 coppie differenti di nucleotidi che sono
ancora insufficienti per i 20 aminoacidi a meno che non esistano delle
ambiguità. Il problema si risolve considerando i nucleotidi a triplette. Con 4
lettere/nucleotidi (A, G, C, T) si possono formare 43 = 64 triplette
o codoni differenti. Ogni codone è
associato ad un singolo aminoacido. Dato che ci sono 64 codoni e solo 20 aminoacidi,
alcuni aminoacidi sono associati a codoni differenti. Si dice che il codice
genetico è ”degenerato”. Ma la cosa importante è che ogni volta che c’è un
codone questo viene “tradotto” sempre in un solo e specifico aminoacido. C’è
anche spazio per alcuni codoni con una funzione di segnali di interpunzione:
“AUG” indica inizio lettura e codifica per l’amino acido Metionina presente
all’estremità Amino-terminale di tutte le proteine. “UAA”, “UAG” e “UGA”
indicano STOP – fine lettura.
Conoscendo questo codice - una specie di stele di
Rosetta – e nota la sequenza di nucleotidi di un gene (ovvero la successione di
A, G, C e T) possiamo dedurre la
sequenza aminoacidica della proteina codificata. Per far questo sia noi che la
cellula utilizziamo una semplice serie di regole: 1) leggiamo la sequenza di
DNA fino a che incontriamo il primo AUG (primo codone del gene – occupa le
posizioni +1, +2 e +3) e mettiamo il primo aminoacido della proteina che
corrisponde a Metionina; 2) ci spostiamo di tre nucleotidi leggiamo il secondo
codone (posizione +4, +5 e +6). Utilizziamo la tabella del codice genetico per
tradurre mettiamo il secondo aminoacido della proteina. Ad esempio se il
secondo codone è CTT metteremo l’aminoacido Leucina; 3) reiteriamo il processo
fino a che non incontriamo un codone di STOP. A questo punto la proteina è
finita.
Il codice genetico è la chiave che permette di passare da una sequenza
di nucleotidi ad un sequenza di aminoacidi. Nella sequenza di DNA tuttavia non
è presente traccia della struttura tridimensionale della proteina. E’ come se
la sequenza di DNA fosse l’ombra cinese della proteina tridimensionale ovvero
di un oggetto. Il codice genetico, le proprietà chimiche e fisiche degli
aminoacidi, le interazioni che gli aminoacidi stabiliscono tra loro e con il
solvente (l’acqua) permettono di passare dall’ombra all’oggetto.
L’identificazione del codice genetico è stata una scoperta fondamentale che ha
permesso di definire con maggior precisione il concetto di gene. Rimane
comunque aperto un problema fondamentale: qual è il meccanismo utilizzato dalla
cellula per utilizzare codice genetico e tradurre l’informazione di DNA in
proteina? Di questo ci occuperemo più avanti quando parleremo del terzo
polimero: RNA.
Nessun commento:
Posta un commento