martedì 20 settembre 2011

XV - Il codice genetico


Cerchiamo di capire meglio cosa intendiamo quando diciamo che un gene codifica una proteina ovvero che definisce la sequenza di aminoacidi che compongono la proteina. Vista la diversa natura chimica di DNA e proteine deve esistere un meccanismo che permette di passare dalla (tradurre la) sequenza di lettere/nucleotidi del gene alla sequenza di lettere/aminoacidi di una proteina. Parleremo in seguito della macchina che opera questa traduzione da un linguaggio ad un altro. Quello che per ora è importante tenere a mente sono alcuni concetti formali che vanno al cuore formale del problema: 1) come ripetuto più volte le proteine sono polimeri lineari che vengono sintetizzati dall’estremità amino terminale verso quella carbossi terminale; 2) il DNA è un polimero lineare che viene sintetizzato dall’estremità 5’ verso l’estremità 3’; 3) la sequenza di basi di in un gene è colineare alla sequenza di aminoacidici della proteina ovvero le estremità 5’ e 3’ del gene corrispondono rispettivamente alle estremità amino e carbossi terminali della proteina; infine 4) come nei migliori libri di spionaggio esiste un codice preciso che permette di passare dal (tradurre il) linguaggio a 4 lettere/nucleotidi del DNA a (in) quello a 20 lettere/aminoacidi delle proteine. 
Un po’ come il codice utlizzato dai tedeschi nella II° guerra mondiale per criptare i messaggi segreti. Il codice che permette di tradurre l’informazione contenuta nel DNA in informazione proteica è detto codice genetico ed è stato decifrato più di 50 anni fa con esperimenti che nel 1968 sono valsi il premio Nobel per la Medicina Holley a Nirenberg e Khorana.
Qual è la base del codice genetico? Come si fa a passare da un linguaggio a 4 lettere (i nucleotidi) ad un altro scritto con 20 lettere (gli aminoacidi). E’ evidente che non può esistere una relazione semplice 1 nucleotide = 1 aminoacido. Il problema non si risolve neanche considerando coppie di nucleotidi. Esistono infatti solo 16 coppie differenti di nucleotidi che sono ancora insufficienti per i 20 aminoacidi a meno che non esistano delle ambiguità. Il problema si risolve considerando i nucleotidi a triplette. Con 4 lettere/nucleotidi (A, G, C, T) si possono formare 43 = 64 triplette o codoni differenti. Ogni codone è associato ad un singolo aminoacido. Dato che ci sono 64 codoni e solo 20 aminoacidi, alcuni aminoacidi sono associati a codoni differenti. Si dice che il codice genetico è ”degenerato”. Ma la cosa importante è che ogni volta che c’è un codone questo viene “tradotto” sempre in un solo e specifico aminoacido. C’è anche spazio per alcuni codoni con una funzione di segnali di interpunzione: “AUG” indica inizio lettura e codifica per l’amino acido Metionina presente all’estremità Amino-terminale di tutte le proteine. “UAA”, “UAG” e “UGA” indicano STOP – fine lettura. 
Conoscendo questo codice - una specie di stele di Rosetta – e nota la sequenza di nucleotidi di un gene (ovvero la successione di A, G, C e T) possiamo dedurre la sequenza aminoacidica della proteina codificata. Per far questo sia noi che la cellula utilizziamo una semplice serie di regole: 1) leggiamo la sequenza di DNA fino a che incontriamo il primo AUG (primo codone del gene – occupa le posizioni +1, +2 e +3) e mettiamo il primo aminoacido della proteina che corrisponde a Metionina; 2) ci spostiamo di tre nucleotidi leggiamo il secondo codone (posizione +4, +5 e +6). Utilizziamo la tabella del codice genetico per tradurre mettiamo il secondo aminoacido della proteina. Ad esempio se il secondo codone è CTT metteremo l’aminoacido Leucina; 3) reiteriamo il processo fino a che non incontriamo un codone di STOP. A questo punto la proteina è finita. 

Il codice genetico è la chiave che permette di passare da una sequenza di nucleotidi ad un sequenza di aminoacidi. Nella sequenza di DNA tuttavia non è presente traccia della struttura tridimensionale della proteina. E’ come se la sequenza di DNA fosse l’ombra cinese della proteina tridimensionale ovvero di un oggetto. Il codice genetico, le proprietà chimiche e fisiche degli aminoacidi, le interazioni che gli aminoacidi stabiliscono tra loro e con il solvente (l’acqua) permettono di passare dall’ombra all’oggetto. L’identificazione del codice genetico è stata una scoperta fondamentale che ha permesso di definire con maggior precisione il concetto di gene. Rimane comunque aperto un problema fondamentale: qual è il meccanismo utilizzato dalla cellula per utilizzare codice genetico e tradurre l’informazione di DNA in proteina? Di questo ci occuperemo più avanti quando parleremo del terzo polimero: RNA. 

Nessun commento:

Posta un commento