lunedì 26 settembre 2011

XVIII - La replicazione del DNA. I parte: il lavoro dell'amanuense


Il DNA contiene l’informazione necessaria per la sintesi di tutte le proteine della cellula. È necessario perciò che ad ogni divisione cellulare, ognuna delle due cellule figlie che si originano da una cellula madre (in laboratorio questo avviene ogni 24 ore circa) erediti l’intera informazione genetica in modo corretto. Se una cellula non eredita tutti i geni o se alcuni geni vengono duplicati o mutati, l’effetto potrebbe essere disastroso. Questo richiede che ad un certo momento della vita della cellula il DNA venga duplicato attraverso un processo biochimico complesso chiamato “replicazione del DNA”. 


Entrare nella descizione degli aspetti biochimici della replicazione del DNA, o discutere i meccanismi complessi che regolano questo evento renderebbe la cosa molto complicata. Voglio cercare solo di farvi intuire in che modo la struttura stessa del DNA sia importante per la replicazione del DNA e conseguentemente dell’informazione genica. Per gli amanti dei computer si può paragonare questo processo alla duplicazione dell’informazione digitale contenuta su un CD.






E’ utile questo punto rivedere il modello della cerniera. Infatti, grazie alla complementarietà dei due filamenti, è molto facile dal punto di vista logico immaginare come duplicare il DNA: basta separare i due filamenti (denaturare la doppia elica) e utilizzare ogni filamento come stampo per costruirne uno complementare secondo le regole di appaiamento delle basi.  Ritorniamo al nostro esempio utilizzando un codice colore per distinguere meglio i due filamenti:

Filamento Watson 5’- ATCGTAAGCT -3’
Filamento Crick    3’- TAGCATTCGA -5’

Denaturiamo la doppia elica e otteniamo due molecole a singolo filamento

Filamento Watson 5’- ATCGTAAGCT -3’

Filamento Crick 3’- TAGCATTCGA -5’

Utilizzando la regola della complementarietà e affacciamo ad ogni A una T ed ad ogni G una C. In questo modo otteniamo due doppie eliche di DNA identiche a quella originale.

Filamento Watson parentale   5’- ATCGTAAGCT -3’
Filamento Crick nuovo            3’- TAGCATTCGA -5’

Filamento Watson nuovo    5’- ATCGTAAGCT -3’
Filamento Crick parentale  3’- TAGCATTCGA -5’

Non potremmo fare nulla di simile con le proteine. Non possiamo utilizzare una proteina come stampo per farne una copia. Proprio per questa differenza il DNA (e non la proteina) è la molecola ideale per conservare l’informazione genica.

La replicazione del DNA prevede la denaturazione transiente solo di brevi tratti di DNA. Questo perché le molecole di DNA a singolo filamento sono molto più sensibili a rotture, il che aumenterebbe il tasso di mutazione dei geni a livelli incompatibili con la vita.
La strategia utilizzata prevede che la denaturazione e la replicazione avvengano quasi contestualmente all’interno di grossi macchinari formati da numerose proteine tra le quali le DNA polimerasi, ovvero gli  enzimi  che sintetizzano i nuovi filamenti di DNA. Con il termine enzimi si chiamano le  proteine che fanno delle reazioni chimiche o che permettono il verificarsi di reazioni chimiche che altrimenti non si realizzerebbero nella cellula.

La “replicazione del DNA” è una reazione estremamente complessa e fedele (non fa errori) che coinvolge centinaia di proteine differenti ed una serie di meccanismi di controllo. Pensate ad un amanuense che deve copiare un libro sacro, ad esempio la Bibbia. Immaginate quale problema interpretativo potrebbe nascere se Lui introducesse degli errori! La cellula spende molta energia per mantenere il più stabile possibile la sequenza di DNA ed evitare che vengano introdotte sostituzioni di che alterino il messaggio o che si rompa la molecola. Da un punto di vista energetico, questo processo costa moltissimo alla cellula: è il prezzo che si deve pagare per mantenere intatta l’informazione genetica. 

XVII - Il senso della vita e la sua regolazione


Il DNA è la banca in cui è depositata l’informazione necessaria per codificare tutte le proteine. Questo è un po’ quello che tutti ci sentiamo ripetere quotidianamente e che è alla base di un’espressione ormai comune: “E’ scritto nel suo DNA”. Tuttavia non tutti pensano al fatto (e vale la pena sottolinearlo) che il significato del DNA viene appunto dalle proteine. Sono le proteine che si prendono cura del DNA mantenendone l’integrità e duplicandolo fedelmente. E sono le proteine che riconoscono specifiche sequenze di DNA definendo cosi i promotori dei geni. Ad esempio una proteina potrebbe legarsi al DNA ogni qual volta esiste la sequenza GATCGATC. Un’altra potrebbe riconoscere e legare le sequenze TATA. Il legame di queste proteine definisce le regioni che agiscono da promotore e in questo modo identificano la regione di DNA che corrisponde ad un gene.
1-    Niente proteine niente geni. Il DNA contiene l’informazione per codificare le proteine e le proteine danno un significato al DNA. Se il cerchio si rompe non c’è modo per ricostruirlo. Prendete una molecola di DNA nuda. Non sarà mai in grado di produrre nulla. E lo stesso vale per le proteine. Una proteina pura potrà fare una certa attività per cui è stata costruita. Ma nient’altro. Questo solleva un problema filosofico: in che modo il cerchio DNA-Proteina-DNA si è stabilito? Vedremo che la terza molecola di cui ci occuperemo – RNA – ci aiuterà a dare una risposta. Rimane comunque difficile capire in che modo la complessità della vita come la vediamo oggi abbia potuto evolvere. 

   2- Circuiti. Per identificare un gene c’è bisogno di una proteina che leghi il promotore. In realtà ci sono più proteine che contemporaneamente legano e attivano un promotore ma per semplicità facciamo finta che si possa lavorare con una sola proteina per promotore. Se ogni promotore venisse riconosciuto da una proteina differente non sarebbe possibile avere ottenere nulla di utile per la cellula. Facciamo un esempio molto semplice. La proteina A riconosce il promotore del gene B. E’ ovvio che ci vuole un gene A per codificare la proteina A. Ma il gene A per essere attivo ha bisogno di una proteina che riconosca il suo promotore. Ad esempio la proteina B. Potremmo introdurre una serie di geni e proteine intermedi ma vista la premessa (ogni promotore viene legato da una proteina differente) questo sarebbe solo e semplicemente un cerchio che non produce niente. 

   Ovviamente la cosa funziona in modo differente. La proteina A, infatti può riconosce molti promotori ognuno a monte di un gene differente (nella figura gene C, gene D, gene E, gene F). Generalmente questi geni codificano proteine con funzione correlata, ad esempio le proteine necessarie per digerire un certo zucchero. La proteina B che controlla il gene A poi viene regolata da un sistema differente. In questo modo possiamo integrare una serie di circuiti in un unico sistema. La cosa è ovviamente molto più complicata di così e avremmo modo di discuterla in modo più approfondito. Però a questo punto penso sia importante utilizzare questo semplice modello per iniziare a visualizzare la complessità del problema.

3-    Regolazione. Se in una cellula manca la proteina che riconosce un certo promotore il gene non viene visto e risulta inattivo. Questo è il meccanismo tramite il quale si può regolare l’espressione dei geni in modo differente a seconda delle condizioni di crescita. E’ infatti evidente che risulterebbe uno spreco incredibile se non dannoso esprimere sempre tutti i geni. Prendiamo un batterio che cresce in un terreno ricco di glucosio (uno zucchero). Sarebbe inutile tenere attivi i geni che digeriscono il lattosio (un altro zucchero) se questo non è presente. Fare proteine, infatti, costa molta energia. Meglio farle quando c’è bisogno. Prendiamo un sistema più complesso: l’uomo. Noi siamo fatti da 1013 cellule. Alcune compongono i muscoli, altri il sistema nervoso altre la pelle e così via. E’ ovvio che far esprimere le proteine del muscolo anche alle cellule nervose e viceversa sarebbe non solo inutile ma dannoso. Così la proteina che regola i geni che codificano le proteine delle cellule nervose è presente solo nelle cellule nervose e non in quelle muscolari. 

sabato 24 settembre 2011

XVI - Identificare un gene sul DNA


Adesso che sappiamo che cosa è un gene ci si pone un altro problema. Come facciamo a trovarlo? La molecola di DNA presente in un cromosoma è estremamente lunga e contiene numerosi geni. Immaginate il cromosoma di un batterio contenente una molecola di DNA di 2 milioni di nucleotidi e provate ad identificare un singolo gene lungo 1000 nucleotidi (che codifica per una proteina di 330 aminoacidi). In assenza di segnali specifici la cosa è praticamente impossibile anche perché voi non conoscete la sequenza del gene. Inoltre non vi sarà sfuggito che la molecola di DNA è costituita da due filamenti e la sequenza che viene tradotta in proteina può essere presente sul filamento Watson oppure su quello Crick. E’ un po’ come se entraste in nella biblioteca nazionale di Parigi e doveste da soli trovare uno dei 13 milioni di libri. Se non avete delle indicazioni circa la posizione del libro potete passare tutta la vostra vita nell’interno della biblioteca. Questo per dire che il macchinario deputato alla sintesi delle proteine deve operare delle operazioni complesse per identificare e leggere le informazioni contenute nei geni: 
1-    capire se un gene è presente sul filamento Watson o su quello Crick.
2-    Riconoscere il codone di Inizio. Ci sono molti AUG presenti sulla sequenza di DNA, in media un AUG ogni 64 nucleotidi. Ovviamente solo alcuni sono codoni di inizio. Il problema è capire quali. Questo è possibile grazie a particolari sequenze di DNA immediatamente a monte (al 5’) del frammento che codifica la proteina. Queste sequenze (veri e propri puntatori che come delle bandiere marcano la posizione del gene sul DNA) vengono chiamate (per motivi che vedremo in seguito) Promotore.
3-    Riconoscere il codone di Stop. Ci sono numerosi codoni di STOP in un gene ma quelli che vengono riconosciuti come tali sono solo quelli che hanno lo stesso ordine di lettura (reading frame) dei codoni codificanti. Voglio fare un esempio per cercare di chiarire questo punto. Prendiamo la parola FINE e diciamo che questa segni il punto in cui bisogna smettere di leggere. Semplice no? Se però non abbiamo un criterio di lettura la cosa può essere molto complicata. Consideriamo la frase “INIZIO- Giorgio ha i baffi neri –FINE”. Se non seguiamo delle regole precise per leggere è evidente che potremmo trovare un’altra parola “fine” all’interno della frase “INIZIO – Giorgio ha i baf fine ri”. Questo per ricordare che la macchina che deve leggere il messaggio e tradurlo in proteina sa che deve spostarsi di tre nucleotidi /lettere ogni volta.
4-    Sapere quando e in risposta a che stimoli leggere un gene. Ad esempio i geni di risposta allo stress termico vengono letti solo quando la cellula è sottoposta a temperature maggiori di quelle fisiologiche. In altre parole non tutti i geni sono attivi contemporaneamente ma solo quelli richiesti per la vita della cellula.
Sulla base di queste informazioni possiamo operare una prima precisazione del nostro concetto di gene: Il gene è l’insieme della regione di regolazione (promotore) e di quella codificante. In questa definizione è contenuto anche il concetto 1 gene = 1 proteina. Vedremo che anche questa definizione del concetto di gene deve essere rivista alla luce dei recenti sviluppi della ricerca. Tuttavia in prima approssimazione possiamo operativamente usare questa definizione per iniziare a focalizzare il problema. Per il momento quello che è importante tenere a mente è che esiste una relazione specifica tra la sequenza nucleotidica del DNA e la sequenza aminoacidica delle proteine. Proprio per questo il DNA può venir visto come una specie di banca in cui è depositata e conservata tutta l’informazione necessaria per formare tutte le proteine presenti in un essere vivente. Una banca che viene tramandata da generazione in generazione e da cellula a cellula. 

martedì 20 settembre 2011

XV - Il codice genetico


Cerchiamo di capire meglio cosa intendiamo quando diciamo che un gene codifica una proteina ovvero che definisce la sequenza di aminoacidi che compongono la proteina. Vista la diversa natura chimica di DNA e proteine deve esistere un meccanismo che permette di passare dalla (tradurre la) sequenza di lettere/nucleotidi del gene alla sequenza di lettere/aminoacidi di una proteina. Parleremo in seguito della macchina che opera questa traduzione da un linguaggio ad un altro. Quello che per ora è importante tenere a mente sono alcuni concetti formali che vanno al cuore formale del problema: 1) come ripetuto più volte le proteine sono polimeri lineari che vengono sintetizzati dall’estremità amino terminale verso quella carbossi terminale; 2) il DNA è un polimero lineare che viene sintetizzato dall’estremità 5’ verso l’estremità 3’; 3) la sequenza di basi di in un gene è colineare alla sequenza di aminoacidici della proteina ovvero le estremità 5’ e 3’ del gene corrispondono rispettivamente alle estremità amino e carbossi terminali della proteina; infine 4) come nei migliori libri di spionaggio esiste un codice preciso che permette di passare dal (tradurre il) linguaggio a 4 lettere/nucleotidi del DNA a (in) quello a 20 lettere/aminoacidi delle proteine. 
Un po’ come il codice utlizzato dai tedeschi nella II° guerra mondiale per criptare i messaggi segreti. Il codice che permette di tradurre l’informazione contenuta nel DNA in informazione proteica è detto codice genetico ed è stato decifrato più di 50 anni fa con esperimenti che nel 1968 sono valsi il premio Nobel per la Medicina Holley a Nirenberg e Khorana.
Qual è la base del codice genetico? Come si fa a passare da un linguaggio a 4 lettere (i nucleotidi) ad un altro scritto con 20 lettere (gli aminoacidi). E’ evidente che non può esistere una relazione semplice 1 nucleotide = 1 aminoacido. Il problema non si risolve neanche considerando coppie di nucleotidi. Esistono infatti solo 16 coppie differenti di nucleotidi che sono ancora insufficienti per i 20 aminoacidi a meno che non esistano delle ambiguità. Il problema si risolve considerando i nucleotidi a triplette. Con 4 lettere/nucleotidi (A, G, C, T) si possono formare 43 = 64 triplette o codoni differenti. Ogni codone è associato ad un singolo aminoacido. Dato che ci sono 64 codoni e solo 20 aminoacidi, alcuni aminoacidi sono associati a codoni differenti. Si dice che il codice genetico è ”degenerato”. Ma la cosa importante è che ogni volta che c’è un codone questo viene “tradotto” sempre in un solo e specifico aminoacido. C’è anche spazio per alcuni codoni con una funzione di segnali di interpunzione: “AUG” indica inizio lettura e codifica per l’amino acido Metionina presente all’estremità Amino-terminale di tutte le proteine. “UAA”, “UAG” e “UGA” indicano STOP – fine lettura. 
Conoscendo questo codice - una specie di stele di Rosetta – e nota la sequenza di nucleotidi di un gene (ovvero la successione di A, G, C e T) possiamo dedurre la sequenza aminoacidica della proteina codificata. Per far questo sia noi che la cellula utilizziamo una semplice serie di regole: 1) leggiamo la sequenza di DNA fino a che incontriamo il primo AUG (primo codone del gene – occupa le posizioni +1, +2 e +3) e mettiamo il primo aminoacido della proteina che corrisponde a Metionina; 2) ci spostiamo di tre nucleotidi leggiamo il secondo codone (posizione +4, +5 e +6). Utilizziamo la tabella del codice genetico per tradurre mettiamo il secondo aminoacido della proteina. Ad esempio se il secondo codone è CTT metteremo l’aminoacido Leucina; 3) reiteriamo il processo fino a che non incontriamo un codone di STOP. A questo punto la proteina è finita. 

Il codice genetico è la chiave che permette di passare da una sequenza di nucleotidi ad un sequenza di aminoacidi. Nella sequenza di DNA tuttavia non è presente traccia della struttura tridimensionale della proteina. E’ come se la sequenza di DNA fosse l’ombra cinese della proteina tridimensionale ovvero di un oggetto. Il codice genetico, le proprietà chimiche e fisiche degli aminoacidi, le interazioni che gli aminoacidi stabiliscono tra loro e con il solvente (l’acqua) permettono di passare dall’ombra all’oggetto. L’identificazione del codice genetico è stata una scoperta fondamentale che ha permesso di definire con maggior precisione il concetto di gene. Rimane comunque aperto un problema fondamentale: qual è il meccanismo utilizzato dalla cellula per utilizzare codice genetico e tradurre l’informazione di DNA in proteina? Di questo ci occuperemo più avanti quando parleremo del terzo polimero: RNA. 

lunedì 19 settembre 2011

XIV - Funzione del DNA. Introducendo il concetto di GENE.



Innumerevoli esperimenti nella seconda metà dell’ultimo secolo hanno dimostrato, al di sopra di ogni ragionevole dubbio, che il DNA contiene l’informazioni necessaria per sintetizzare tutte le proteine presenti in una cellula. Per capire meglio il significato di questa affermazione dobbiamo passare attraverso la definizione di una serie di concetti importanti, il primo dei quali è il concetto di GENE. Per semplicità consideriamo una cellula (ad esempio un batterio) con un singolo cromosoma ovvero con una singola molecola di DNA. Possiamo immaginare di suddividere la lunghissima molecola di DNA del cromosoma (qualche milione di coppie di basi) in tanti frammenti ognuno dei quali contiene l’informazione necessaria per sintetizzare una singola proteina. In prima approssimazione possiamo chiamare i singoli frammenti con il nome GENE. Per rimanere aderenti al nostro modello linguistico, è come se il DNA costituisse un libro di una biblioteca e il gene fosse un paragrafo del libro. Meglio ancora il libro/DNA è un codice di leggi e i paragrafi/geni sono i singoli articoli delle leggi. Il libro/DNA è un oggetto costituito da non solo dall’informazione ma anche dal supporto cartaceo su cui l’informazione è scritta, dalla copertina, dalla rilegatura. Lo possiamo prendere in mano, toccare. Il paragrafo/gene è un pezzo d’informazione che occupa una porzione di una pagina del libro. Possiamo cambiare l’impaginazione del libro, cambiare la copertina, cambiare le dimensioni dei caratteri e le dimensioni delle pagine. Il paragrafo occuperà posizioni differenti ma il suo contenuto informativo sarà identico. Analogamente, quello che importa in un GENE è la sequenza di nucleotidi perché come vedremo questa specifica la sequenza di aminoacidi della proteina. Da questa definizione è ovvio che GENE è un concetto astratto. Mentre nelle cellule esistono oggetti fisici ben identificabili come le molecole di DNA, i cromosomi e le proteine, il GENE è un concetto elaborato dalla mente umana per definire un qualcosa con un significato funzionale. In effetti, il concetto di GENE è stato sviluppato attraverso complicatissimi esperimenti di genetica prima ancora che si parlasse di sequenza di DNA e per molto tempo è rimasto qualcosa di definito solo da un punto di vista formale come un qualcosa che determina un carattere ereditabile dell’organismo. Un gene corrisponde ad una singola regione di DNA. L’opposto non è sempre vero. Una singola regione di DNA infatti può contenere più geni tra loro non separabili. Difficile da visualizzare vero? È come se potessero esistere più messaggi sovrapposti scritti in un unico libro e con le stesse lettere. Proprio per questo il concetto di gene è legato ad una funzione e non ad un oggetto, e la definizione di GENE è progressivamente cambiata (cambia anche oggi) per rendere conto di aspetti nuovi che emergono dalla ricerca. Tuttavia, come punto di partenza penso che sia corretto identificare con il termine GENE un frammento di DNA che codifica una proteina. Vedremo che questa idea di gene è molto limitativa ma vi garantisco che è utile per cominciare a focalizzare il problema. In altre parole ritengo che inizialmente si possa partire dal modello classico UN GENE – UNA PROTEINA tenendo però in mente che questo non è sempre vero.

giovedì 15 settembre 2011

XIII - Perché il DNA non è nudo?


Introducendo il concetto di cromosoma abbiamo detto che ogni molecola di DNA nelle cellule è ricoperta di numerose e diverse proteine. Perché il DNA non è nudo nelle cellule? Perché deve essere coperto di proteine? A che cosa servono queste proteine?
In biologia, come nella vita di tutti i giorni, esiste una forte relazione tra organizzazione strutturale (come è fatta una cosa/oggetto/molecola) e funzione (a cosa serve).
Esistono una serie di motivazioni funzionali che rendono conto di questa organizzazione strutturale in cui il DNA è ricoperto di proteine:

1)  Ogni nostra cellula contiene 1,5 metri di DNA. Tutto questo filo lunghissimo deve stare dentro ad un contenitore sferico (il nucleo della cellula) che ha un raggio di 5 micron ovvero di 5 millesimi di millimetro. Avete mai lottato con un cavo elettrico cercando di farlo stare in un cassetto? Se è tutto aggrovigliato può risultare un incubo. Quindi, due motivi sono la compattazione e l’esigenza di mettere ordine evitando la formazione di nodi indistricabili. La compattazione e l’ordine sono importanti anche durante la duplicazione del DNA e la divisione cellulare. Già non è facile duplicare una molecola di DNA. Può diventare un incubo se è piena di nodi. E poi se tutte le molecole sono annodate come fare a districarle e separarle quando la cellula si divide? Insomma le proteine aiutano a mettere ordine.

2) Il DNA è la molecola che contiene l’informazione. Non c’è da stupirsi che venga protetta molto accuratamente. Abbiamo detto che la struttura a doppia elica la rende la molecola più resistente di quella a singolo filamento proteggendo così l’informazione. Le proteine che ricoprono il DNA riducono ulteriormente la possibilità di rotture. Inoltre alcune proteine hanno il compito di duplicare la molecola di DNA, altre si occupano di ripararla quando si rompe, altre ancora di mantenere integra l’informazione. Un po’ come le formiche che si prendono cura della loro regina.

3) Il DNA è la molecola che contiene l’informazione. Bisogna leggere l’informazione e soprattutto bisogna sapere dove è l’informazione che bisogna leggere. Se non ci fossero proteine specifiche deputate a questa funzione il DNA non servirebbe assolutamente a nulla. E’ il lettore (ovvero le proteine) che dà un significato al libro. Provate a prendere un libro scritto in una lingua diversa dall’italiano magari in giapponese oppure in una lingua ormai non più usata, ad esempio un papiro egiziano. Vi sfido a comprendere qualcosa! Così se prendete il DNA di un batterio e lo infilate in una cellula umana state sicuri che il messaggio non verrà letto o se verrà letto qualcosa sarà probabilmente differente. Questo perché le sequenze di DNA che segnalano dove è l’informazione vengono riconosciute da specifiche proteine e sono differenti nelle cellule umane e nei batteri 

XII - DNA, cromosomi, sesso.

Abbiamo detto che una cellula contiene diverse migliaia di proteine differenti. Alcune sono presenti in poche copie nelle cellule altre in molte copie. Per cercare di avere un modello visivo pensiamo alla cellula come ad una casa: é piena di oggetti/proteine. Alcuni oggetti/proteine sono presenti in molti esemplari. Ad esempio avremo molti coltelli da cucina o molti bicchieri. Altri oggetti/proteina sono presenti in poche copie. Ad esempio uno o due letti. L’abbondanza di ogni singola proteina è in relazione alla sua funzione e può variare con le esigenze del momento. Al contrario, il contenuto in molecole di DNA è fisso e molto basso. In una cellula umana (se escludiamo il DNA mitocondriale) sono presenti solo 46 molecole di DNA molto lunghe per un totale di circa 3x109 coppie di basi. 

Ognuna di queste molecole di DNA è organizzata in una struttura complessa visibile al microscopio e detta CROMOSOMA. Un cromosoma è un oggetto che contiene una singola molecola di DNA legata a numerose molecole di proteine con funzioni differenti. Ogni cellula umana, tranne i gameti (ovuli e spermatozoi) contiene 46 cromosomi a due a due uguali, ovvero 23 coppie di cromosomi. Si dice che la cellula è diploide. I cromosomi vengono numerati da 1 a 23 in base alla lunghezza, dove il cromosoma 1 è quello più lungo. 



La coppia 23 è formata dai cromosomi sessuali e nella femmina è XX (due cromosomi uguali) mentre nel maschio è XY. I gameti (spermatozoi e ovuli) contengono un solo elemento di ogni coppia, ovvero 23 cromosomi, e sono aploidi. In particolare ogni gamete avrà un solo cromosoma sessuale. Nel caso dei gameti femminili, tutti gli ovuli sono portatori di un X. Al contrario metà degli spermatozoi portano un X e metà portano un Y. Quando un ovulo viene fecondato da uno spermatozoo si riforma una cellula con 23 coppie di cromosomi dove 1 elemento di ogni coppia è di origine paterna e uno di origine materna. Se un ovulo viene fecondato da uno spermatozoo che porta il cromosoma sessuale X si ricostituirà una coppia di cromosomi X e l’individuo si svilupperà in una femmina. Se lo spermatozoo porta un cromosoma Y si formerà la coppia XY con la conseguente nascita di un maschio. Alterazioni nel numero e nella struttura dei cromosomi vogliono dire alterazioni nel numero e nella dimensione delle molecole di DNA e sono associati a malattie genetiche e a tumori. Il caso più noto di malattia genetica dovuta ad alterazione nel numero di cromosomi è quello della trisomia (tre copie) del cromosoma 21 che è associata alla sindrome di Down (dal nome del medico che ha descritto per primo questa sindrome). I bambini Down hanno in ogni cellula dell’organismo tre copie del cromosoma 21, mentre tutti gli altri cromosomi sono correttamente presenti in due copie.

XI - Coppie di basi


Un modello molto schematico (ma sicuramente più informativo del precedente) per farci comprendere la struttura complementare dei due filamenti che compongono la molecola può essere:
Filamento superiore Watson       5’- ACCGTAAGCT -3’
Filamento inferiore Crick           3’- TGGCATTCGA -5’

Spesso i due filamenti vengono chiamati Watson e Crick in onore dei due scienziati che hanno risolto la struttura della molecola di DNA. Da questo modello è evidente che i due filamenti hanno polarità 5’->3’ opposta e che ad ogni A è affacciata una T e viceversa mentre ad ogni G è affacciata una C e viceversa. Se conosco la regola e la sequenza di un filamento posso scrivere la sequenza del filamento complementare. Questo è proprio quello che succede nelle cellule e che permette di ottenere due molecole di DNA identiche partendo da una molecola iniziale (parentale). L’esempio riportato sopra rappresenta una molecola di DNA costituita da 10 coppie di basi. In natura non esistono molecole di DNA così brevi e le molecole di DNA più piccole sono di comunque lunghe qualche migliaio di nucleotidi. Un giro di doppia elica di DNA contiene 10.5 coppie di basi (A:T e G:C) ed è lungo 3.4 nm (1 nanometro è 1 miliardesimo di metro); la distanza di un filamento dall’asse centrale della doppia elica (il raggio della doppia elica) è di 1 nm. Come detto nel paragrafo precedente i 4 nucleotidi hanno una struttura simile. Tutti i nucleotidi sono formati da uno zucchero – il desossiribosio - (il pallino nero in figura) e da un gruppo fosfato (acido) (la stanghetta nera). Questa regione comune a tutti i nucleotidi viene a costituire gli assi montanti della doppia elica. I 4 nucleotidi si differenziano per una regione che si chiama base (azotata). La figura rappresenta in modo schematico i 4 nucleotidi evidenziando le basi (le lettere colorate). Mostra inoltre uno schema di filamento che si ottiene unendo in modo lineare i nucleotidi. I due filamenti affacciati della doppia elica presentano gli zuccheri e i gruppi acidi rivolti verso l’esterno a diretto contatto con l’acqua. Le basi (che non sono solubili in acqua) sono invece nascosta nella regione centrale della molecola, rendendo ancora più protetto il messaggio. Le basi sono affacciate l’una all’altra seconda la regola della complementarietà (A con T e G con C) a formare delle coppie di basi che costituiscono i gradini della scala a chiocciola (la doppia elica) mentre zucchero e fosfato formano in montanti. Proprio per questa struttura quando si parla di una sequenza di DNA si usa spesso il termine “coppia di basi”.

Un ultima cosa vorrei ricordare qui. Una cosa a cui molti, anche i biologi, spesso non pensano. Il DNA è la molecola che contiene l’informazione. Ma ogni filamento è costituito da una sola fila di atomi. Non esiste nessun mezzo per immagazzinare l’informazione più miniaturizzato di questo. Ma in questo modo l’informazione diventa estremamente sensibile alle radiazioni e agli agenti chimici. 

domenica 11 settembre 2011

X - Il modello della cerniera lampo


Quello della struttura del DNA è un argomento complesso. Tuttavia è necessario affrontarlo perché ci permette di capire il significato di questa molecola. Come nel caso delle proteine, infatti le proprietà strutturali sono intimamente connesse alla funzione. Un buon modello per pensare alla struttura con i due filamenti complementari è quello della cerniera lampo dove i “denti” di una metà della cerniera sono complementari ai denti dell’altra metà. Nel caso del DNA le due metà corrono in direzione opposte ma il modello è comunque abbastanza valido. Tra l’altro come nella cerniera lampo, i due filamenti di DNA possono separarsi (denaturarsi) per un breve intervallo di tempo. Questa denaturazione rende possibile la duplicazione e la lettura dell'informazione contenuta nel DNA. Tuttavia la separazione dei due filamenti dell’elica è transitoria perché il DNA a singolo filamento si rompe facilmente. La struttura a doppia elica nasconde l'informazione ma stabilizza la molecola di DNA e la rende adatta a funzionare come banca dell’informazione. Come nella cerniera lampo il cursore di metallo separa le due metà, così  una serie di proteine sono in grado di separare momentaneamente i due filamenti di DNA. 

I due filamenti che costituiscono la doppia elica di DNA sono “complementari” tra loro. E’ come se un filamento fosse l’impronta dell’altro. Questo deriva dalle proprietà chimiche delle quattro lettere/nucleotidi (A, G, C e T). Infatti, come già detto, A è chimicamente complementare a T e G a C. 

IX - Il DNA è formato da due filamenti che costituiscono una doppia elica.


Al contrario delle proteine, il DNA è una molecola fondamentalmente inerte: non è in grado di catalizzare reazioni biochimiche, non ha ruoli strutturali, non sa fare nulla. Tuttavia il DNA è particolarmente interessante perché è adatta a conservare l’informazione. Questa proprietà deriva direttamente dalla complementarietà delle basi: la A si appaia con la T e la C con la G.
Ogni molecola di DNA è costituita da due filamenti di nucleotidi (solo in pochi virus è presente un singolo filamento). Nel nostro modello linguistico potremmo immaginare che ogni molecola di DNA è formata da due parole estremamente lunghe. I due filamenti (le due parole) sono affacciati secondo un criterio ben preciso a formare una doppia elica destrogira.
Al contrario delle proteine, che hanno strutture tridimensionali differenti intimamente connesse con la loro funzione, nel caso del DNA abbiamo un’unica struttura: la doppia elica. Tutte le molecole di DNA in qualsiasi organismo vivente sul pianeta formano delle doppie eliche. Inoltre la terza dimensione del DNA è trascurabile nel senso che la doppia elica è estremamente sottile. Se, infatti, la lunghezza totale delle molecole di DNA presenti in una singola cellula del nostro corpo è 1,5 metri, lo spessore è di soli 0,000002 millimetri. In prima approssimazione (ma non è così semplice), possiamo dire che nel caso del DNA quello che conta è solo la sequenza delle 4 lettere/nucleotidi e non la struttura. Al contrario di quanto avviene nelle proteine, infatti, la sequenza non determina un ripiegamento nello spazio e l’acquisizione di una struttura tridimensionale.
Abbiamo già visto che nella nostra lingua esiste la convezione di scrivere e leggere le parole da sinistra a destra. Una convenzione analoga esiste per le proteine: vengono sintetizzate a partire dall’estremità AMINO verso l’estremità CARBOSSI terminale. Anche nel caso del DNA esiste una convenzione: ogni filamento di DNA viene sintetizzato/scritto a partire dall’estremità 5’ verso l’estremità 3’. Non è tanto importante sapere il significato chimico di 5’ e 3’ (a ha che fare con la struttura dei nucleotidi). Se qualcuno è interessato può facilmente ritrovar il significato di 5’ e 3’ su un qualsiasi testo di biologia molecolare. L’importante è sapere che la macchina che sintetizza il DNA si muove seguendo una direzione specifica e che la molecola di DNA ha una polarità.
Proprio per questo si può rappresentare un filamento di DNA con una freccia: la partenza è l’estremità 5’ e la punta della freccia è l’estremità 3’. Come vedremo in seguito questa polarità gioca un ruolo importante nelle due principali reazioni biochimiche che coinvolgono il DNA, ovvero la “replicazione” e la “trascrizione”. Un altro aspetto che dobbiamo tenere a mente è che i due filamenti che costituiscono la doppia elica di DNA hanno polarità opposte: nella rappresentazione schematica in figura una freccia va da destra a sinistra e l’altra da sinistra a destra.



mercoledì 7 settembre 2011

VIII - DNA. (Acido DesossiriboNucleico o in inglese DeoxyriboNucleic Acid)


L’alfabeto del DNA è costituito da 4 lettere. Come le proteine, il DNA è un polimero lineare costituito da una successione di lettere/monomeri. Le lettere che compongono il DNA sono chimicamente diverse da quelle presenti nelle proteine e sono chiamate nucleotidi. L’alfabeto del DNA è costituito da solo 4 lettere/nucleotidi: Adenina (A), Guanina (G), Citosina (C) e Timina (T). Questo significa che il numero di “parole” differenti che si possono scrivere è dato dalla formula 4n dove con “n” intendiamo il numero di nucleotidi che compongono la molecola. Nel modello di parole a 6 lettere utilizzato precedentemente per le proteine avremmo la possibilità di formare solo 4096 parole differenti contro i 64 milioni che si possono formare con i venti aminoacidi. Un’altra grande differenza tra proteine e DNA è che le molecole di DNA sono dei polimeri molto più lunghi. Se una proteina è in media composta di 300 aminoacidi, il DNA del virus più piccolo è formato da 4000 nucleotidi, nei batteri sono presenti molecole di DNA lunghe più di 106 nucleotidi e il DNA del cromosoma umano più grande (cromosoma 1) è formato da 247 milioni di nucleotidi! Per cercare di stupirvi, rimarrò nel campo della lunghezza. Il DNA contenuto in una singola cellula umana è lungo circa 1,5 metri. Avete capito bene: 1.5 metri! Dato che un uomo è formato da circa 1013 cellule questo significa che sommando tutte le molecole di DNA contenute in una persona si arriva alla fantasmagorica lunghezza di 15 x 109 km di DNA (quindici miliardi di km). Per avere un termine di paragone, la distanza terra-luna è di soli 300.000 km. 

Come gli aminoacidi, i 4 nucleotidi che compongono il DNA condividono una struttura comune. Tutti i nucleotidi, infatti sono composti da uno zucchero – il desossiribosio - e da un gruppo fosfato (acido). Non vi sarà sfuggito che il nome DeoxyriboNucleicAcid (DNA) deriva proprio dalla presenza di questi gruppi chimici. I 4 nucleotidi si differenziano per una la presenza di un altro gruppo chimico che si chiama base (azotata). Una caratteristica fondamentale delle 4 lettere/nucleotidi è che questi sono a due a due complementari: la A è complementare alla T e la G è complementare alla C. Non è importante entrare nei dettagli chimici di cosa questo voglia dire. Ogni buon testo di biologia molecolare offre spiegazioni più che esaurienti. Quello che mi preme sottolineare è che nulla di simile esiste nel caso degli aminoacidi. Non esistono aminoacidi a due a due complementari. Come vedremo in seguito, questa differenza fa si che il DNA, e non le proteine, sia la molecola dove è depositata l’informazione che viene ereditata dalle cellule, generazione dopo generazione. E’ per questo che si dice che si è diffusa (soprattutto nei media) l’espressione “il DNA è la molecola della vita”.

martedì 6 settembre 2011

VII - Proteine - Riassumendo


Abbiamo detto che le proteine sono costituite da un sequenza lineare di aminoacidi. Che questi aminoacidi stabiliscono interazioni tra loro e con l’acqua a formare una struttura tridimensionale. Quando consideriamo una specifica proteina quello che importa non è la sequenza di aminoacidi bensì la sua struttura che è intimamente legata alla funzione. Un cambiamento nella sequenza di aminoacidi nella maggior parte dei casi  cambia la struttura con conseguenze negative sulla funzione .

Possiamo a questo punto porci una domanda importante: come fa la cellula a sintetizzare una proteina con una specifica sequenza? Da dove viene l’informazione contenuta nella proteina? Come fa a venir trasmessa di generazione in generazione, dai genitori ai figli?
La risposta ovvia (spero a tutti) è: DNA. Ma in che modo il DNA determina la sequenze delle proteine?

lunedì 5 settembre 2011

VI - Alcune cose da tener presente 2


     Le proteine hanno una struttura tridimensionale. Le lettere/aminoacidi che costituiscono le proteine hanno una proprietà importante: possono interagire con altre lettere /aminoacidi, anche distanti, della stessa proteina o con l’acqua in cui la proteina è immersa. Questo deriva dal fatto che gli aminoacidi hanno caratteristiche chimiche specifiche: alcuni sono acidi, altri basici, altri neutri, certi aminoacidi si sciolgono bene in acqua altri non sono solubili e tendono a stare lontani dall’acqua come fa l’olio. Il risultato netto è che, al contrario delle parole, la proteina non è un oggetto lineare ma tutto ripiegato su se stesso. Un po’ come un filo di lana tutto aggrovigliato a formare un gomitolo: è un filo ma appare come un oggetto tridimensionale.
La differenza è che l’intreccio del filo è casuale, mentre la proteina ha una struttura precisa definita dalle interazioni che si stabiliscono tra gli aminoacidi e con l’acqua. Questo suggerisce una serie di considerazioni:
a-                     l’alfabeto con cui sono scritte le proteine ha in sè la capacità di trasformare un oggetto lineare (la sequenza di aminoacidi) in un altro tridimensionale.
b-                     E’ la struttura tridimensionale della proteina (come nel caso di tutti 
gli oggetti che ci circondano nella vita di tutti i giorni) che è importante e determina la funzione. Vorrei attirare la vostra attenzione su questo concetto: l’informazione lineare presente nella successione di lettere contiene in sé le regole per ripiegarsi e formare un oggetto tridimensionale. Nell’esempio in figura la scritta “si capisce che questo è un martello formato di lettere” è ripiegata a formare un martello: a mala pena riusciamo a leggere la scritta mentre intuiamo (spero) la forma del martello. Quando considerate una proteina, quello che conta non è tanto la sua sequenza di aminoacidi bensì la sua struttura 3D e la sua funzione. È come se emergesse una qualità nuova non presente negli elementi che compongono l’oggetto. Volete un esempio più facile? Pensate ad un uomo. Tutti noi siamo costituiti da cellule: 1013 (diecimila miliardi) di cellule, tutte nel nostro corpo! Nessuna singolarmente pensa, gioca a calcio, parla. Tutte queste proprietà “emergono” nell’individuo che è più della semplice somma delle sue parti. La cosa importante è la persona non le singole cellule che la compongono anche se ognuna è essenziale.
c-                     Tornando alle proteine, quali sono le regole che determinano le 3 dimensioni? Non le conosciamo ancora completamente come dimostrato dal fatto che anche con i computer più potenti del mondo non sappiamo ancora predire la struttura tridimensionale di una proteina semplicemente in base alla sua sequenza di aminoacidi. Facciamo però dei modelli che spesso (molto spesso) sono corretti e che vengono poi verificati sperimentalmente da studi strutturali complessi che utilizzano cristalli di proteine e raggi X. Quello che sappiamo è che la struttura 3D determina la funzione della proteina ed entrambe (struttura e funzione) dipendono non solo dalla sequenza di aminoacidi ma anche dall’interazione degli aminoacidi con l’acqua, dalla concentrazione di sali, dalla temperatura, dall’acidità e altre variabili. Provate a cambiare la temperatura e la struttura della proteina cambia. L'esempio più comune è quello dell'uovo sodo.  Questo vuol dire che l’informazione contenuta nella sequenza di aminoacidi della proteina non è sufficiente per definire la struttura 3D della proteina stessa. E’ l’interazione con l’ambiente che gioca un ruolo chiave. Questa è una differenza importante rispetto al modo in cui un essere "intelligente" come un uomo progetta le cose. Un ingegnere si preoccupa di stabilire la distribuzione spaziale degli oggetti, le forze necessarie per mantenere una certa struttura. La forma finita è già presente nella sua mente. Nel caso delle proteine questo non avviene. Quella che viene determinata è semplicemente la sequenza di aminoacidi. Se la struttura o la funzione è utile la cellula ne ha un vantaggio. Altrimenti...

V - Alcune cose da tener presente - 1


     Come le parole le proteine vengono sintetizzate (scritte)  aggiungendo lettera dopo lettera a partire da un’estremità. Esistono differenti convenzioni per tradurre il suono di una parola in un simbolo scritto. In cinese una parola può essere rappresentata da un unico simbolo. In Italiano usiamo le lettere dell’alfabeto ognuna delle quali rappresenta un suono. Per convenzione le lettere vengono scritte in una successione lineare partendo da sinistra verso destra. Durante la sintesi delle proteine avviene qualcosa di simile: la macchina che scrive (sintetizza) le proteine parte da una estremità (detta “amino terminale”) e aggiunge aminoacido dopo aminoacido formando dei legami tra i singoli aminoacidi proprio come nel corsivo noi formiamo un legame tra le lettere successive. Alla fine la proteina termina all’estremità “carbossi terminale”.

venerdì 2 settembre 2011

IV - Le proteine sono formate da aminoacidi


Le proteine sono formate da 20 lettere-monomeri differenti: gli aminoacidi. I 20 aminoacidi condividono una struttura generale comune. Ognuno ha però delle caratteristiche differenti: alcuni sono acidi, altri basici, alcuni hanno affinità per l’acqua, altri no. Un modello facile per pensare alle proteine è quello della lingua italiana. In italiano esistono 20 lettere dell’alfabeto che come i 20 aminoacidi possono venir unite in sequenze lineari differenti a formare un numero pressoché illimitato di parole. Consideriamo una parola di sei caratteri e chiediamoci quante parole differenti possiamo formare con le 20 lettere dell’alfabeto. Se ogni posizione potesse essere occupata da una qualsiasi lettera dell’alfabeto (quindi accettando anche parole come ZXCVBN) con venti lettere si potrebbero formare ben 206 (64 milioni) parole differenti. Nella lingua italiana il numero è ovviamente molto più limitato perché la maggior parte delle soluzioni (proprio come ZXCVBN) non hanno alcun significato.
Possiamo pensare alle proteine come parole estremamente lunghe. Considerando una lunghezza media di 300 aminoacidi/lettere, in teoria si possono costruire 20300 possibili proteine differenti. Un numero enorme! Come per le possibili parole, anche la maggior parte di queste possibili proteine non esistono in natura. O non sono mai state scritte o la selezione naturale le ha scartate perché non FANNO /servono a nulla o sono addirittura tossiche. Fare proteine, come ogni cosa, costa energia. Molta energia! E la cellula non può spendere troppa energia in cose inutili.

giovedì 1 settembre 2011

III - Proteine

Inizierò parlando delle proteine. Un po’ perché sono state identificate e studiate prima del DNA e dell’RNA. Un altro motivo (sicuramente il meno importante) alla base della mia scelta dovrebbe essere evidente ai fanatici delle diete. Avete mai letto le informazioni nutrizionali sulle confezioni di alimenti? Quasi sempre è indicato il contenuto in proteine. Ma qualcuno ha mai letto qualcosa riguardo il contenuto in DNA o RNA? Io mai. Forse perché DNA e RNA hanno un basso valore energetico (ma inducono la gotta) o forse perché sono meno abbondanti di grassi, carboidrati e proteine. Ma vi posso assicurare che ogni cibo contiene DNA e RNA. Mi chiedo se questa mancata informazione nutrizionale abbia contribuito a diffondere l’idea (sbagliata) che il DNA sia tipico degli organismi geneticamente modificati – OGM. Vi assicuro che ho sentito questa assurdità (il DNA c’è solo negli OGM) durante un dibattito televisivo sui “cibi transgenici” e spesso ascoltando le persone nei supermercati.
Comunque è vero che nei cibi le proteine sono sicuramente più abbondanti di DNA e RNA. Quando divorate una bistecca di filetto mangiate principalmente proteine. Le proteine sono gli oggetti che compongono il nostro corpo, ci fanno muovere, fanno le reazioni chimiche dentro di noi, FANNO tutto. In altre parole sono “l’informazione che FA”. Nel nostro corpo ci sono migliaia, almeno centomila tipi differenti di proteine (parole). E se un tipo di proteina è fatto in modo "non corretto” allora può essere "non funzionante" e ci si può ammalare. Malattie genetiche, tumori, malattie degenerative sono dovute al mal-funzionamento di uno o più tipi di proteina. 

II - DNA, RNA e proteine

“DNA”, “RNA” e “proteine” sono i tre principali polimeri biologici presenti nel nostro corpo. Condividono uno stesso impianto, ovvero sono formati da una successione lineare (non ramificata) di monomeri la cui sequenza definisce il contenuto informativo della molecola.  
Come inizio non c’è male. Cercherò di essere più semplice: DNA, RNA e proteine sono tre “oggetti” presenti in ogni essere vivente (uomo, animali, piante, batteri). Anche se differenti per struttura e funzione condividono un’organizzazione generale simile. Un buon modello per pensare questi oggetti è quello delle parole scritte: le lettere dell’alfabeto (i monomeri) sono unite a formare le parole (i polimeri). E’ la sequenza delle lettere che dà il significato: AMOR e ROMA sono due parole composte dalle stesse lettere ma il loro significato è chiaramente differente.
Penso che sia utile pensare a DNA RNA e proteine utilizzando sempre l’analogia con le parole.

mercoledì 31 agosto 2011

I - Perchè queste note


Le biotecnologie hanno un impatto crescente sulla nostra vita quotidiana. Termini come OGM, terapia genica, genoma, clonazione fanno sempre più parte del nostro vocabolario, spesso ne abbiamo paura, raramente sappiamo cosa significano.
Per molti di noi, la nostra conoscenza di un determinato problema biologico deriva dalla lettura di giornali o comunque dalla divulgazione che ne fanno i media. Senza voler sminuire questa importante opera di diffusione del sapere, tutti noi, anche i così detti “esperti”, abbiamo talvolta difficoltà a leggere e comprendere gli articoli divulgativi che solitamente presuppongono la conoscenza di concetti che vengono definiti “di base” ma che spesso in realtà sono completamente ignorati dal grande pubblico. Mi sono reso conto più volte di questo problema quando ho cercato di spiegare il mio lavoro. Mi occupo di RNA che è una delle molecole base della vita. O meglio “la molecola della vita” visto che oggi è convinzione comune (anche se molti biologi non lo sanno) che la molecola da cui si è originata la vita su questo pianeta è appunto l’RNA. Così mi aspetterei che tutti abbiano una vaga idea di cosa è l’RNA. Invece, appena pronuncio questa parola magica “RNA” la gente mi guarda esterrefatta come se parlassi di argomenti esoterici e smette di ascoltami oppure pensa che mi sia semplicemente confuso con il famoso DNA dove tutto è scritto.
Penso che uno dei compiti di chi fa scienza e di un istituto di ricerca sia quello di diffondere il più possibile il sapere scientifico permettendo a tutti di farsi delle opinioni sui problemi fondamentali della vita sempre più complicata del nostro mondo tecnologico.
L’intento di queste piccole note è di tentare di fornire una descrizione per non addetti al lavori di problemi fondamentali della biologia molecolare evitando termini “tecnici”. Tutte le cose che tratterò sono ampiamente e più precisamente descritte in molti testi di biologia molecolare. Mi sforzerò di spiegare alcuni concetti di biologia molecolare, anche sofisticati, utilizzando delle analogie con esempi che appartengono alla vita quotidiana di ognuno di noi. La speranza è quella di dare un punto di riferimento per chi non è nel campo e non ha né gli strumenti né il tempo per cercare di affrontare questi argomenti. Sono ben conscio del rischio che corro: la semplificazione spesso introduce errori importanti. Tuttavia, questo esercizio mi ha permesso di focalizzare o sviluppare concetti o punti di vista nuovi o di cui non ero pienamente consapevole. Proprio per questo mi auguro che queste note possano favorire una discussione sia tra i non addetti che tra gli “esperti”.