lunedì 26 settembre 2011

XVIII - La replicazione del DNA. I parte: il lavoro dell'amanuense


Il DNA contiene l’informazione necessaria per la sintesi di tutte le proteine della cellula. È necessario perciò che ad ogni divisione cellulare, ognuna delle due cellule figlie che si originano da una cellula madre (in laboratorio questo avviene ogni 24 ore circa) erediti l’intera informazione genetica in modo corretto. Se una cellula non eredita tutti i geni o se alcuni geni vengono duplicati o mutati, l’effetto potrebbe essere disastroso. Questo richiede che ad un certo momento della vita della cellula il DNA venga duplicato attraverso un processo biochimico complesso chiamato “replicazione del DNA”. 


Entrare nella descizione degli aspetti biochimici della replicazione del DNA, o discutere i meccanismi complessi che regolano questo evento renderebbe la cosa molto complicata. Voglio cercare solo di farvi intuire in che modo la struttura stessa del DNA sia importante per la replicazione del DNA e conseguentemente dell’informazione genica. Per gli amanti dei computer si può paragonare questo processo alla duplicazione dell’informazione digitale contenuta su un CD.






E’ utile questo punto rivedere il modello della cerniera. Infatti, grazie alla complementarietà dei due filamenti, è molto facile dal punto di vista logico immaginare come duplicare il DNA: basta separare i due filamenti (denaturare la doppia elica) e utilizzare ogni filamento come stampo per costruirne uno complementare secondo le regole di appaiamento delle basi.  Ritorniamo al nostro esempio utilizzando un codice colore per distinguere meglio i due filamenti:

Filamento Watson 5’- ATCGTAAGCT -3’
Filamento Crick    3’- TAGCATTCGA -5’

Denaturiamo la doppia elica e otteniamo due molecole a singolo filamento

Filamento Watson 5’- ATCGTAAGCT -3’

Filamento Crick 3’- TAGCATTCGA -5’

Utilizzando la regola della complementarietà e affacciamo ad ogni A una T ed ad ogni G una C. In questo modo otteniamo due doppie eliche di DNA identiche a quella originale.

Filamento Watson parentale   5’- ATCGTAAGCT -3’
Filamento Crick nuovo            3’- TAGCATTCGA -5’

Filamento Watson nuovo    5’- ATCGTAAGCT -3’
Filamento Crick parentale  3’- TAGCATTCGA -5’

Non potremmo fare nulla di simile con le proteine. Non possiamo utilizzare una proteina come stampo per farne una copia. Proprio per questa differenza il DNA (e non la proteina) è la molecola ideale per conservare l’informazione genica.

La replicazione del DNA prevede la denaturazione transiente solo di brevi tratti di DNA. Questo perché le molecole di DNA a singolo filamento sono molto più sensibili a rotture, il che aumenterebbe il tasso di mutazione dei geni a livelli incompatibili con la vita.
La strategia utilizzata prevede che la denaturazione e la replicazione avvengano quasi contestualmente all’interno di grossi macchinari formati da numerose proteine tra le quali le DNA polimerasi, ovvero gli  enzimi  che sintetizzano i nuovi filamenti di DNA. Con il termine enzimi si chiamano le  proteine che fanno delle reazioni chimiche o che permettono il verificarsi di reazioni chimiche che altrimenti non si realizzerebbero nella cellula.

La “replicazione del DNA” è una reazione estremamente complessa e fedele (non fa errori) che coinvolge centinaia di proteine differenti ed una serie di meccanismi di controllo. Pensate ad un amanuense che deve copiare un libro sacro, ad esempio la Bibbia. Immaginate quale problema interpretativo potrebbe nascere se Lui introducesse degli errori! La cellula spende molta energia per mantenere il più stabile possibile la sequenza di DNA ed evitare che vengano introdotte sostituzioni di che alterino il messaggio o che si rompa la molecola. Da un punto di vista energetico, questo processo costa moltissimo alla cellula: è il prezzo che si deve pagare per mantenere intatta l’informazione genetica. 

XVII - Il senso della vita e la sua regolazione


Il DNA è la banca in cui è depositata l’informazione necessaria per codificare tutte le proteine. Questo è un po’ quello che tutti ci sentiamo ripetere quotidianamente e che è alla base di un’espressione ormai comune: “E’ scritto nel suo DNA”. Tuttavia non tutti pensano al fatto (e vale la pena sottolinearlo) che il significato del DNA viene appunto dalle proteine. Sono le proteine che si prendono cura del DNA mantenendone l’integrità e duplicandolo fedelmente. E sono le proteine che riconoscono specifiche sequenze di DNA definendo cosi i promotori dei geni. Ad esempio una proteina potrebbe legarsi al DNA ogni qual volta esiste la sequenza GATCGATC. Un’altra potrebbe riconoscere e legare le sequenze TATA. Il legame di queste proteine definisce le regioni che agiscono da promotore e in questo modo identificano la regione di DNA che corrisponde ad un gene.
1-    Niente proteine niente geni. Il DNA contiene l’informazione per codificare le proteine e le proteine danno un significato al DNA. Se il cerchio si rompe non c’è modo per ricostruirlo. Prendete una molecola di DNA nuda. Non sarà mai in grado di produrre nulla. E lo stesso vale per le proteine. Una proteina pura potrà fare una certa attività per cui è stata costruita. Ma nient’altro. Questo solleva un problema filosofico: in che modo il cerchio DNA-Proteina-DNA si è stabilito? Vedremo che la terza molecola di cui ci occuperemo – RNA – ci aiuterà a dare una risposta. Rimane comunque difficile capire in che modo la complessità della vita come la vediamo oggi abbia potuto evolvere. 

   2- Circuiti. Per identificare un gene c’è bisogno di una proteina che leghi il promotore. In realtà ci sono più proteine che contemporaneamente legano e attivano un promotore ma per semplicità facciamo finta che si possa lavorare con una sola proteina per promotore. Se ogni promotore venisse riconosciuto da una proteina differente non sarebbe possibile avere ottenere nulla di utile per la cellula. Facciamo un esempio molto semplice. La proteina A riconosce il promotore del gene B. E’ ovvio che ci vuole un gene A per codificare la proteina A. Ma il gene A per essere attivo ha bisogno di una proteina che riconosca il suo promotore. Ad esempio la proteina B. Potremmo introdurre una serie di geni e proteine intermedi ma vista la premessa (ogni promotore viene legato da una proteina differente) questo sarebbe solo e semplicemente un cerchio che non produce niente. 

   Ovviamente la cosa funziona in modo differente. La proteina A, infatti può riconosce molti promotori ognuno a monte di un gene differente (nella figura gene C, gene D, gene E, gene F). Generalmente questi geni codificano proteine con funzione correlata, ad esempio le proteine necessarie per digerire un certo zucchero. La proteina B che controlla il gene A poi viene regolata da un sistema differente. In questo modo possiamo integrare una serie di circuiti in un unico sistema. La cosa è ovviamente molto più complicata di così e avremmo modo di discuterla in modo più approfondito. Però a questo punto penso sia importante utilizzare questo semplice modello per iniziare a visualizzare la complessità del problema.

3-    Regolazione. Se in una cellula manca la proteina che riconosce un certo promotore il gene non viene visto e risulta inattivo. Questo è il meccanismo tramite il quale si può regolare l’espressione dei geni in modo differente a seconda delle condizioni di crescita. E’ infatti evidente che risulterebbe uno spreco incredibile se non dannoso esprimere sempre tutti i geni. Prendiamo un batterio che cresce in un terreno ricco di glucosio (uno zucchero). Sarebbe inutile tenere attivi i geni che digeriscono il lattosio (un altro zucchero) se questo non è presente. Fare proteine, infatti, costa molta energia. Meglio farle quando c’è bisogno. Prendiamo un sistema più complesso: l’uomo. Noi siamo fatti da 1013 cellule. Alcune compongono i muscoli, altri il sistema nervoso altre la pelle e così via. E’ ovvio che far esprimere le proteine del muscolo anche alle cellule nervose e viceversa sarebbe non solo inutile ma dannoso. Così la proteina che regola i geni che codificano le proteine delle cellule nervose è presente solo nelle cellule nervose e non in quelle muscolari. 

sabato 24 settembre 2011

XVI - Identificare un gene sul DNA


Adesso che sappiamo che cosa è un gene ci si pone un altro problema. Come facciamo a trovarlo? La molecola di DNA presente in un cromosoma è estremamente lunga e contiene numerosi geni. Immaginate il cromosoma di un batterio contenente una molecola di DNA di 2 milioni di nucleotidi e provate ad identificare un singolo gene lungo 1000 nucleotidi (che codifica per una proteina di 330 aminoacidi). In assenza di segnali specifici la cosa è praticamente impossibile anche perché voi non conoscete la sequenza del gene. Inoltre non vi sarà sfuggito che la molecola di DNA è costituita da due filamenti e la sequenza che viene tradotta in proteina può essere presente sul filamento Watson oppure su quello Crick. E’ un po’ come se entraste in nella biblioteca nazionale di Parigi e doveste da soli trovare uno dei 13 milioni di libri. Se non avete delle indicazioni circa la posizione del libro potete passare tutta la vostra vita nell’interno della biblioteca. Questo per dire che il macchinario deputato alla sintesi delle proteine deve operare delle operazioni complesse per identificare e leggere le informazioni contenute nei geni: 
1-    capire se un gene è presente sul filamento Watson o su quello Crick.
2-    Riconoscere il codone di Inizio. Ci sono molti AUG presenti sulla sequenza di DNA, in media un AUG ogni 64 nucleotidi. Ovviamente solo alcuni sono codoni di inizio. Il problema è capire quali. Questo è possibile grazie a particolari sequenze di DNA immediatamente a monte (al 5’) del frammento che codifica la proteina. Queste sequenze (veri e propri puntatori che come delle bandiere marcano la posizione del gene sul DNA) vengono chiamate (per motivi che vedremo in seguito) Promotore.
3-    Riconoscere il codone di Stop. Ci sono numerosi codoni di STOP in un gene ma quelli che vengono riconosciuti come tali sono solo quelli che hanno lo stesso ordine di lettura (reading frame) dei codoni codificanti. Voglio fare un esempio per cercare di chiarire questo punto. Prendiamo la parola FINE e diciamo che questa segni il punto in cui bisogna smettere di leggere. Semplice no? Se però non abbiamo un criterio di lettura la cosa può essere molto complicata. Consideriamo la frase “INIZIO- Giorgio ha i baffi neri –FINE”. Se non seguiamo delle regole precise per leggere è evidente che potremmo trovare un’altra parola “fine” all’interno della frase “INIZIO – Giorgio ha i baf fine ri”. Questo per ricordare che la macchina che deve leggere il messaggio e tradurlo in proteina sa che deve spostarsi di tre nucleotidi /lettere ogni volta.
4-    Sapere quando e in risposta a che stimoli leggere un gene. Ad esempio i geni di risposta allo stress termico vengono letti solo quando la cellula è sottoposta a temperature maggiori di quelle fisiologiche. In altre parole non tutti i geni sono attivi contemporaneamente ma solo quelli richiesti per la vita della cellula.
Sulla base di queste informazioni possiamo operare una prima precisazione del nostro concetto di gene: Il gene è l’insieme della regione di regolazione (promotore) e di quella codificante. In questa definizione è contenuto anche il concetto 1 gene = 1 proteina. Vedremo che anche questa definizione del concetto di gene deve essere rivista alla luce dei recenti sviluppi della ricerca. Tuttavia in prima approssimazione possiamo operativamente usare questa definizione per iniziare a focalizzare il problema. Per il momento quello che è importante tenere a mente è che esiste una relazione specifica tra la sequenza nucleotidica del DNA e la sequenza aminoacidica delle proteine. Proprio per questo il DNA può venir visto come una specie di banca in cui è depositata e conservata tutta l’informazione necessaria per formare tutte le proteine presenti in un essere vivente. Una banca che viene tramandata da generazione in generazione e da cellula a cellula. 

martedì 20 settembre 2011

XV - Il codice genetico


Cerchiamo di capire meglio cosa intendiamo quando diciamo che un gene codifica una proteina ovvero che definisce la sequenza di aminoacidi che compongono la proteina. Vista la diversa natura chimica di DNA e proteine deve esistere un meccanismo che permette di passare dalla (tradurre la) sequenza di lettere/nucleotidi del gene alla sequenza di lettere/aminoacidi di una proteina. Parleremo in seguito della macchina che opera questa traduzione da un linguaggio ad un altro. Quello che per ora è importante tenere a mente sono alcuni concetti formali che vanno al cuore formale del problema: 1) come ripetuto più volte le proteine sono polimeri lineari che vengono sintetizzati dall’estremità amino terminale verso quella carbossi terminale; 2) il DNA è un polimero lineare che viene sintetizzato dall’estremità 5’ verso l’estremità 3’; 3) la sequenza di basi di in un gene è colineare alla sequenza di aminoacidici della proteina ovvero le estremità 5’ e 3’ del gene corrispondono rispettivamente alle estremità amino e carbossi terminali della proteina; infine 4) come nei migliori libri di spionaggio esiste un codice preciso che permette di passare dal (tradurre il) linguaggio a 4 lettere/nucleotidi del DNA a (in) quello a 20 lettere/aminoacidi delle proteine. 
Un po’ come il codice utlizzato dai tedeschi nella II° guerra mondiale per criptare i messaggi segreti. Il codice che permette di tradurre l’informazione contenuta nel DNA in informazione proteica è detto codice genetico ed è stato decifrato più di 50 anni fa con esperimenti che nel 1968 sono valsi il premio Nobel per la Medicina Holley a Nirenberg e Khorana.
Qual è la base del codice genetico? Come si fa a passare da un linguaggio a 4 lettere (i nucleotidi) ad un altro scritto con 20 lettere (gli aminoacidi). E’ evidente che non può esistere una relazione semplice 1 nucleotide = 1 aminoacido. Il problema non si risolve neanche considerando coppie di nucleotidi. Esistono infatti solo 16 coppie differenti di nucleotidi che sono ancora insufficienti per i 20 aminoacidi a meno che non esistano delle ambiguità. Il problema si risolve considerando i nucleotidi a triplette. Con 4 lettere/nucleotidi (A, G, C, T) si possono formare 43 = 64 triplette o codoni differenti. Ogni codone è associato ad un singolo aminoacido. Dato che ci sono 64 codoni e solo 20 aminoacidi, alcuni aminoacidi sono associati a codoni differenti. Si dice che il codice genetico è ”degenerato”. Ma la cosa importante è che ogni volta che c’è un codone questo viene “tradotto” sempre in un solo e specifico aminoacido. C’è anche spazio per alcuni codoni con una funzione di segnali di interpunzione: “AUG” indica inizio lettura e codifica per l’amino acido Metionina presente all’estremità Amino-terminale di tutte le proteine. “UAA”, “UAG” e “UGA” indicano STOP – fine lettura. 
Conoscendo questo codice - una specie di stele di Rosetta – e nota la sequenza di nucleotidi di un gene (ovvero la successione di A, G, C e T) possiamo dedurre la sequenza aminoacidica della proteina codificata. Per far questo sia noi che la cellula utilizziamo una semplice serie di regole: 1) leggiamo la sequenza di DNA fino a che incontriamo il primo AUG (primo codone del gene – occupa le posizioni +1, +2 e +3) e mettiamo il primo aminoacido della proteina che corrisponde a Metionina; 2) ci spostiamo di tre nucleotidi leggiamo il secondo codone (posizione +4, +5 e +6). Utilizziamo la tabella del codice genetico per tradurre mettiamo il secondo aminoacido della proteina. Ad esempio se il secondo codone è CTT metteremo l’aminoacido Leucina; 3) reiteriamo il processo fino a che non incontriamo un codone di STOP. A questo punto la proteina è finita. 

Il codice genetico è la chiave che permette di passare da una sequenza di nucleotidi ad un sequenza di aminoacidi. Nella sequenza di DNA tuttavia non è presente traccia della struttura tridimensionale della proteina. E’ come se la sequenza di DNA fosse l’ombra cinese della proteina tridimensionale ovvero di un oggetto. Il codice genetico, le proprietà chimiche e fisiche degli aminoacidi, le interazioni che gli aminoacidi stabiliscono tra loro e con il solvente (l’acqua) permettono di passare dall’ombra all’oggetto. L’identificazione del codice genetico è stata una scoperta fondamentale che ha permesso di definire con maggior precisione il concetto di gene. Rimane comunque aperto un problema fondamentale: qual è il meccanismo utilizzato dalla cellula per utilizzare codice genetico e tradurre l’informazione di DNA in proteina? Di questo ci occuperemo più avanti quando parleremo del terzo polimero: RNA. 

lunedì 19 settembre 2011

XIV - Funzione del DNA. Introducendo il concetto di GENE.



Innumerevoli esperimenti nella seconda metà dell’ultimo secolo hanno dimostrato, al di sopra di ogni ragionevole dubbio, che il DNA contiene l’informazioni necessaria per sintetizzare tutte le proteine presenti in una cellula. Per capire meglio il significato di questa affermazione dobbiamo passare attraverso la definizione di una serie di concetti importanti, il primo dei quali è il concetto di GENE. Per semplicità consideriamo una cellula (ad esempio un batterio) con un singolo cromosoma ovvero con una singola molecola di DNA. Possiamo immaginare di suddividere la lunghissima molecola di DNA del cromosoma (qualche milione di coppie di basi) in tanti frammenti ognuno dei quali contiene l’informazione necessaria per sintetizzare una singola proteina. In prima approssimazione possiamo chiamare i singoli frammenti con il nome GENE. Per rimanere aderenti al nostro modello linguistico, è come se il DNA costituisse un libro di una biblioteca e il gene fosse un paragrafo del libro. Meglio ancora il libro/DNA è un codice di leggi e i paragrafi/geni sono i singoli articoli delle leggi. Il libro/DNA è un oggetto costituito da non solo dall’informazione ma anche dal supporto cartaceo su cui l’informazione è scritta, dalla copertina, dalla rilegatura. Lo possiamo prendere in mano, toccare. Il paragrafo/gene è un pezzo d’informazione che occupa una porzione di una pagina del libro. Possiamo cambiare l’impaginazione del libro, cambiare la copertina, cambiare le dimensioni dei caratteri e le dimensioni delle pagine. Il paragrafo occuperà posizioni differenti ma il suo contenuto informativo sarà identico. Analogamente, quello che importa in un GENE è la sequenza di nucleotidi perché come vedremo questa specifica la sequenza di aminoacidi della proteina. Da questa definizione è ovvio che GENE è un concetto astratto. Mentre nelle cellule esistono oggetti fisici ben identificabili come le molecole di DNA, i cromosomi e le proteine, il GENE è un concetto elaborato dalla mente umana per definire un qualcosa con un significato funzionale. In effetti, il concetto di GENE è stato sviluppato attraverso complicatissimi esperimenti di genetica prima ancora che si parlasse di sequenza di DNA e per molto tempo è rimasto qualcosa di definito solo da un punto di vista formale come un qualcosa che determina un carattere ereditabile dell’organismo. Un gene corrisponde ad una singola regione di DNA. L’opposto non è sempre vero. Una singola regione di DNA infatti può contenere più geni tra loro non separabili. Difficile da visualizzare vero? È come se potessero esistere più messaggi sovrapposti scritti in un unico libro e con le stesse lettere. Proprio per questo il concetto di gene è legato ad una funzione e non ad un oggetto, e la definizione di GENE è progressivamente cambiata (cambia anche oggi) per rendere conto di aspetti nuovi che emergono dalla ricerca. Tuttavia, come punto di partenza penso che sia corretto identificare con il termine GENE un frammento di DNA che codifica una proteina. Vedremo che questa idea di gene è molto limitativa ma vi garantisco che è utile per cominciare a focalizzare il problema. In altre parole ritengo che inizialmente si possa partire dal modello classico UN GENE – UNA PROTEINA tenendo però in mente che questo non è sempre vero.

giovedì 15 settembre 2011

XIII - Perché il DNA non è nudo?


Introducendo il concetto di cromosoma abbiamo detto che ogni molecola di DNA nelle cellule è ricoperta di numerose e diverse proteine. Perché il DNA non è nudo nelle cellule? Perché deve essere coperto di proteine? A che cosa servono queste proteine?
In biologia, come nella vita di tutti i giorni, esiste una forte relazione tra organizzazione strutturale (come è fatta una cosa/oggetto/molecola) e funzione (a cosa serve).
Esistono una serie di motivazioni funzionali che rendono conto di questa organizzazione strutturale in cui il DNA è ricoperto di proteine:

1)  Ogni nostra cellula contiene 1,5 metri di DNA. Tutto questo filo lunghissimo deve stare dentro ad un contenitore sferico (il nucleo della cellula) che ha un raggio di 5 micron ovvero di 5 millesimi di millimetro. Avete mai lottato con un cavo elettrico cercando di farlo stare in un cassetto? Se è tutto aggrovigliato può risultare un incubo. Quindi, due motivi sono la compattazione e l’esigenza di mettere ordine evitando la formazione di nodi indistricabili. La compattazione e l’ordine sono importanti anche durante la duplicazione del DNA e la divisione cellulare. Già non è facile duplicare una molecola di DNA. Può diventare un incubo se è piena di nodi. E poi se tutte le molecole sono annodate come fare a districarle e separarle quando la cellula si divide? Insomma le proteine aiutano a mettere ordine.

2) Il DNA è la molecola che contiene l’informazione. Non c’è da stupirsi che venga protetta molto accuratamente. Abbiamo detto che la struttura a doppia elica la rende la molecola più resistente di quella a singolo filamento proteggendo così l’informazione. Le proteine che ricoprono il DNA riducono ulteriormente la possibilità di rotture. Inoltre alcune proteine hanno il compito di duplicare la molecola di DNA, altre si occupano di ripararla quando si rompe, altre ancora di mantenere integra l’informazione. Un po’ come le formiche che si prendono cura della loro regina.

3) Il DNA è la molecola che contiene l’informazione. Bisogna leggere l’informazione e soprattutto bisogna sapere dove è l’informazione che bisogna leggere. Se non ci fossero proteine specifiche deputate a questa funzione il DNA non servirebbe assolutamente a nulla. E’ il lettore (ovvero le proteine) che dà un significato al libro. Provate a prendere un libro scritto in una lingua diversa dall’italiano magari in giapponese oppure in una lingua ormai non più usata, ad esempio un papiro egiziano. Vi sfido a comprendere qualcosa! Così se prendete il DNA di un batterio e lo infilate in una cellula umana state sicuri che il messaggio non verrà letto o se verrà letto qualcosa sarà probabilmente differente. Questo perché le sequenze di DNA che segnalano dove è l’informazione vengono riconosciute da specifiche proteine e sono differenti nelle cellule umane e nei batteri 

XII - DNA, cromosomi, sesso.

Abbiamo detto che una cellula contiene diverse migliaia di proteine differenti. Alcune sono presenti in poche copie nelle cellule altre in molte copie. Per cercare di avere un modello visivo pensiamo alla cellula come ad una casa: é piena di oggetti/proteine. Alcuni oggetti/proteine sono presenti in molti esemplari. Ad esempio avremo molti coltelli da cucina o molti bicchieri. Altri oggetti/proteina sono presenti in poche copie. Ad esempio uno o due letti. L’abbondanza di ogni singola proteina è in relazione alla sua funzione e può variare con le esigenze del momento. Al contrario, il contenuto in molecole di DNA è fisso e molto basso. In una cellula umana (se escludiamo il DNA mitocondriale) sono presenti solo 46 molecole di DNA molto lunghe per un totale di circa 3x109 coppie di basi. 

Ognuna di queste molecole di DNA è organizzata in una struttura complessa visibile al microscopio e detta CROMOSOMA. Un cromosoma è un oggetto che contiene una singola molecola di DNA legata a numerose molecole di proteine con funzioni differenti. Ogni cellula umana, tranne i gameti (ovuli e spermatozoi) contiene 46 cromosomi a due a due uguali, ovvero 23 coppie di cromosomi. Si dice che la cellula è diploide. I cromosomi vengono numerati da 1 a 23 in base alla lunghezza, dove il cromosoma 1 è quello più lungo. 



La coppia 23 è formata dai cromosomi sessuali e nella femmina è XX (due cromosomi uguali) mentre nel maschio è XY. I gameti (spermatozoi e ovuli) contengono un solo elemento di ogni coppia, ovvero 23 cromosomi, e sono aploidi. In particolare ogni gamete avrà un solo cromosoma sessuale. Nel caso dei gameti femminili, tutti gli ovuli sono portatori di un X. Al contrario metà degli spermatozoi portano un X e metà portano un Y. Quando un ovulo viene fecondato da uno spermatozoo si riforma una cellula con 23 coppie di cromosomi dove 1 elemento di ogni coppia è di origine paterna e uno di origine materna. Se un ovulo viene fecondato da uno spermatozoo che porta il cromosoma sessuale X si ricostituirà una coppia di cromosomi X e l’individuo si svilupperà in una femmina. Se lo spermatozoo porta un cromosoma Y si formerà la coppia XY con la conseguente nascita di un maschio. Alterazioni nel numero e nella struttura dei cromosomi vogliono dire alterazioni nel numero e nella dimensione delle molecole di DNA e sono associati a malattie genetiche e a tumori. Il caso più noto di malattia genetica dovuta ad alterazione nel numero di cromosomi è quello della trisomia (tre copie) del cromosoma 21 che è associata alla sindrome di Down (dal nome del medico che ha descritto per primo questa sindrome). I bambini Down hanno in ogni cellula dell’organismo tre copie del cromosoma 21, mentre tutti gli altri cromosomi sono correttamente presenti in due copie.