imprimir | pdf             intranet                                                                                                            

La edad de oro

            

La edad de oro del estudio de la variación genética

El vertido incesante y en continua expansión de secuencias nucleotídicas de distintos individuos y especies en las bases de datos moleculares durante los últimos años ha conducido a la presente edad de oro del estudio de la variación genética y a la vindicación de la genética de poblaciones como ciencia fundamental de nuestro tiempo. La descripción y explicación de la variación genética dentro y entre poblaciones, el objetivo de la genética de poblaciones desde sus orígenes1, ha irrumpido en la genómica comparativa2 y funcional3, en los estudios de asociación genotipo-fenotipo4, en la genómica personalizada5, y un sinfín de otros campos hasta convertirla en una de las líneas principales de la investigación científica actual6. El conocimiento de la variación genética de las poblaciones humanas y de otras especies modelo prometen desvelar la base genética de la diversidad fenotípica, con todas las implicaciones potenciales que tienen para la biología básica, la salud y la sociedad7.

La evolución es en esencia un proceso de origen y sustitución de variantes genéticas en el seno de las poblaciones y la genética de poblaciones proporciona el marco explicativo del proceso evolutivo. Cuatro fuerzas fundamentales bien establecidas son los factores responsables de la evolución molecular: la tasa de mutación, la tasa de recombinación, la deriva genética y la selección natural8-9. La dinámica que sigue al surgimiento y la pérdida de la variación retiene información histórica en forma de polimorfismo intrapoblacional y divergencia entre poblaciones. El objeto de la genética de poblaciones es inferir las fuerzas poblacionales que han dado lugar a los patrones de variación genética.

La teoría neutralista propuesta por M. Kimura10-11 juega el papel de modelo nulo, pues define la dinámica de la variación genética cuando las distintas variantes son selectivamente neutras. Kimura demuestra que bajo este supuesto, el polimorfismo y la divergencia están gobernados por la tasa de mutación y la deriva genética. La variación genética en una población en un momento dado es una instantánea de un proceso estacionario de fijación de alelos neutros, cuya tasa es igual a la tasa de mutación. Una deducción clave de la teoría neutralista es que las variantes que se fijan en las poblaciones, y por tanto producen la divergencia, son una muestra aleatoria de las variantes neutras que fluctúan como polimorfismos. La desviación de esta aleatoriedad por acción de la selección deja firmas moleculares características en el genoma que dependen del tipo y la intensidad de selección y del efecto de arrastre por ligamiento. Esta desviación es el fundamento de las múltiples pruebas que se han desarrollado para la detección de la huella dejada por la selección12. Aquéllas que comparan datos de polimorfismo con la divergencia, como la prueba de McDonald y Kreitman13, son las de mayor potencia14. En general, las posiciones o regiones sometidas a selección en el genoma deben tener una importancia funcional, por lo que la búsqueda de estas posiciones es una forma de descubrir regiones funcionales en el genoma. Pequeñas diferencias selectivas pueden, a escala de los periodos evolutivos, dejar huellas apreciables, de modo que la comparación de secuencias nucleotídicas como aproximación para detectar regiones funcionales tiene una sensibilidad y precisión comparable o superior al análisis experimental2

Durante décadas la investigación en genética de poblaciones ha intentado cuantificar la importancia relativa de la selección versus la deriva en los patrones de variación observados en las poblaciones naturales. Las primeras estimas basadas en datos electroforéticos mostraron la ubicuidad de la variación, pero no resolvieron las causas de su mantenimiento1,15. Los primeros estudios de variación nucleotídica16 se centraron en los genes enzimáticos que habían sido estudiados por electroforesis, y permitieron describir la variación inambiguamente en las diferentes regiones de un gen, exones e intrones, sitios sinónimos y no sinónimos. El énfasis inicial se dirigió a la búsqueda de ejemplos de genes sometidos a selección adaptativa. Actualmente, el interés se ha desplazado al análisis de las regiones no codificadoras. Con el aumento explosivo del número de secuencias nucleotídicas, la genética de poblaciones ha dejado de ser una ciencia empíricamente insuficiente1,15, y es hoy más que nunca una actividad interdisciplinar, donde se integran herramientas bioinformáticas de minería y gestión de datos a gran escala, modelos teóricos y estadísticos de interpretación, y avanzadas técnicas moleculares de generación masiva de secuencias.  Una de las grandes cuestiones actuales de la genética de poblaciones es si la selección tiene la eficacia suficiente para superar a la deriva como fuerza preponderante. En una de las hipótesis más sugerentes de los últimos tiempos, M. Lynch9 propone que no sólo la variación genética, sino la complejidad misma del genoma es consecuencia de procesos genéticos poblacionales: la complejidad genómica de los eucariotas se iniciaría por procesos no adaptivos, los que a su vez proveerían un nuevo sustrato para la evolución secundaria de la complejidad fenotípica por selección natural.

 

 

Genómica de poblaciones

 

Una nueva dimensión a los estudios de la variación genética la proporciona la abundancia de genomas completos que cada vez más se están descifrando17. Los estudios genéticos poblacionales hasta la fecha se han efectuado a partir de muestras fragmentarias y no aleatorias de los genomas, proporcionando una visión parcial y con frecuencia sesgada de los procesos poblacionales. En especies con genomas de referencia bien anotados, es posible obtener secuencias de calidad a partir de la secuenciación aleatoria, por lo que en un horizonte relativamente próximo podrán analizarse rutinariamente las secuencias genómicas completas de individuos de una especie.

 

Mediante el análisis de la variación en genomas completos es posible estudiar los patrones de variación de la secuencia a lo largo de todo el genoma dentro y entre especies próximas. Esta información suministrará una visión global de la importancia relativa y de la interacción de la mutación, recombinación, selección natural y la deriva genética en la evolución, permitiendo correlacionar los gradientes o cambios abruptos de variación a lo largo del cromosoma con tasas variables de mutación o con distintos regímenes de selección en las diferentes regiones del genoma. La genómica de poblaciones proporciona el marco esencial para entender y clarificar las rutas que la evolución puede explotar en distintos contextos y en su relación con el fenotipo.

 

La descripción de la variación a escala genómica ha empezado ya en algunos organismos. En levaduras18 se ha efectuado un estudio de genómica de poblaciones de 70 líneas de Saccharomyces cerevisiae y su especie más próxima, Saccharomyces paradoxus. La variación en contenido génico, SNPs, indels, número de copias y elementos transponibles ha suministrado una información sin precedentes de la evolución de los diferentes linajes.

 

La primera aproximación a la genómica de poblaciones en una especie de Drosophila se ha llevado a cabo en Drosophila simulans19, una especie íntimamente relacionada con D. melanogaster. Aunque este estudio ha aportado la primera descripción de los patrones generales de variación a lo largo del genoma de esta especie, presenta sin embargo varias limitaciones, pues el número medio de genomas analizados es de 3,90. Este número es manifiestamente insuficiente para un estudio de variación, por lo que muchas regiones, repetitivas y divergentes, no se pudieron analizar. Por otra parte las líneas secuenciadas no eran una muestra aleatoria de una población, por lo que es difícil interpretar las comparaciones de las observaciones con las predicciones teóricas. Como reconocen los autores, es un estudio preliminar que requiere más y mejores datos.

Varios estudios de variación de SNPs a lo largo del genoma se han hecho en la especie humana a partir de los datos de HapMap20,21, basados en el genotipado de SNPs. Aunque hay una iniciativa de secuenciación de 1000 genomas humanos22, hasta la fecha no hay ningún estudio con las secuencias completas de genomas humanos en el nivel poblacional.

 

 

The Drosophila genetic reference panel

 

The US National Human Genome Research Institute en Bethesda ha aprobado financiar con un presupuesto aprox. de 4 millones de dólares la propuesta del Drosophila genetic reference panel23, en la que un grupo de investigadores, encabezado por la Dra. Trudy Mackay, de la Universidad del Estado de Carolina del Norte, proponen la secuenciación de 192 genomas de una muestra al azar de individuos de D. melanogaster tomada de una población natural de Raleigh, Carolina del Norte. La financiación sólo cubre la secuenciación, no la gestión ni el análisis de los datos que realizarán los investigadores del consorcio, que deben buscar sus propias fuentes de financiación.

 

A partir de los individuos muestreados, se han obtenido 192 isolíneas mediante cruces hermano-hermana durante 20 generaciones. Estas líneas se mantendrán permanentemente para que sirvan como biblioteca genómica viviente. De las líneas se ha obtenido abundante información sobre fenotipos complejos. Los objetivos principales de este proyecto23-24 son: (1)  Crear un recurso para la comunidad científica para la cartografía de loci de rasgos cuantitativos (QTL). (2) Crear un recurso del polimorfismo genético común de Drosophila (SNP e Indels) que permitirá, entre otros fines, el análisis genómico poblacional. (3) Crear un banco de pruebas de estudios de asociación en un sistema mucho más manejable que los estudios que se llevan a cabo en la especie humana. Se propone una aproximación genómica, sistémica, para la comprensión de la arquitectura genética de los rasgos complejos en un organismo genético modelo y económico. Se espera que la etapa de secuenciación haya terminado a finales de 2009, aunque las secuencias se irán depositando conforme se obtengan, y pronto se dispondrá de las primeras.

 

Dentro de este consorcio, hemos asumido la tarea de crear y mantener la base de datos del mapa de alta resolución de polimorfismos del genoma, integrándola dentro de la base de datos de Drosophila Polymorphism Data Base (DPDB)25-26 ya existente. Nuestro equipo también participará en el análisis genómico poblacional de la variación genómica del polimorfismo entre líneas y la divergencia con otros genomas de especies próximas a D. melanogaster, especialmente D. simulans y D. yakuba27.

No existe una descripción detallada de la escala física de variación en el polimorfismo y la divergencia en D. melanogaster ni tampoco se sabe cómo esta variación se relaciona con la variación en las tasas de mutación,  recombinación, densidad génica, selección natural y otros factores. El proyecto que se propone suministrará el estudio más completo de genómica poblacional disponible hasta la fecha de una especie animal, y servirá de modelo para los estudios genómicos de otras especies, incluida la especie humana. Los abundantes recursos de información genómica que se obtendrán servirán de punto de partida de futuros estudios, como la oportunidad única para cartografiar rasgos fenotípicos cuantitativos, otro de los objetivos principales de la propuesta.

 

Referencias

1. Lewontin, R.1974. The Genetic Basis of Evolutionary Change, Columbia University Press.

2. Kellis, M., Patterson, N., Endrizzi, M., Birren, B. y Lander, E. S. 2003. Sequencing and comparison of yeast species to identify genes and regulatory elements. Nature 423 : 241-54

3. Stark et al. 2007. Discovery of functional elements in 12 Drosophila genomes using evolutionary signatures. Nature 450:219-232.

4. Donnelly, P. 2008. Progress and challenges in genome-wide association studies in humans. Nature 456: 728-731.

5. Nature editorial. My genome. So what? Nature 456: 1.

6. Pennisi, E.  2007. Breakthrough of the year: Human Genetic Variation. Science 318: 1842-1843.

7. Colllins, F. 2003. A vision for the future of genomics research. Nature 422: 835-847

8. Wright, S. 1931. Evolution in Mendelian populations. Genetics 16: 97–159.

9. Lynch, M. 2007. The Origins of Genome Architecture. Sinauer.

10. Kimura, M. 1968. Evolutionary rate at the molecular level. Nature 217: 624–626.

11. Kimura, M. 1983. The Neutral Theory of Molecular Evolution. Cambridge University Press, Cambridge.

12. Nielsen, R. 2005. Molecular signatures of natural selection. Annu. Rev. Genet. 39:197-218.

13. McDonald y Kreitman. 1991. Adaptative protein evolution at ADH locus in Drosophila. Nature 351:652-654.

14. Zhai, W., Nielsen R., and Slatkin, M. 2009. An Investigation of the Statistical Power of Neutrality Tests Based on Comparative and Population Genetic Data. Mol Biol. Evol. 26:273-283.

15. Lewontin, R. 2002. Directions in Evolutionary Biology. Annu. Rev Genet. 36: 1-18.

16. Kreitman M. 1983. Nucleotide polymorphism at the alcohol dehydrogenase locus of Drosophila melanogaster. Nature. 304: 412-417.

17. Gold genomes (http://www.genomesonline.org/)

18. Carter, D. et al. 2009. Population genomics of domestic and wild yeasts. Available from Nature Precedings http://hdl.handle.net/10101/npre.2008.1988.1

19. Begun DJ, Holloway AK, Stevens K, Hillier LW, Poh YP, et al. 2007. Population Genomics: Whole-Genome Analysis of Polymorphism and Divergence in Drosophila simulans. PLoS Biol 5(11): e310 doi:10.1371/journal.pbio.0050310

20. The International HapMap Consortium. 2005. A Haplotype Map of the Human Genome. Nature 437: 1299-1320.

21. The International HapMap Consortium. 2007. A second generation human haplotype map of over 3.1 million SNPs. Nature 449: 851-861.

22. The 1000 Genomes Project: a deep catalog of Human Genetic Variation (http://www.1000genomes.org/)

23. Drosophila Genetic Reference Panel White Paper 2008 http://flybase.org/static_pages/news/whitepapers/Drosophila_Genetic_Reference_Panel_Whitepaper.pdf

24. Ledford H., 2008. Population genomics for fruitflies. Nature 453: 1154-1155.

25. Casillas, S., Petit, N. and Barbadilla, A. 2005. DPDB: a database for the storage, representation and analysis of polymorphism in the Drosophila genus. Bioinformatics 21 (Suppl.2): ii26-ii30.

26. Casillas, S., R. Egea, N. Petit, C. M. Bergman and A. Barbadilla. 2007. Drosophila Polymorphism Database (DPDB): a portal for nucleotide polymorphism in Drosophila. Fly 1(4): 205-211.

27. Drosophila 12 Genomes Consortium. 2007. Evolution of genes and genomes on the Drosophila phylogeny. Nature 450: 203-218.

28. Andolfatto P, 2005. Adaptive evolution of non-coding DNA in Drosophila. Nature 437: 1149-1152.

29. Casillas, S., A. Barbadilla and C. Bergman. 2007. Purifying selection maintains highly conserved noncoding sequences in Drosophila. Mol Biol Evol 2007 24(10):2222-2234.

30. Siepel, a., g. Bejerano, j. S. Pedersen, a. S. Hinrichs, M. Hou et al. 2005. Evolutionarily conserved elements in vertebrate, insect, worm, and yeast genomes. Genome Res 15(8): 1034-1050.

31. Casillas, S & A. Barbadilla. 2004. PDA: a pipeline to explore and estimate polymorphism in large DNA data  bases. Nucleic Acid Research, Web Server issue 32 (Web Server issue): W166-W169.

32. Casillas, S & A. Barbadilla. 2006. PDA v.2: improving the exploration and estimation of nucleotide polymorphism in large data sets of heterogeneous DNA. Nucl. Acids Res. 2006 34 (Web Server issue): W632-W634.

33. Egea, R, S. Casillas, E. Fernández, MA Senar & A. Barbadilla. 2007. MamPol: a database of nucleotide polymorphism in the Mammalia class. Nucl. Acids Res., 35 (Database issue): D624-D629.

34. Egea, R., S. Casillas and A. Barbadilla. 2008. Standard & Generalized McDonald and Kreitman test: a website to detect selection by comparing different classes of DNA sites. Nucleic Acids Res. 36 (Web Server issue): W157–W162.

35. Matthews, K.A., Kaufman, T.C. and Gelbart, W.M. 2005. Research resources for Drosophila: the expanding universe. Nat. Rev. Genet., 6: 179-193.

36. Costello, J.C., A.C. Cash, M.M. Dalkilic y J. R. Andrews. 2008. Data pushing – A fly-centric guide to bioinformatics tools. Fly 2(1): 1-18.

37. Adams M.D., S.E. Celniker, R.A. Holt, C.A. Evans, J.D. Gocayne et al. 2000. The genome sequence of Drosophila melanogaster. Science 287(5461): 2185-2195.

38. Misra, S., M.A. Crosby, C.J. Mungall, B.B. Matthews, K.S. Campbell et al. 2002. Annotation of the Drosophila melanogaster euchromatic genome: a systematic review. Genome Biol 3(12): RESEARCH0083

39. Zweig, A.S., D. Karolchik, R.M. Kuhn, D. Haussler and W.J. Kent. 2008. UCSC genome browser tutorial. Genomics 92(2): 75-84.

40. Kuhn, R.M., D. Karolchik, A.S. Zweig, T. Wang, K.E. Smith et al. 2009. The UCSC Genome Browser Database: update 2009. Nucleic Acids Res 37(Database issue): D755-761

41. Piganeau, G. and A. Eyre-Walker. 2003. Estimating the distribution of fitness effects from DNA sequence data: implications for the molecular clock. Proc Natl Acad Sci U S A 100(18): 10335-10340.

42. Kryukov, G.V., S. Schmidt and S. Sunyaev .2005. Small fitness effect of mutations in highly conserved non-coding regions. Hum Mol Genet 14(15): 2221-2229.

43. Smith, N. G. and A. Eyre-Walker. 2002. Adaptive protein evolution in Drosophila. Nature 415(6875): 1022-1024.

44. Halligan, D.L. and P.D. Keightley. 2006. Ubiquitous selective constraints in the Drosophila genome revealed by a genome-wide interspecies comparison. Genome Res 16(7): 875-884.

45. Halfon, M.S., S.M. Gallo and C.M. Bergman. 2008. REDfly 2.0: an integrated database of cis-regulatory modules and transcription factor binding sites in Drosophila. Nucleic Acids Res 36(Database issue): D594-598.

46. Ludwig, M. Z., C. Bergman, N. H. Patel and M. Kreitman. 2000. Evidence for stabilizing selection in a eukaryotic enhancer element. Nature 403(6769): 564-567.

47. Petit, N., S Casillas, A. Ruiz and A. Barbadilla  2007. Protein polymorphism is negatively correlated with conservation of intronic sequences and complexity of expression patterns in Drosophila melanogaster.  Journal of Molecular Evolution 64: 511-518.

48. Bárbara Negre, Sònia Casillas, Magali Suzanne, Ernesto Sánchez-Herrero, Michael Akam, Michael Nefedov, Antonio Barbadilla, Pieter de Jong and Alfredo Ruiz. 2005. Conservation of regulatory sequences and gene expression patterns in the disintegrating Drosophila Hox gene complex. Genome Research 15: 692-700

49. Casillas, S, B Negre, A Barbadilla and A Ruiz. 2006. Fast sequence evolution of Hox and Hox-derived genes in the genus Drosophila. BMC Evolutionary Biology  6:106.

50. Petit, N. and A. Barbadilla. 2008. Selection efficiency and effective population size in Drosophila species. J. Evol. Biology  10.1111/j.1420-9101.2008.01672.x

51. Petit, N. and A. Barbadilla (2009). Selection efficiency and effective population size in Drosophila species. J. Evol. Biology 22: 515-526. 



 

 

Presentación Web | ¿Qué es la Genética de Poblaciones? | Conceptos | Selección natural | La edad de oro | Simulaciones | Artículos y libros | Ejercicios | Nombres de la GP | Glosario | Trabajos clásicos | Enlaces | Lo último en GP | Autor | 





Genética de Poblaciones
Conceptos básicos, ensayos, ejercicios, simulaciones, glosario y otros recursos docentes
Prof. Antonio Barbadilla
Universitat Autònoma de Barcelona


Enjoy learning about Genetics, Biological Evolution and Bioinformatics!