En genética, un estudio de asociación del genoma completo (en inglés, GWAS ( Genome-wide association study) o WGAS (Whole genome association study) es un análisis de una variación genética a lo largo de todo el genoma humano con el objetivo de identificar su asociación a un rasgo observable. Los GWAS suelen centrarse en asociaciones entre los polimorfismos de un solo nucleótido (SNPs) y rasgos como las principales enfermedades.
Para ello se deben estudiar una gran cantidad de individuos, de modo que se puedan comparar datos genéticos entre ellos. De este modo, al comparar los datos genéticos obtenidos de las secuenciaciones de los genomas de diferentes individuos, podemos hallar genes presuntamente ligados a enfermedades o caracteres. Por ejemplo, podemos contrastar cómo quizá se produce la aparición de uno o varios SNPs (variación de un solo par de bases) o una deleción, repetición, etc. en una secuencia del genoma siempre que aparece el mismo fenotipo, pudiendo así concluir que este cambio a nivel genético es probable que se corresponda con un rasgo.
Estas variaciones son asociadas a distintos rasgos, por ejemplo, a enfermedades. En humanos, esta técnica ha permitido descubrir que ciertos genes están asociados a enfermedades como la degeneración macular asociada a la edad y la diabetes. En el caso de la especie humana, se estudian miles de individuos para hallar polimorfismos de nucleótido simple o SNPs (single-nucleotide polymorphisms, en inglés). Alrededor de 600 estudios de asociación del genoma completo llevados a cabo en humanos han examinado 150 rasgos y enfermedades, y han encontrado unos 800 SNPs asociados a ellas.
Si ciertas variaciones genéticas son más frecuentes en personas con la enfermedad, se dice que estas variaciones están "asociadas" con esa enfermedad. Estas variaciones son entonces consideradas como señalizadores de la región del genoma humano donde probablemente esté el problema causante de la enfermedad. Se emplean dos estrategias para buscar mutaciones asociadas a la enfermedad: desde la hipótesis o sin hipótesis previa. La estrategia desde la hipótesis comienza con la formulación de la hipótesis de que un determinado gen puede estar asociado con una determinada enfermedad, y trata de buscar esa asociación. La estrategia sin hipótesis previa emplea métodos de "fuerza bruta" para escanear todo el genoma y posteriormente comprobar si algunos genes muestran esa asociación. Los estudios de asociación del genoma completo emplean generalmente la estrategia sin hipótesis previa.
Sorprendentemente, la mayoría de las variaciones de SNPs asociadas con enfermedades no se presentan en las regiones codificantes del ADN, sino que normalmente se sitúan en las amplias regiones no codificantes intergénicas o en los intrones que se extraen de la secuencia de ADN cuando las proteínas son procesadas. Estas son presumiblemente secuencias de ADN que controlan otros genes, pero normalmente su función proteica no se conoce.
Aunque los estudios GWAS mayoritariamente se ha realizado para identificar SNPs asociados a enfermedades comunes, también podrían identificar variables genéticas asociadas a caracteres cuantitativos como la estatura o el intervalo QT cardiaco.
Estos estudios suelen basarse en la comparación de dos grandes grupos de individuos, uno formado por personas sanas (que se tomará como control); y otro compuesto por personas afectadas por la enfermedad en cuestión, que será el grupo de casos. Se estudian la mayoría de las SNPs conocidas y más comunes en todos los individuos. El número de SNPs dependerá de la tecnología que se emplee para el estudio, pero normalmente su número oscila alrededor del millón.
Para cada SNPs, se analiza si su frecuencia alélica varía de forma significativa entre el grupo control y el grupo de casos; cuando se da esta situación, se determina que la SNP está probablemente relacionada con la enfermedad. Todo el análisis estadístico se realiza con la ayuda de software bioinformático; además, hay que tener en cuenta varias variables de confusión a la hora de interpretar los resultados. Entre ellas se encuentran el sexo y la edad, así como la el origen geográfica y étnico de los individuos, ya que muchas variaciones genéticas están asociadas con la localización geográfica y/o la historia de las poblaciones.
La mayoría de los estudios GWAS, al menos los realizados hasta un pasado reciente (2018), se han basado en el diseño de asociación «casos y controles», en los que se compara las frecuencias alélicas en el grupo de interés con las frecuencias alélicas en el grupo de control (de estar referidos a una enfermedad: grupo de individuos afectados y grupo de no afectados por la enfermedad). Estos estudios tienen menos requerimientos, siendo así menos costosos, que los realizados mediante otros diseños, especialmente si se pueden constituir fácilmente los grupos con un número suficiente de muestras. No obstante, este método ha mostrado debilidades si el número de participantes no es lo suficientemente elevado o el grupo de casos no es representativo, o no se siguen con meticulosidad las metodologías establecidas; algo que en ocasiones ha ocurrido en este tipo de estudios, produciéndose en ellos sesgos importantes comprometiendo los resultados. Actualmente (2018) estos estudios de asociación están principalmente indicados para el estudio de enfermedades raras en los que otros diseños son poco viables.
Existen otros dos diseños (2018): la selección de cohortes y la selección de tríos. Para la selección de cohortes, se estudia la aparición de la enfermedad en un grupo elegido a partir de una población, de esta forma se estima directamente el riesgo y se obtienen menos sesgos, pero se requiere de grupos muy grandes, mucho presupuesto, un tiempo muy largo y no es adecuado para el estudio de enfermedades raras. En cuanto a la selección de tríos, se eligen padres e hijo afecto y se buscan alelos que se hereden en más de la mitad de los hijos afectos, de esta forma, no se requiere el control de las características de la población, es más sencillo el estudio estadístico de los datos y se puede comprobar la herencia mendeliana; sin embargo, es difícil buscar casos para enfermedades de edad adulta.
Muchos estudios GWAS utilizan etapas que involucran diferentes diseños para minimizar el riego de falsos positivos.
Los GWA tienen diversos problemas y limitaciones que pueden subsanarse mediante un control de calidad y un diseño adecuado del estudio. Entre los problemas más comunes se encuentran la selección dificultosa de los pacientes con respecto al fenotipo de la enfermedad que se quiere estudiar, que la muestra tenga un tamaño insuficiente ya que se requiere el análisis de miles de casos y controles; y el control de la estratificación de la población. A tal efecto se ha determinado que el enfoque WGA puede ser problemático debido a la enorme cantidad de pruebas estadísticas que requiere, ya que presentan un potencial sin precedentes para dar falsos positivos,
por lo que se requiere un sistema informático capaz de manejar correctamente esta gran cantidad de información.Además de estos por problemas que pueden prevenirse, los GWA han sido objeto de críticas relacionadas con su fundamento, principalmente debido a su suposición de que las variaciones genéticas comunes juegan un papel importante a la hora de explicar la variación hereditaria de las enfermedad más frecuentes. Estos estudios tienen en cuenta los SNPs de forma individual y dejan de lado sus efectos combinatorios. Estos aspectos han llevado a muchos a pensar que los GWA tradicionales no valen la pena por la gran cantidad de dinero que es necesario invertir en ellos.
Hay que tener en cuenta, al realizar estos estudios, que hay una parte de la población con el mismo fenotipo o carácter estudiado que no puede ser explicado o que no presentan variantes comunes asociadas al mismo, pero que pueden presentar variantes raras, de baja frecuencia, que no pueden ser detectadas en el estudio. Una solución, en este caso,es el que se ha comentado anteriormente: incrementar el tamaño muestral, con el objetivo de detectar un mayor número de individuos con esas variantes poco frecuentes, sin embargo esto no es sencillo; un ejemplo lo tenemos en los alelos que presentan una herencia recesiva y que en poblaciones de gran tamaño quedan "diluidos" entre los heterocigotos. Una segunda opción es realizar estos estudios en poblaciones aisladas genéticamente, donde es frecuente la endogamia y estos alelos raros verán incrementadas sus frecuencias y podrán ser más fácilmente detectados con una muestra de menor tamaño.
Se ha sugerido como estrategia alternativa los análisis de ligamiento pero, en la actualidad, con la rápida disminución del precio de la secuenciación completa del genoma,ésta se está convirtiendo en una alternativa realista a los de los estudios de GWA basadas en arrays, aunque muchos lo considerarían una técnica distinta. De cualquier forma, la secuenciación de alto rendimiento tiene el potencial para esquivar algunas de las limitaciones de los GWA tradicionales.
Existe millones de variantes genéticas en humanos y la interpretación de sus efectos funcionales en los caracteres humanos es uno de los mayores retos en la genómica.
Los expresión loci de rasgos cuantitativos (expression quantitative trait loci (eQTLS)) son loci en el DNA que actúan como elementos regulatorios de la expresión génica, la variación de estos eQTLs y sus consecuencias a nivel de expresión añade una dimensión funcional a nuestros conocimientos, la cual puede ser usada en estudios de enfermedades.
Una proporción de las variantes descritas en los GWAS son eQTLs o trQTLs, por lo que, la integración del genoma secuenciado, eQTLs y el fenotipo celular ayuda a comprender los genes causales de la enfermedad, las variantes genéticas causales que subyacen a los GWAS y los procesos biológicos que intervienen en estos.
Una aplicación clara de este tipo de estudios es la asociación de un síntoma patológico o patología con un determinado locus. Un ejemplo de ellos son los estudios de asociación de la alergia a determinados alérgenos con la susceptibilidad a loci.
No podemos olvidar que también pueden encontrarse asociaciones con loci que confieren ventajas o protección frente a un posible rasgo patológico. Un ejemplo lo encontramos en un estudio reciente publicado en la revista Nature, en el que tras secuenciar el genoma de 2120 individuos de la isla de Cerdeña (considerada dicha población como aislado genético), se realizaron estudios de asociación de las variantes genéticas raras, con el perfil lipídico y marcadores de inflamación dentro de la población. Así pudieron encontrar, entre otros, una variante en el gen APOA5 (Arg282Ser) que se asociaba a menores niveles de triglicéridos en el suero de sus portadores, lo que sugiere un posible papel protector frente a enfermedades cardiovasculares. Otro ejemplo sería el Proyecto UK10K (10.000 genomas de Reino Unido), en el que se combinan estudios WGS (Secuenciación del Genoma Completo) y GWAS para intentar identificar variantes genéticas raras o poco frecuentes relacionadas con problemas como la obesidad, el autismo, la esquizofenia o algunas enfermedades raras.
La asociación de un locus a una determinada patología nos permite realizar un seguimientos más completo a los pacientes que tengan presente este alelo de riesgo y por tanto nos permitirá un diagnóstico precoz de muchas enfermedades que puede salvar vidas como es el caso del diagnóstico precoz en cáncer de páncreas.
En la revista Nature, se ha publicado un artículo que se basa en el GWAS con el objetivo de determinar y encontrar cuantos loci genéticos están asociados con el peso al nacer. Gracias a este tipo de análisis genómico se han identificado 60 loci que están relacionados, y ha permitido concluir que existe una fuerte correlación entre bajo peso al nacer y la probabilidad de padecer enfermedades metabólicas en el adulto.
También a través de GWAS se llevó a cabo el estudio de genes que podían estar relacionados con el volumen intracraneal de las personas, descubriéndose 5 loci anteriormente desconocidos (6q21, 10q24, 3q28, 12q14, 12q23). Este trabajo, publicado en la revista Nature, permitió además establecer relaciones entre dicho volumen intracraneal y otros rasgos antropométricos, función cognitiva, enfermedades neurodegenerativas (Parkinson), etc.
De igual modo, también se ha logrado determinar mediante Gwas en un estudio publicado en la revista Nature Genetics en 2018 la existencia de 190 nuevos loci relacionados con la inteligencia que suman un total de 205 loci con los previamente descubiertos y, así mismo, 939 genes nuevos para un total de 1016 genes relacionados con la inteligencia. De esta manera, también se ha podido establecer que dichos genes asociados se encuentran mayormente expresados en el cerebro, específicamente en tejido neuronal estriatal y piramidal del hipocampo.
Mediante Gwas también se pueden estudiar genes que pueden estar relacionados con el comportamiento humano reproductivo, mediante la identificación de determinados loci que influyen en la actitud de las personas en referencia a la reproducción. En la revista Nature 12 loci mediante GWAS, localizados en los cromosomas 1,2,3,5,6,7,8 y 20, que presentaban una función potencial en la reproducción y la fertilidad.
se publicó un artículo en el que se identificaronEn un estudio publicado en la revista Nature Communications en 2019, se presentan los resultados de un extenso GWAS realizado sobre población de Reino Unido con ascendencia europea, que reveló la asociación de 42 loci a lo largo del genoma humano relacionados con la somnolencia diurna de los individuos y que además, agrupaban a los individuos en 2 subtipos diferentes: propensión al sueño y fragmentación del sueño.
En otro estudio GWAS publicado en 2019 en la revista Nature Genetics, se identifican nuevos loci y vías de señalización implicadas en el riesgo de Alzheimer. El meta-análisis es llevado a cabo en un total de 455.000 personas europeas de diferentes cohortes, entre las cuales se incluyen pacientes con Alzheimer o Alzheimer-by-proxy y controles o controles-by-proxy, con el fin de ampliar el tamaño muestral. Esto permite a los autores identificar 29 loci de riesgo, de los cuales 9 aún no se habían asociado al Alzheimer. Asimismo, se observa que estos loci de riesgo afectan a 215 genes, de los cuales 16 fueron identificados mediante las cuatro estrategias de mapeo génico empleadas en este artículo. Por último, los autores encuentran que estos genes están altamente expresados en tejidos y tipos celulares relacionados con el sistema inmune (bazo, hígado y microglía) y están implicados en procesos lipídicos y en la degradación de proteínas precursoras amiloides, fortaleciendo la hipótesis de que cambios lipídicos podrían estar implicados en la patogénesis del Alzheimer. Por todo ello, estos resultados obtenidos en este estudio GWAS sugieren nuevos genes prometedores sobre los que realizar futuros experimentos, desarrollar fármacos o estratificar pacientes.
El último experimento mediante el estudio de la asociación del genoma completo ha sido publicado en enero de 2020, en la revista The American Journal of Psychiatry, en el que se analizaron casi 200.000 genomas de participantes en el "Million Veteran Program", una de las bases de datos genéticas más grandes del mundo. Este estudio tenía como objetivo examinar la arquitectura genética de la ansiedad y sus síntomas. Los autores han identificado 5 señales significantes en todo el genoma para americanos europeos, y 1 para los afroamericanos. Los resultados también evidenciaron la correlación genética entre la ansiedad, depresión y neuroticismo.
Además de sus aplicaciones en humanos, vinculadas sobre todo al campo de la medicina, los GWAS se han utilizado en animales domésticos
y en plantas de interés agrícola, con objetivo de identificar loci relacionados con características valiosas desde el punto de vista productivo. Entre otros ejemplos, en ganado se han hecho GWAS estudiando la heredabilidad de los rasgos relacionados con la calidad del producto, y también se ha estudiando la resistencia a enfermedades; mientras, en plantas se pueden encontrar estudios de asociación centrados en los loci que controlan la producción de biomasa. También se han realizado estudios GWAS en enfermedades cardíacas. Un estudio de meta-análisis realizado en 2018 reveló el descubrimiento de 70 nuevos loci asociados a fibrilación auricular. Se identificaron diferentes variantes asociadas a genes que codifican para factores de transcripción, como TBX3 y TBX5, NKX2-5 o PITX2, implicados en la regulación de la conducción cardíaca, la modulación de canales iónicos y en desarrollo cardíaco. También se han identificado nuevos genes implicados en taquicardia (CASQ2) o asociados a una alteración en la comunicación de cardiomiocitos (PKP2).
Escribe un comentario o lo que quieras sobre GWAS (directo, no tienes que registrarte)
Comentarios
(de más nuevos a más antiguos)