Información

¿Cómo puedo encontrar el SNP de un gen más estudiado?

¿Cómo puedo encontrar el SNP de un gen más estudiado?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

¿Cómo puedo encontrar el SNP más estudiado de un gen y las enfermedades con las que se ha relacionado el SNP más estudiado?

Busco en la base de datos dbSNP pero no puedo encontrarlo.

Cual es el proceso


¿Puede proporcionar el gen de interés?

Por lo general, puede buscar en Entrez el símbolo del gen en la base de datos dbSNP, que abrirá una página NCBI Entrez para los SNP ubicados en el gen y también dará una indicación de su importancia clínica (benigna o no).

Alternativamente, si tiene una enfermedad específica en mente, puede consultar bases de datos más específicas para un SNP, como COSMIC para SNP relacionados con el cáncer.

Por último, simplemente buscar en Google el gen de interés (por ejemplo, "EZH2 SNP") en Google Scholar mostrará artículos que presentan SNP de interés.

Alguna combinación de esos métodos debería producir lo que desea, pero podría proporcionar una mejor respuesta con más información.


La base genética del tamaño en perros de compañía: el estudio de la variación genética cuantitativa en una práctica de laboratorio de pregrado

La enseñanza de la variación genética cuantitativa en el entorno práctico del laboratorio de pregrado puede ser difícil ya que, para fenotipos cuantitativos que están bajo el control de múltiples loci, la detección de diferencias fenotípicas causadas por variantes individuales es problemática sin muestras grandes, poco práctico en tales clases. Los perros de compañía proporcionan un claro ejemplo de variación genética cuantitativa con razas individuales que varían en tamaño de 1 a 70 kg de peso, pero con poca variabilidad intraraza. A diferencia de los humanos, donde hay pocas variantes genéticas identificadas que se sabe que están involucradas en el fenotipo de tamaño controlado genéticamente, en los perros, se ha demostrado que siete polimorfismos de un solo nucleótido (SNP) en seis genes explican la mitad de la variación fenotípica. En la práctica descrita aquí, un solo SNP G-A (dentro del intrón 2 del factor de crecimiento similar a la insulina 1 gen) se estudia mediante PCR, secuenciación y bioinformática. El peso promedio de la raza de perros de diferentes genotipos en este SNP muestra diferencias significativas en el tamaño (mediana [IQR] de AA = 10 kg [6-15 kg], AG = 23,75 kg [14-30 kg], GG = 30 kg [24,5 –37 kg] de los datos de nuestra clase) con una estimación de solo ≈norte = 16 perros que necesitan ser genotipados para demostrar una diferencia significativa de tamaño entre los perros que albergan los dos genotipos homocigotos. En la práctica aquí descrita, desde un solo laboratorio y una sola sesión de computadora, los estudiantes pueden ver el efecto claro del genotipo en un rasgo cuantitativo. El examen de la variante en el navegador Ensembl (www.ensembl.org) permite a los estudiantes comprender la base genómica de esta variante y apreciar la gran cantidad de datos e información disponible públicamente en los navegadores del genoma. © 2018 Unión Internacional de Bioquímica y Biología Molecular, 46 (6): 623–629, 2018.


¿Cómo puedo encontrar el SNP de un gen más estudiado? - biología

Todos los artículos publicados por MDPI están disponibles inmediatamente en todo el mundo bajo una licencia de acceso abierto. No se requiere un permiso especial para reutilizar todo o parte del artículo publicado por MDPI, incluidas las figuras y tablas. Para los artículos publicados bajo una licencia Creative Common CC BY de acceso abierto, cualquier parte del artículo puede ser reutilizada sin permiso siempre que el artículo original esté claramente citado.

Los artículos de fondo representan la investigación más avanzada con un potencial significativo de alto impacto en el campo. Los artículos de fondo se envían por invitación individual o recomendación de los editores científicos y se someten a una revisión por pares antes de su publicación.

El artículo destacado puede ser un artículo de investigación original, un estudio de investigación novedoso y sustancial que a menudo implica varias técnicas o enfoques, o un artículo de revisión completo con actualizaciones concisas y precisas sobre los últimos avances en el campo que revisan sistemáticamente los avances científicos más interesantes. literatura. Este tipo de artículo ofrece una perspectiva sobre las futuras direcciones de la investigación o sus posibles aplicaciones.

Los artículos de Editor's Choice se basan en las recomendaciones de los editores científicos de las revistas de MDPI de todo el mundo. Los editores seleccionan una pequeña cantidad de artículos publicados recientemente en la revista que creen que serán particularmente interesantes para los autores o importantes en este campo. El objetivo es proporcionar una instantánea de algunos de los trabajos más interesantes publicados en las diversas áreas de investigación de la revista.


El ensayo de biología Snp del polimorfismo de un solo nucleótido

El polimorfismo de un solo nucleótido es una discrepancia de nucleótidos con respecto a la secuencia normal, con una frecuencia poblacional superior al 1% (Perkel, 2008). Normalmente hay dos alelomorfos involucrados en los SNP. Historias de alelos T y C para dos niveles de alteraciones alélicas en mundos debido al sesgo mutante. La cantidad de SNP puede cambiar dentro de las poblaciones y entre ellas. Los SNP se pueden clasificar en sinónimos (sin alteración del aminoácido producido por el cistrón) conservadores (alteración del ácido amínico a un aminoácido químicamente similar) y no conservativos (alteración del ácido amínico a un aminoácido químicamente diferente).

Los SNP pueden ser además interpolaciones u omisiones normalmente conocidas como & # 8220 polimorfismos de interpolación de omisión (DIP) & # 8221 (McEntyre, 2002). Además, los SNP pueden utilizarse para planificar fármacos para intervenciones y desempeñar un papel importante en el desarrollo de fármacos para el tratamiento de enfermedades familiares (Twyman y Primrose, 2003). Los SNP pueden descubrirse mediante varios métodos moleculares en los que se pueden identificar variantes de moléculas de ácido desoxirribonucleico. Estos métodos tienen la idea básica de magnificar la parte de la participación por PCR y buscar pertenencias físicas y químicas similares / idénticas, es decir, si hay una alteración de la base individual.

Por ejemplo, análisis de polimorfismo conformacional de cadena individual (SSCP) y cataforesis en gel de gradiente desnaturalizante (DGGE). SSCP implica desnaturalizar el ADN de doble cadena en una sola cadena que se pliega en forma de bola. El aumento determina las discrepancias en el ADN.

En el otro manuscrito, DGGE implica desnaturalizar el ADN para alterar la movilidad. Sin embargo, los SNP se descubren utilizando técnicas de secuenciación como la pirosecuenciación de vitamina E, g, 454, ya que son más baratas y fiables (Chang et al., 2010). Esta técnica implica la emisión de una señal química cuando se incorpora un dNTP peculiar.

El orden de los dNTP liberados se decide por pirograma y podría basarse en el SNP conocido. La señal química producida es relativa a la cifra de dNTP incorporados (Chang et al., 2010). Los métodos de genotipado de SNP deben ser rápidos, económicos y precisos (Kim y Mishra, 2007).

Se utilizan varios métodos de genotipado de SNP, p. control de invasores y espectrómetro de masas. Aunque, las reglas básicas de todos los métodos son el favoritismo de alelos y la detección de alelos (Twyman y Primrose, 2003). El método utilizado depende del SNP y la tabla graduada del genoma. Por el caso, los métodos basados ​​en matrices, es decir,

Se utilizan técnicas de alto rendimiento para genotipar SNP en todo el genoma. Illumina es uno de los métodos más utilizados. Esto implica desnaturalizar el ácido desoxirribonucleico genómico en ácido desoxirribonucleico de cadena individual unido a & # 8220 Bead Array platform & # 8221 o & # 8220 Beadxpress & # 8221. Un conjunto de oilgonucleótidos se hibrida con el ADN genómico produciendo un pozo. Luego & # 8220 extensión y ligadura de alelos específicos & # 8221 toma el punto topográfico. Las secuencias se amplifican mediante PCR con una adición de cebadores marcados con fluorescencia (Chen, Kowk y Levine, 1999) para producir & # 8220 amplicones & # 8221 que contienen varios SNP. Así se hibridan con las perlas de illumina que tienen secuencias complementarias.

Cuando la secuencia correcta y peculiar se hibrida con la secuencia en la cuenta de illumina, se produce una sola señal que coincide con la secuencia que se hibrida y encuentra el genotipo del SNP. El otro método normalmente utilizado es & # 8220 Affymetrix GeneChip 500K Mapping Array Set & # 8221 y puede variar alrededor de 500.000 SNP diferentes en un clip que es eficiente en el clip (Butcher et al., 2007). El ácido desoxirribonucleico genómico se escinde con enzimas de limitación (& # 8220 NspI o StyI) y así los adaptadores se ligan a los fragmentos. Los fragmentos se amplifican mediante PCR en condiciones óptimas y los terminales se etiquetan para que puedan cruzarse en las patatas fritas (AFFYMETRIXA®, 2005). Cada lugar determina un solo genotipo de SNP en la muestra de ácido desoxirribonucleico que se ha hibridado en las patatas fritas. Sin embargo, requiere un lote de ADN y, a veces, no es posible adquirir toneladas de ADN.

Hay otros métodos que no se basan en matrices y se utilizan para colocar un conjunto específico de SNP en cistrones específicos. Esto incluye la hibridación específica de alelos dinámicos (DASH). Esta es una manera más eficiente ya que las matrices se pueden personalizar, sin embargo, este método simplemente funciona para una pequeña cifra de SNP. Esto utiliza condiciones de rigidez para que suceda la secuencia de ADN de participación que tiene desajustes con la investigación hibridada. (Brookes et al., 1999). Método Se realizó una búsqueda BLAT en la secuencia de preguntas para cada lugar en un clip en el navegador UCSC.

Se accedió en el localizador uniforme de recursos mencionado a continuación: protocolo de transferencia de hipertexto: /genome.ucsc.edu/.

& # 8220 Browser & # 8221 nexus se hizo clic en la primera consecuencia. Esto proporcionó información sobre la ubicación del SNP en el cromosoma y varios ID de SNP. Se usó el lugar cromosómico para pasar el cistrón en el que se ubica el SNP. Esto se hizo accediendo al visor de mapas NCBI en el localizador uniforme de recursos mencionado a continuación: protocolo de transferencia de hipertexto: /www.ncbi.

El lugar cromosómico se ingresó en la parte & # 8220 del cromosoma & # 8221 nexo. Además, se identificó el ID de SNP correcto eligiendo el nexo & # 8220 información interna & # 8221 de la primera consecuencia. Había dos bases azules más claras con una base negra en el centro, proponiendo la ubicación del SNP en la secuencia. Se calculó el lugar del SNP en el cromosoma y, por lo tanto, fue a la página & # 8220 navegador & # 8221, ingresó el lugar en el & # 8220 cuadro de lugar & # 8221 y hizo clic en & # 8220 salto & # 8221.

Esto dio un ID de SNP que correspondía al SNP en cada lugar. Al seleccionar ese ID de SNP, esto proporcionó toneladas de información sobre los alelomorfos, la prueba, la parte de codificación y muchos más. Se accedió a la base de datos dbSNP en el localizador uniforme de recursos mencionado: protocolo de transferencia de hipertexto: / www.

ncbi.nlm.

Para pasar del lugar de la parte de codificación para algunos de los lugares, se seleccionó el lugar de nucleótidos en la subdivisión & # 8220 Gene position & # 8220. Además, al hacer clic en el nexo & # 8220 Clinical Association & # 8221, se encontró el mapa del SNP. Consecuencias Todos los SNP en el lugar están ubicados en CFTR cistrón y todas las secuencias están localizadas en 7q31.2. se encuentra en un ADN codificante.

El mapa del SNP no tiene sentido como las alteraciones de los aminoácidos de valina a metionina. El lugar del SNP en el cromosoma es 117199533 y el ID del SNP es rs_213950. La permutación es un sentido positivo. Está en el exón 11 del cistrón CFTR, este se encontró a través de dbSNP al presionar el lugar del nucleótido (84517). Además, es un regulador transmembrana de fibrosis quística. El SNP ha sido validado por el remitente de frecuencia de grupo 2-hit-2allele y la empresa HapMap.

Se ha secuenciado en 1000 genomas emprendiendo. Los alelomorfos hereditarios para el SNP es A, y el alelomorfo derivado es G. Hubo varias frecuencias alélicas de diferentes poblaciones. Algunos de ellos se tomaron de la misma población, mientras que otros no eran una población, ya que simplemente se tomaron de un individuo. Entonces, se tomó una frecuencia de alelos representativa de diferentes poblaciones. Las frecuencias alélicas del alelomorfo A y G en la población europea son 50.

8% y 49,2% solidariamente. Las frecuencias alélicas del alelomorfo A y G en la población china son 40.

5% y 59,5% solidariamente. Las frecuencias alélicas de los alelomorfos A y G en la población nipona son 32,6% y 67,4% individualmente. Las frecuencias alélicas de los alelomorfos A y G en la población de África subsahariana son del 97,5% y 2.

5% solidariamente. Las frecuencias alélicas de los alelomorfos A y G en la población afroamericana son del 89,1% y el 10,9% individualmente.

Los africanos tienen una mayor frecuencia de alelomorfos A, mientras que los asiáticos tienen la misma cifra de alelomorfos A y G. Esto sugiere que la diversidad familiar comenzó en África y se mantuvo en África. Foco B El SNP se encuentra en el ADN no codificante. El lugar del SNP en el cromosoma es 117163616. El ID de SNP es rs_7802924. El SNP se ha validado mediante la frecuencia de racimos, la realización de HapMap y la realización de 1000 genomas.

Los alelomorfos hereditarios y derivados son A y G individualmente. Había tres poblaciones en total. Sin embargo, dos de ellos eran simplemente de uno, por lo que no representa a toda la población. La frecuencia alélica se tomó de una población múltiple que incluye nipones, chinos, africanos, etc. Las frecuencias alélicas de A y G son 90,9% y 9,1% individualmente.

Como la frecuencia del alelomorfo A es razonablemente alta, esto sugiere que está extremadamente conservado en múltiples poblaciones, aunque el tamaño de la muestra era pequeño. Foco C El SNP se encuentra en el ADN codificante. El lugar del SNP en el cromosoma es 117282644. El ID de SNP es rs_1800130. El SNP ha sido validado por el alelomorfo de frecuencia de racimo 2 hit-2 y el emprendimiento del genoma 1000. Los alelomorfos hereditarios y derivados son G y A por separado.

Existe una frecuencia de alelomorfos realmente alta del 100% en Europa y Asia. Esto además sugiere que la mayoría de la población con el alelo A se ha mudado de África. Sin embargo, la frecuencia del alelo A en las poblaciones de África subsahariana y afroamericana es del 78,8% y el 88,1% individualmente, mientras que las frecuencias de los alelos de G son del 21,2% y el 11,9% individualmente.

Locus D El SNP se encuentra en el ADN no codificante. El lugar del SNP en el cromosoma es 117173231. El ID del SNP es rs_213943. El SNP ha sido validado por el alelomorfo 2 hit-2 del remitente de la frecuencia del grupo y la empresa del genoma 1000. Los alelomorfos hereditarios y derivados son C y T de forma separada. Las frecuencias alélicas de los alelos C y T en la población europea son 51.

7% y 48,3% solidariamente. Las frecuencias alélicas de los alelos C y T en la población china son del 39,5% y del 60,5% de forma individual. Las frecuencias alélicas de los alelos C y T en la población nipona son 32,1% y 67.


Contenido

Desequilibrio de ligamiento Editar

Se dice que dos loci están en equilibrio de ligamiento (LE) si su herencia es un evento independiente. Si los alelos en esos loci se heredan de forma no aleatoria, entonces decimos que están en desequilibrio de ligamiento (LD). La LD es causada más comúnmente por el enlace físico de los genes. Cuando se heredan dos genes en el mismo cromosoma, dependiendo de su distancia y la probabilidad de recombinación entre los loci, pueden estar en LD alta. Sin embargo, la LD también se puede observar debido a interacciones funcionales en las que incluso genes de diferentes cromosomas pueden conferir conjuntamente un fenotipo seleccionado evolutivamente o pueden afectar la viabilidad de la descendencia potencial.

En las familias, la LD es más alta debido a la menor cantidad de eventos de recombinación (la menor cantidad de eventos de meiosis). Esto es especialmente cierto entre líneas endogámicas. En las poblaciones, la LD existe debido a la selección, la cercanía física de los genes que causa bajas tasas de recombinación o debido a cruces o migraciones recientes. A nivel poblacional, los procesos que influyen en el desequilibrio de ligamiento incluyen ligamiento genético, selección natural epistática, tasa de recombinación, mutación, deriva genética, apareamiento aleatorio, autostop genético y flujo de genes. [2]

Cuando un grupo de SNP se hereda en conjunto debido a un LD alto, tiende a haber información redundante. La selección de una etiqueta SNP como representante de estos grupos reduce la cantidad de redundancia al analizar partes del genoma asociadas con rasgos / enfermedades. [3] Las regiones del genoma en LD alta que albergan un conjunto específico de SNP que se heredan juntos también se conocen como haplotipos. Por lo tanto, los SNP de etiqueta son representativos de todos los SNP dentro de un haplotipo.

Haplotipos Editar

La selección de etiquetas SNP depende de los haplotipos presentes en el genoma. La mayoría de las tecnologías de secuenciación proporcionan la información genotípica y no los haplotipos, es decir, proporcionan información sobre las bases específicas que están presentes pero no proporcionan información fásica (en qué cromosoma específico aparece cada una de las bases). [4] La determinación de haplotipos se puede realizar mediante métodos moleculares (PCR de alelos específicos, híbridos de células somáticas). Estos métodos distinguen qué alelo está presente en qué cromosoma separando los cromosomas antes de la genotipificación. Pueden consumir mucho tiempo y ser costosos, por lo que los métodos de inferencia estadística se han desarrollado como una opción menos costosa y automatizada. Estos paquetes de software de inferencia estadística utilizan parsimonia, máxima verosimilitud y algoritmos bayesianos para determinar los haplotipos. La desventaja de la inferencia estadística es que una proporción de los haplotipos inferidos podría estar equivocada. [5]

Diferencias de población Editar

Cuando se utilizan haplotipos para estudios de asociación de todo el genoma, es importante tener en cuenta la población que se está estudiando. A menudo, diferentes poblaciones tendrán diferentes patrones de LD. Un ejemplo de patrones de diferenciación son las poblaciones de ascendencia africana frente a las poblaciones de descendencia europea y asiática. Dado que los humanos se originaron en África y se extendieron a Europa y luego a los continentes asiático y americano, las poblaciones africanas son las más diversas genéticamente y tienen regiones más pequeñas de LD, mientras que las poblaciones de descendencia europea y asiática tienen regiones más grandes de LD debido al efecto fundador. Cuando los patrones de LD difieren en las poblaciones, los SNP pueden disociarse entre sí debido a los cambios en los bloques de haplotipos. Esto significa que los SNP de etiquetas, como representantes de los bloques de haplotipos, son únicos en las poblaciones y las diferencias de población deben tenerse en cuenta al realizar estudios de asociación. [6]

GWAS Editar

Casi todos los rasgos tienen influencia tanto genética como ambiental. La heredabilidad es la proporción de variación fenotípica que se hereda de nuestros antepasados. Los estudios de asociación se utilizan para determinar la influencia genética en la presentación fenotípica. Aunque se utilizan principalmente para mapear enfermedades en áreas genómicas, pueden usarse para mapear la heredabilidad de cualquier fenotipo como altura, color de ojos, etc.

Los estudios de asociación de todo el genoma (GWAS) utilizan polimorfismos de un solo nucleótido (SNP) para identificar asociaciones genéticas con afecciones clínicas y rasgos fenotípicos. [8] No tienen hipótesis y utilizan un enfoque de genoma completo para investigar rasgos comparando un gran grupo de individuos que expresan un fenotipo con un gran grupo de personas que no lo hacen. El objetivo final de GWAS es determinar los factores de riesgo genéticos que se pueden utilizar para hacer predicciones sobre quién está en riesgo de contraer una enfermedad, cuáles son los fundamentos biológicos de la susceptibilidad a la enfermedad y crear nuevas estrategias de prevención y tratamiento. [1] El Instituto Nacional de Investigación del Genoma Humano y el Instituto Europeo de Bioinformática publica el Catálogo GWAS, un catálogo de estudios publicados de asociación de todo el genoma que destaca asociaciones estadísticamente significativas entre cientos de SNP con una amplia gama de fenotipos. [9]

Debido al gran número de posibles variantes de SNP (más de 149 millones a junio de 2015 [10] [11]), sigue siendo muy caro secuenciar todos los SNP. Es por eso que GWAS usa matrices personalizables (chips SNP) para genotipar solo un subconjunto de las variantes identificadas como etiquetas snps. La mayoría de los GWAS utilizan productos de las dos plataformas de genotipado principales. La plataforma Affymetrix imprime sondas de ADN en un chip de vidrio o silicona que se hibridan con alelos específicos en el ADN de la muestra. La plataforma Illumina utiliza tecnología basada en perlas, con secuencias de ADN más largas y produce una mejor especificidad. [1] Ambas plataformas pueden genotipar más de un millón de SNP de etiquetas utilizando oligos de ADN prefabricados o personalizados.

Los estudios de todo el genoma se basan en la hipótesis de la variante común de enfermedad común (CD / CV) que establece que los trastornos comunes están influenciados por una variación genética común. El tamaño del efecto (penetrancia) de las variantes comunes debe ser menor en relación con los que se encuentran en los trastornos raros. Eso significa que el SNP común puede explicar solo una pequeña parte de la variación debida a factores genéticos y que las enfermedades comunes están influenciadas por múltiples alelos comunes de tamaño de efecto pequeño. Otra hipótesis es que las enfermedades comunes son causadas por variantes raras que están vinculadas sintéticamente a variantes comunes. En ese caso, la señal producida a partir de GWAS es una asociación indirecta (sintética) entre una o más variantes causales raras en el desequilibrio de ligamiento. Es importante reconocer que este fenómeno es posible cuando se selecciona un grupo para etiquetas SNP. Cuando se encuentra que una enfermedad está asociada con un haplotipo, algunos SNP en ese haplotipo tendrán una asociación sintética con la enfermedad. Para identificar los SNP causales, necesitamos una mayor resolución en la selección de bloques de haplotipos. Dado que las tecnologías de secuenciación del genoma completo están cambiando rápidamente y son cada vez menos costosas, es probable que sustituyan a las tecnologías de genotipado actuales proporcionando la resolución necesaria para identificar las variantes causales.

HapMap Editar

Debido a que la secuenciación del genoma completo de los individuos sigue siendo prohibitiva, el proyecto internacional HapMap se construyó con el objetivo de mapear el genoma humano en agrupaciones de haplotipos (bloques de haplotipos) que pueden describir patrones comunes de variación genética humana. Al mapear todo el genoma a los haplotipos, se pueden identificar los SNP de etiquetas para representar los bloques de haplotipos examinados mediante estudios genéticos. Un factor importante a considerar al planificar un estudio genético es la frecuencia y el riesgo en que incurren los alelos específicos. Estos factores pueden variar en diferentes poblaciones, por lo que el proyecto HapMap utilizó una variedad de técnicas de secuenciación para descubrir y catalogar SNP de diferentes conjuntos de poblaciones. Inicialmente, el proyecto secuenciaba individuos de la población Yoruba de origen africano (YRI), residentes de Utah con ascendencia europea occidental (CEU), individuos no emparentados de Tokio, Japón (JPT) e individuos chinos Han no emparentados de Beijing, China (CHB). Recientemente, sus conjuntos de datos se han ampliado para incluir otras poblaciones (11 grupos) [1]

Pasos para la selección de la etiqueta SNP Editar

La selección de SNP de etiquetas informativas máximas es un problema NP completo. Sin embargo, se pueden diseñar algoritmos para proporcionar una solución aproximada dentro de un margen de error. [12] Los criterios necesarios para definir cada algoritmo de selección de SNP de etiqueta son los siguientes:

  1. Definir área para buscar - el algoritmo intentará localizar los SNP de etiqueta en la vecindad N (t) de un SNP t objetivo
  2. Definir una métrica para evaluar la calidad del etiquetado. - la métrica debe medir qué tan bien se puede predecir un SNP t objetivo utilizando un conjunto de sus vecinos N (t), es decir, qué tan bien un SNP de etiqueta como representante de los SNP en un vecindario N (t) puede predecir un SNP t objetivo . Puede definirse como una probabilidad de que el SNP t objetivo tenga valores diferentes para cualquier par de haplotipos iyj donde el valor de los SNP s también es diferente para los mismos haplotipos. La informatividad de la métrica se puede representar en términos de una teoría de grafos, donde cada SNP s se representa como un gráfico Gs cuyos nodos son haplotipos. Gs tiene un borde entre los nodos (i, j) si y solo si los valores de s son diferentes para los haplotipos Hi, Hj. [12]
  3. Derivar el algoritmo para encontrar SNP representativos - el objetivo del algoritmo es encontrar el subconjunto mínimo de SNP de etiqueta seleccionados con la máxima informatividad entre cada SNP de etiqueta con todos los demás SNP de destino
  4. Validar el algoritmo

Selección de funciones Editar

Los métodos para seleccionar características se dividen en dos categorías: métodos de filtro y métodos de envoltura. Los algoritmos de filtrado son algoritmos generales de preprocesamiento que no presuponen el uso de un método de clasificación específico. Los algoritmos de envoltura, por el contrario, "envuelven" la selección de características alrededor de un clasificador específico y seleccionan un subconjunto de características en función de la precisión del clasificador mediante la validación cruzada. [13]

El método de selección de características adecuado para seleccionar SNP de etiquetas debe tener las siguientes características:

  • escalar bien para una gran cantidad de SNP
  • no requieren un etiquetado de clase explícito y no debe asumir el uso de un clasificador específico porque la clasificación no es el objetivo de etiquetar la selección de SNP
  • Permitir al usuario seleccionar diferentes números de etiquetas SNP para diferentes cantidades de pérdida de información tolerada.
  • tienen un rendimiento comparable con otros métodos que satisfacen las tres primeras condiciones.

Editar algoritmos de selección

Se han propuesto varios algoritmos para seleccionar SNP de etiquetas. El primer enfoque se basó en la medida de bondad de los conjuntos de SNP y buscó subconjuntos de SNP que son pequeños pero alcanzan un valor alto de la medida definida. Examinar cada subconjunto de SNP para encontrar los buenos es computacionalmente factible solo para pequeños conjuntos de datos.

Otro enfoque utiliza el análisis de componentes principales (PCA) para encontrar subconjuntos de SNP que capturan la mayoría de la varianza de los datos. Se emplea un método de ventanas deslizantes para aplicar repetidamente PCA a regiones cromosómicas cortas. Esto reduce los datos producidos y tampoco requiere un tiempo de búsqueda exponencial. Sin embargo, no es factible aplicar el método PCA a grandes conjuntos de datos cromosómicos ya que es computacionalmente complejo. [13]

El enfoque más comúnmente utilizado, el método basado en bloques, explota el principio de desequilibrio de ligamiento observado dentro de los bloques de haplotipos. [12] Se han ideado varios algoritmos para dividir las regiones cromosómicas en bloques de haplotipos que se basan en la diversidad de haplotipos, LD, prueba de cuatro gametos y complejidad de la información, y los SNP de etiquetas se seleccionan de todos los SNP que pertenecen a ese bloque. La presunción principal en este algoritmo es que los SNP son bialélicos. [14] El principal inconveniente es que la definición de bloques no siempre es sencilla. Aunque existe una lista de criterios para formar los bloques de haplotipos, no hay consenso sobre los mismos. Además, la selección basada en correlaciones locales de etiquetas SNP ignora las correlaciones entre bloques. [12]

A diferencia del enfoque basado en bloques, un enfoque sin bloques no se basa en la estructura de bloques. Se sabe que la frecuencia de SNP y las tasas de recombinación varían a lo largo del genoma y algunos estudios han informado distancias LD mucho más largas que los tamaños de bloque máximos informados. No se desea establecer un límite estricto para el vecindario y el enfoque sin bloques busca etiquetas SNP a nivel mundial. Existen varios algoritmos para realizar esto. En un algoritmo, los SNP sin etiquetado se representan como funciones booleanas de los SNP de etiqueta y se utilizan técnicas de teoría de conjuntos para reducir el espacio de búsqueda. Otro algoritmo busca subconjuntos de marcadores que pueden provenir de bloques no consecutivos. Debido a la vecindad del marcador, el espacio de búsqueda se reduce. [13]

Optimizaciones Editar

Con el número de individuos genotipados y el número de SNP en las bases de datos en aumento, la selección de SNP de etiquetas lleva demasiado tiempo para calcular. Para mejorar la eficiencia del método de selección de SNP de etiqueta, el algoritmo primero ignora que los SNP son bialélicos y luego comprime la longitud (número SNP) de la matriz de haplotipos agrupando los sitios SNP con la misma información. Los sitios SNP que dividen los haplotipos en el mismo grupo se denominan sitios redundantes. Los sitios SNP que contienen información distinta dentro de un bloque se denominan sitios no redundantes (NRS). Para comprimir aún más la matriz de haplotipos, el algoritmo necesita encontrar los SNP de la etiqueta de modo que se puedan distinguir todos los haplotipos de la matriz. Al utilizar la idea de la partición conjunta, se proporciona un algoritmo de selección de SNP de etiquetas eficiente. [14]

Validación de la precisión del algoritmo Editar

Dependiendo de cómo se seleccionen los SNP de la etiqueta, se han utilizado diferentes métodos de predicción durante el proceso de validación cruzada. Se empleó el método de aprendizaje automático para predecir el haplotipo omitido. Otro enfoque predijo los alelos de un SNP n no marcado a partir de los SNP etiquetados que tenían el coeficiente de correlación más alto con n. Si se encuentra una sola etiqueta SNP t altamente correlacionada, los alelos se asignan para que sus frecuencias coincidan con las frecuencias alélicas de t. Cuando múltiples SNP de marcado tienen el mismo (alto) coeficiente de correlación con n, el alelo común de n tiene ventaja. Es fácil ver que en este caso el método de predicción concuerda bien con el método de selección, que usa PCA en la matriz de coeficientes de correlación entre SNP. [13]

Hay otras formas de evaluar la precisión de un método de selección de SNP de etiqueta. La precisión puede evaluarse mediante la medida de calidad R2, que es la medida de asociación entre el número real de copias de haplotipos definidas sobre el conjunto completo de SNP y el número predicho de copias de haplotipos donde la predicción se basa en el subconjunto de SNP de marcado. Esta medida asume datos diploides e inferencia explícita de haplotipos a partir de genotipos. [13]

Otro método de evaluación de Clayton se basa en una medida de la diversidad de haplotipos. La diversidad se define como el número total de diferencias en todas las comparaciones por pares entre haplotipos. La diferencia entre un par de haplotipos es la suma de las diferencias entre todos los SNP. La medida de diversidad de Clayton se puede utilizar para definir qué tan bien un conjunto de etiquetas SNP diferencian diferentes haplotipos. Esta medida es adecuada solo para bloques de haplotipos con diversidad de haplotipos limitada y no está claro cómo usarla para grandes conjuntos de datos que constan de múltiples bloques de haplotipos. [13]

Algunos trabajos recientes evalúan los algoritmos de selección de los SNP de etiquetas basándose en qué tan bien se pueden usar los SNP de etiquetado para predecir los SNP sin etiquetado. La precisión de la predicción se determina mediante validación cruzada, como dejar uno fuera o esperar. En la validación cruzada de dejar uno fuera, para cada secuencia en el conjunto de datos, el algoritmo se ejecuta en el resto del conjunto de datos para seleccionar un conjunto mínimo de SNP de etiquetado. [13]

Tagger Editar

Tagger es una herramienta web disponible para evaluar y seleccionar etiquetas SNP a partir de datos genotípicos como el Proyecto Internacional HapMap. Utiliza métodos por pares y enfoques de haplotipos multimarcadores. Los usuarios pueden cargar datos de genotipo HapMap o formato de pedigrí y se calcularán los patrones de desequilibrio de ligamiento. Las opciones de etiquetado permiten al usuario especificar puntos de referencia cromosómicos, que indican regiones de interés en el genoma para seleccionar SNP de etiquetas. A continuación, el programa genera una lista de etiquetas SNP y sus valores de prueba estadísticos, así como un informe de cobertura. Está desarrollado por Paul de Bakker en los laboratorios de David Altshuler y Mark Daly en el Centro de Investigación Genética Humana del Hospital General de Massachusetts y la Escuela de Medicina de Harvard, en el Instituto Broad. [15]

CLUSTAG y WCLUSTAG Editar

En el software gratuito CLUSTAG y WCLUSTAG, contienen algoritmos de clúster y conjunto de cobertura para obtener un conjunto de SNP de etiquetas que pueden representar todos los SNP conocidos en una región cromosómica. Los programas se implementan con Java y pueden ejecutarse tanto en la plataforma Windows como en el entorno Unix. Están desarrollados por SIO-IONG AO et al. en la Universidad de Hong Kong. [16] [17]


Resumen

Los estudios de asociación de todo el genoma (GWAS) para el IMC, la relación cintura-cadera y otros rasgos de adiposidad han identificado más de 300 polimorfismos de un solo nucleótido (SNP). Aunque hay motivos para esperar que estos descubrimientos eventualmente conduzcan a nuevos agentes preventivos y terapéuticos para la obesidad, esto llevará tiempo porque tales desarrollos requieren una comprensión mecanicista detallada de cómo un SNP influye en el fenotipo (y esta información no está disponible en gran medida). Afortunadamente, la ausencia de información funcional no ha impedido que los hallazgos de GWAS proporcionen información sobre la biología de la obesidad. Los genes cercanos a los loci que regulan la masa corporal total se enriquecen para su expresión en el SNC, mientras que los genes para la distribución de grasas se enriquecen en el propio tejido adiposo. Los análisis de interacción gen por medio ambiente y estilo de vida han revelado que nuestro entorno cada vez más obesogénico podría estar amplificando el riesgo genético de obesidad, sin embargo, aquellos con mayor riesgo podrían mitigar este riesgo aumentando la actividad física y posiblemente evitando componentes dietéticos específicos. Los hallazgos de GWAS también se han utilizado en análisis de aleatorización mendeliana que investigan la asociación causal entre la obesidad y sus muchas complicaciones putativas. Al respaldar una asociación causal de la obesidad con la diabetes, la enfermedad coronaria, cánceres específicos y otras afecciones, estos análisis tienen relevancia clínica para identificar qué resultados podrían prevenirse mediante intervenciones de pérdida de peso.


Niccoli, T. & amp Partridge, L. El envejecimiento como factor de riesgo de enfermedad. Curr. Biol. 22, R741-R752 (2012).

Andersen, S. L., Sebastiani, P., Dworkis, D. A., Feldman, L. & amp Perls, T. T. La duración de la salud se aproxima a la duración de la vida entre muchos supercentenarios: compresión de la morbilidad en el límite aproximado de la duración de la vida. J. Gerontol. Ser. A 67, 395–405 (2012).

Kennedy, B. K. y col. Envejecimiento: un impulsor común de enfermedades crónicas y un objetivo para intervenciones novedosas. Celda 159, 709 (2014).

Partridge, L., Deelen, J. & amp Slagboom, P. E. Enfrentando los desafíos globales del envejecimiento. Naturaleza 561, 45–56 (2018).

Vijg, J. & amp Suh, Y. Genética de la longevidad y el envejecimiento. Annu. Rev. Med. 56, 193–212 (2005).

Jagger, C. y col. Desigualdades en años de vida sana en los 25 países de la Unión Europea en 2005: un análisis de metarregresión transnacional. Lanceta 372, 2124–2131 (2008).

Deelen, J. y col. El metanálisis de asociación de todo el genoma de la longevidad humana identifica un nuevo locus que confiere supervivencia más allá de los 90 años. Humano. Mol. Gineta. 23, 4420–4432 (2014).

Fortney, K. y col. El escaneo de todo el genoma informado por enfermedades relacionadas con la edad identifica loci para una longevidad humana excepcional. PLoS Genet 11, e1005728 (2015).

Zeng, Y. et al. Nuevos loci y vías significativamente asociados con la longevidad. Sci. Reps. 6, 21243 (2016).

Slagboom, P. E., van den Berg, N. & amp Deelen, J. Estudios basados ​​en fenomas y genomas sobre el envejecimiento y la longevidad humanos: una descripción general. Biochim. Biophys. Acta 1864, 2742–2751 (2018).

Walter, S. y col. Un estudio de asociación de todo el genoma del envejecimiento. Neurobiol. Envejecimiento 32, 2109 – e15 (2011).

Joshi, P. K. y col. Las variantes cercanas a chrna3 / 5 y apoe tienen efectos relacionados con la edad y el sexo en la vida útil de los seres humanos. Nat. Comun. 7, 11174 (2016).

Joshi, P. K. y col. El metanálisis de todo el genoma asocia hla-dqa1 / drb1 y lpa y factores de estilo de vida con la longevidad humana. Nat. Comun. 8, 910 (2017).

McDaid, A. F. y col. El escaneo de asociación bayesiana revela loci asociados con la vida útil humana y biomarcadores vinculados. Nat. Comun. 8, 15842 (2017).

Gompertz, B. Sobre la naturaleza de la función expresiva de la ley de la mortalidad humana y sobre un nuevo modo de determinar el valor de las contingencias vitales. Philos. Trans. R. Soc. Lond. 115, 513–583 (1825).

Makeham, W. M. Sobre la ley de mortalidad y construcción de tablas de anualidades. Assur. revista J. Inst. Actuar. 8, 301–310 (1860).

Schemper, M., Kaider, A., Wakounig, S. & amp Heinze, G. Estimación de la correlación de tiempos de falla bivariados bajo censura. Stat. Medicina. 32, 4781–4790 (2013).

Tutkun, N. A. & amp Demirhan, H. Un enfoque bayesiano del modelo de cox-gompertz. Hacet. J. Math. Stat. 45, 1621–1639 (2016).

Devlin, B. & amp Roeder, K. Control genómico para estudios de asociación. Biometria 55, 997–1004 (1999).

Bulik-Sullivan, B. K. et al. La regresión de la puntuación Ld distingue la confusión de la poligenicidad en los estudios de asociación de todo el genoma. Nat. Gineta. 47, 291–295 (2015).

Yang, J. y col. El análisis condicional y conjunto de múltiples snp de las estadísticas de resumen de GWAS identifica variantes adicionales que influyen en rasgos complejos. Nat. Gineta. 44, 369–375 (2012).

Zheng, J. y col. Ld hub: una base de datos centralizada y una interfaz web para realizar la regresión de la puntuación de ld que maximiza el potencial de los datos GWAS de nivel de resumen para el análisis de correlación genética y heredabilidad de snp. Bioinformática 33, 272–279 (2017).

Nikpay, M. y col. Un metaanálisis de asociación de todo el genoma basado en 1000 genomas de la enfermedad de las arterias coronarias. Nat. Gineta. 47, 1121 (2015).

Morris, A. P. y col. El análisis de asociación a gran escala proporciona información sobre la arquitectura genética y la fisiopatología de la diabetes tipo 2. Nat. Gineta. 44, 981 (2012).

Soranzo, N. et al. Las variantes comunes en 10 loci genómicos influyen en los niveles de hemoglobina a1c a través de vías glucémicas y no glucémicas. Diabetes 59, 3229–3239 (2010).

Furberg, H. y col. Los metanálisis de todo el genoma identifican múltiples loci asociados con el comportamiento del tabaquismo. Nat. Gineta. 42, 441 (2010).

Dupuis, J. y col. Nuevos loci genéticos implicados en la homeostasis de la glucosa en ayunas y su impacto en el riesgo de diabetes tipo 2. Nat. Gineta. 42, 105 (2010).

Barban, N. y col. El análisis de todo el genoma identifica 12 loci que influyen en el comportamiento reproductivo humano. Nat. Gineta. 48, 1462 (2016).

Pilling, L. C. et al. La longevidad humana está influenciada por muchas variantes genéticas: evidencia de 75.000 participantes del Biobanco del Reino Unido. Envejecimiento 8, 547 (2016).

Kettunen, J. et al. El estudio de todo el genoma de los metabolitos circulantes identifica 62 loci y revela nuevos efectos sistémicos de la lpa. Nat. Comun. 7, 11122 (2016).

McLaren, W. et al. El predictor de efecto de variante de conjunto. Genome Biol. 17, 122 (2016).

Pers, T. H. et al. Interpretación biológica de estudios de asociación de todo el genoma utilizando funciones genéticas predichas. Nat. Comun. 6, 5890 (2015).

Consorcio, G. P. et al. Un mapa de la variación del genoma humano a partir de la secuenciación a escala poblacional. Naturaleza 467, 1061 (2010).

Staley, J. R. y col. Phenoscanner: una base de datos de asociaciones de genotipo-fenotipo humano. Bioinformática 32, 3207–3209 (2016).

Barrett, J. H. et al.El estudio de asociación de todo el genoma identifica tres nuevos loci de susceptibilidad al melanoma. Nat. Gineta. 43, 1108 (2011).

Abnet, C. C. y col. Variantes genotípicas en 2q33 y riesgo de carcinoma de células escamosas de esófago en China: un metanálisis de estudios de asociación de todo el genoma. Humano. Mol. Gineta. 21, 2132–2141 (2012).

Eriksson, N. et al. Los estudios basados ​​en la web, impulsados ​​por participantes, producen asociaciones genéticas novedosas para rasgos comunes. PLoS Genet. 6, e1000993 (2010).

Zhang, M. y col. Los estudios de asociación de todo el genoma identifican varios loci nuevos asociados con los rasgos de pigmentación y el riesgo de cáncer de piel en los estadounidenses de origen europeo. Humano. Mol. Gineta. 22, 2948–2959 (2013).

Duffy, D. L. y col. Las variantes de Irf4 tienen efectos específicos de la edad sobre el recuento de nevos y predisponen al melanoma. Soy. J. Human. Gineta. 87, 6–16 (2010).

Willer, C. J. y col. Descubrimiento y refinamiento de loci asociados con los niveles de lípidos. Nat. Gineta. 45, 1274 (2013).

Gaulton, K. J. y col. El mapeo genético fino y la anotación genómica definen los mecanismos causales en los loci de susceptibilidad a la diabetes tipo 2. Nat. Gineta. 47, 1415 (2015).

Shungin, D. y col. Nuevos loci genéticos vinculan la biología de la insulina y el tejido adiposo con la distribución de la grasa corporal. Naturaleza 518, 187 (2015).

Broer, L. et al. El consorcio GWAS de longevidad a cargo confirma la candidatura de apoe y foxo3. J. Gerontol. Ser. A 70, 110–118 (2014).

Crimmins, E. M. Vida útil y vida útil: pasado, presente y promesa. Gerontólogo 55, 901–911 (2015).

Kaeberlein, M. ¿Qué tan saludable es el concepto healthspan? GeroScience 40, 1–4 (2018).

Pyrkov, T. V. et al. Extraer la edad biológica de los datos biomédicos a través del aprendizaje profundo: ¿demasiado bueno? Sci. Reps. 8, 5210 (2018).

Papoz, L., Balkau, B. & amp Lellouch, J. Recuento de casos en epidemiología: limitaciones de los métodos basados ​​en múltiples fuentes de datos. En t. J. Epidemiol. 25, 474–478 (1996).

Yoshihara, H. & amp Yoneoka, D. Comprender las estadísticas y las limitaciones de los análisis de grandes bases de datos. Columna vertebral 39, 1311–1312 (2014).

Izquierdo, J. N. & amp Schoenbach, V. J. El potencial y las limitaciones de los datos de los registros estatales de cáncer basados ​​en la población. Soy. J. Salud pública 90, 695 (2000).

Harrison, D. E. y col. Acarbosa, 17-αEl estradiol y el ácido nordihidroguaiarético prolongan la vida útil del ratón preferentemente en los machos. Célula de envejecimiento 13, 273–282 (2014).

Strong, R. et al. Mayor vida útil en ratones machos tratados con un agonista estrogénico débil, un antioxidante, un α-inhibidor de la glucosidasa o un inductor de nrf2. Célula de envejecimiento 15, 872–884 (2016).

Horvath, S. et al. La obesidad acelera el envejecimiento epigenético del hígado humano. Proc. Natl Acad. Sci. 111, 15538–15543 (2014).

Piper, M., Selman, C., McElwee, J. & amp Partridge, L. Separando la causa del efecto: ¿cómo controla la señalización de insulina / igf la vida útil en gusanos, moscas y ratones? J. Pasante. Medicina. 263, 179–191 (2008).

Roses, A. et al. Un polimorfismo de longitud variable tomm40 predice la edad de la enfermedad de Alzheimer de aparición tardía. Pharm. J. 10, 375 (2010).

Ziegler-Graham, K., Brookmeyer, R., Johnson, E. & amp Arrighi, H. M. Variación mundial en el tiempo de duplicación de las tasas de incidencia de la enfermedad de Alzheimer. Dement de Alzheimer. 4, 316–323 (2008).

Lambert, J.-C. et al. El metanálisis de 74 046 personas identifica 11 nuevos loci de susceptibilidad para la enfermedad de Alzheimer. Nat. Gineta. 45, 1452 (2013).

Bulik-Sullivan, B. et al. Un atlas de correlaciones genéticas entre enfermedades y rasgos humanos. Nat. Gineta. 47, 1236–1241 (2015).

Karlsson, I. et al. Susceptibilidad genética a enfermedades cardiovasculares y riesgo de demencia. Transl. Psiquiatría 7, e1142 (2017).

Holliday, E. G. y col. Información sobre la arquitectura genética de la degeneración macular relacionada con la edad en etapa temprana: un metanálisis de estudio de asociación de todo el genoma. Más uno 8, e53830 (2013).

Wilhelmsen, L. et al. Factores asociados con llegar a los 90 años: un estudio de hombres nacidos en 1913 en Gotemburgo, Suecia. J. Pasante. Medicina. 269, 441–451 (2011).

Sudlow, C. et al. UK Biobank: un recurso de acceso abierto para identificar las causas de una amplia gama de enfermedades complejas de la mediana edad y la vejez. PLoS Med. 12, e1001779 (2015).

Bycroft, C. et al. El recurso del Biobanco del Reino Unido con datos genómicos y fenotipados profundos. Naturaleza 562, 203 (2018).

O'Connell, J. et al. Estimación de haplotipos para conjuntos de datos a escala de biobancos. Nat. Gineta. 48, 817 (2016).

Howie, B., Marchini, J. & amp Stephens, M. Imputación de genotipo con miles de genomas. G3: genes, genomas, gen. 1, 457–470 (2011).

Tarkhov, A. E., Menshikov, L. I. & amp Fedichev, P. O. La correlación Strehler-mildvan es una variedad degenerada del ajuste de Gompertz. J. Theor. Biol. 416, 180–189 (2017).

Haller, T., Kals, M., Esko, T., Mägi, R. & amp Fischer, K. Regscan: una herramienta GWAS para la estimación rápida de los efectos de los alelos en los rasgos continuos y sus combinaciones. Breve. Bioinforma. 16, 39–44 (2015).

Randall, J. C. et al. Los estudios de asociación de todo el genoma estratificado por sexo que incluyen a 270.000 individuos muestran dimorfismo sexual en los loci genéticos para los rasgos antropométricos. PLoS Genet. 9, e1003500 (2013).

Kichaev, G. y col. Métodos mejorados para el mapeo fino de múltiples rasgos de loci de riesgo pleiotrópico. Bioinformática 33, 248–255 (2017).

Chang, C. C. y col. Plink de segunda generación: a la altura del desafío de conjuntos de datos más grandes y ricos. Gigascience 4, 7 (2015).

Consorcio, G. P. et al. Una referencia mundial para la variación genética humana. Naturaleza 526, 68 (2015).

Zenin, A. et al. Estadísticas resumidas de asociación de todo el genoma para la duración de la salud humana. Zenodo, https://doi.org/10.5281/zenodo.1302861 (2018).


5. CONCLUSIÓN

El análisis bioinformático reveló que los SNP en seis genes (NCOR1, GATA3, CDH1, cajero automático, AKT1, y PTEN) se asociaron significativamente con los niveles de expresión correspondientes y participaron en múltiples vías implicadas en el desarrollo del cáncer. Además, un análisis adicional indicó que la mutación SNP en los sitios AKT1 rs121434592, CDH1 rs587783047 y GATA3 rs763236375 eran las razones importantes para afectar la expresión génica. Además, el análisis de OS y RFS encontró que la expresión de NCOR1, GATA3, CDH1, y Cajero automático estaban estrechamente relacionados con la supervivencia de los pacientes con cáncer de mama. Por lo tanto, la detección de mutaciones genéticas y la exploración de su expresión correspondiente se pueden utilizar para predecir el pronóstico de los pacientes. Los hallazgos requerirán validación en estudios clínicos a gran escala para determinar su precisión y sensibilidad en la tumorigénesis y predecir los resultados de los pacientes. Sin embargo, el objetivo de este estudio es aportar nuevas ideas para el diagnóstico clínico y la evaluación del pronóstico a través del análisis bioinformático. Nuestros resultados proporcionan una base bioinformática importante y una base teórica relevante para orientar los estudios de seguimiento sobre el cáncer de mama.


¿Cómo puedo encontrar el SNP de un gen más estudiado? - biología

Genotipado, problema de ensamblaje de haplotipos, mapa de haplotipos, genómica funcional y proteómica

Preparado por Kaleigh Smith

1 Introducción a los SNP

El siguiente documento proporciona una introducción a los polimorfismos de un solo nucleótido y la motivación que proporcionan para la investigación actual en farmacogenómica (y otras áreas) y la tecnología para facilitar esta investigación. La principal iniciativa detrás del trabajo relacionado con SNP es que las diferencias genéticas entre las personas se utilizarán para predecir fenotipos y filogenia. En general, discutiremos los SNP tal como ocurren en secuencias genómicas humanas a menos que se especifique lo contrario. Este texto va acompañado de un conjunto de diapositivas sobre SNP también disponibles en esta ubicación.

1.1 Polimorfismo genético

Polimorfismo genético Una diferencia en la secuencia de ADN entre individuos, grupos o poblaciones. Las fuentes incluyen SNP, secuencias repetidas, inserciones, deleciones y recombinación. (por ejemplo, un polimorfismo genético puede dar lugar a ojos azules frente a ojos marrones, o cabello liso frente a cabello rizado). Los polimorfismos genéticos pueden ser el resultado de procesos fortuitos o pueden haber sido inducidos por agentes externos (como virus o radiación). Si se ha demostrado que una diferencia en la secuencia de ADN entre los individuos está asociada con una enfermedad, generalmente se la denominará mutación genética. Los cambios en la secuencia de ADN que se ha confirmado que son causados ​​por agentes externos también se denominan generalmente "mutaciones" en lugar de "polimorfismos". [Fuente: PHRMA Genomics Lexicon]

Mutación genética Un cambio en la secuencia de nucleótidos de una molécula de ADN. Las mutaciones genéticas son una especie de polimorfismo genético. El término "mutación", en oposición a "polimorfismo", se usa generalmente para referirse a cambios en la secuencia de ADN que no están presentes en la mayoría de los individuos de una especie y que se han asociado con una enfermedad (o riesgo de enfermedad) o son el resultado de daño infligido por agentes externos (como virus o radiación). [Fuente: PHRMA Genomics Lexicon]

Un polimorfismo de un solo nucleótido es una variación de la fuente en un genoma. Un SNP (& # 223nip ") es una mutación de una sola base en el ADN. Los SNP son la forma más simple y la fuente más común de polimorfismo genético en el genoma humano (90% de todos los polimorfismos de ADN humano).

Hay dos tipos de sustituciones de bases de nucleótidos que dan como resultado SNP:

Variación de secuencia
La variación de la secuencia causada por los SNP se puede medir en términos de diversidad de nucleótidos, la proporción del número de diferencias de bases entre dos genomas sobre el número de bases comparadas. Esto es aproximadamente 1/1000 (1/1350) pares de bases entre dos cromosomas equivalentes.

Los SNP no se distribuyen uniformemente en todo el genoma humano, ni en todos los cromosomas ni dentro de un solo cromosoma. Hay un tercio de los SNP dentro de las regiones codificantes que los SNP de las regiones no codificantes. También se ha demostrado que la variación de secuencia es mucho menor para los cromosomas sexuales. Dentro de un solo cromosoma, los SNP se pueden concentrar en una región específica, lo que generalmente implica una región de interés médico o de investigación. Por ejemplo, la secuencia que codifica proteínas que presentan antígenos al sistema inmunológico en el cromosoma 6 muestra una diversidad de nucleótidos muy alta en comparación con las otras áreas de ese cromosoma.

1.3 Codificación de SNP de región

Un SNP en una región codificante puede tener dos efectos diferentes sobre la proteína resultante:

Sinónimo la sustitución no provoca ningún cambio de aminoácidos en la proteína que produce. A esto también se le llama mutación silenciosa.

No sinónimo la sustitución da como resultado una alteración del aminoácido codificado. Una mutación sin sentido cambia la proteína provocando un cambio de codón. Una mutación sin sentido da como resultado un codón de terminación fuera de lugar. La mitad de todos los SNP de secuencia codificante dan como resultado cambios de codones no sinónimos.

Los SNP también pueden ocurrir en regiones reguladoras de genes. Estos SNP son capaces de cambiar la cantidad o el momento de la producción de una proteína. Tales SNP son mucho más difíciles de encontrar y comprender y la regulación genética en sí misma aún no se comprende con claridad.

1.4 Fenotipo, genotipo y haplotipo

Fenotipo, genotipo y haplotipo son los conceptos más importantes y básicos relacionados con los SNP. Es importante tener una comprensión clara de cada término y los procesos de genotipado y haplotipado.

Fenotipo Las propiedades observables de un individuo tal como se han desarrollado bajo las influencias combinadas del genotipo del individuo y los efectos de factores ambientales. [Fuente: Purves et al. Vida: la ciencia de la biología]

Genotipo Una descripción exacta de la constitución genética de un individuo, con respecto a un rasgo único o un conjunto más amplio de rasgos. [Fuente: Purves et al. Vida: la ciencia de la biología. La constitución genética de un organismo revelada por análisis genético o molecular, es decir, el conjunto completo de genes, tanto dominantes como recesivos, que posee una célula u organismo en particular. [IUPAC Biotech]

Genotipado La genotipificación se define normalmente como la detección de genotipos de SNP individuales. En organismos diploides (que tienen alelos alternativos de SNP), como los seres humanos, el enlace de genotipos de SNP particulares en cada cromosoma en un par homólogo (el haplotipo) puede proporcionar información adicional que no está disponible solo en el genotipado de SNP. [Actualización de CHI SNP]

Haplotipo (genotipo haploide) Un patrón particular de SNP (o alelos) secuenciales que se encuentran en un solo cromosoma. Estos SNP tienden a heredarse juntos con el tiempo y pueden servir como marcadores de genes de enfermedades. El examen de conjuntos de cromosomas únicos (conjuntos de haploides), a diferencia de los pares de cromosomas habituales (conjuntos de diploides), es importante porque las mutaciones en una copia de un par de cromosomas pueden estar enmascaradas por secuencias normales presentes en la otra copia [Actualización del SNP de CHI] . Una combinación de alelos de loci estrechamente relacionados que se encuentran en un solo cromosoma y tienden a heredarse juntos. La disposición lineal y ordenada de los alelos en un cromosoma. El análisis de haplotipos es útil para identificar eventos de recombinación. [Fuentes: Purves et al. Life: The Science of Biology y PHRMA Genomics Lexicon]

Haplotipado El haplotipado implica agrupar sujetos por haplotipos, o patrones particulares de SNP secuenciales, que se encuentran en un solo cromosoma. [Actualización de los SNP de CHI]

La variación genómica, y por lo tanto los SNP, es responsable de la diversidad en la especie humana. De ello se deduce que, dado que los SNP explican la diversidad en los genotipos humanos, pueden mapearse para dar cuenta de la diversidad en los fenotipos. Los SNP individuales pueden servir como indicadores para los genes de enfermedades; se cree que los haplotipos son superiores para este propósito. El estudio de los haplotipos dentro de los genes, que también es de gran interés en la actualidad, brinda la oportunidad de descubrir marcadores confiables de varios fenotipos "[CHI Actualización de SNP] Esta relación constituye la base y la motivación para la identificación y genotipado de SNP.

2 SNP Discovery y SNP Genotyping

2.1 Detección de SNP o descubrimiento de SNP

Hay más de un millón de SNP identificados (1,255,326 SNP mapeados en la Organización del Consorcio SNP). Los experimentos de validación han demostrado que el 95% de estos son polimorfismos únicos y válidos (no el producto del error o la redundancia).

Los métodos para el descubrimiento / detección de SNP involucran un conjunto de reacciones bioquímicas que aíslan la ubicación precisa de un SNP sospechoso y luego determinan directamente la identidad del SNP, utilizando una enzima llamada ADN polimerasa. [Fuente: http://www.orchid.com/]

Además, muchos SNP se detectaron inicialmente comparando diferentes genomas secuenciados. Este trabajo se ha ampliado ahora a un esfuerzo a una escala mucho mayor para determinar los SNP (genotipos) de muchos genomas de diferentes poblaciones.

Observe la diferencia entre el descubrimiento / detección de SNP y la puntuación de SNP o la genotipificación de SNP. Uno se esfuerza por identificar nuevas ubicaciones de SNP en el genoma, mientras que el otro incluye métodos para determinar los genotipos de muchos individuos para SNP particulares que ya han sido descubiertos "[NIH, Methods for Discovering and Scoring Single Nucleotide Polymorphisms, Request for Applications Jan 9, 1998]. Esto finaliza nuestra discusión sobre la detección de SNP. Lo que sigue es una descripción general de las aplicaciones relacionadas con SNP "post-genómicas", tales como el genotipado de alto rendimiento, la determinación de haplotipos a partir de genotipos y el mapeo de haplotipos.

2.2 Genotipado SNP de alto rendimiento

La segunda fase de la genómica humana (la primera es la secuenciación del genoma humano) implica el cribado a gran escala de diferentes poblaciones humanas en busca de polimorfismos de ADN significativos. La información recopilada conducirá a asociaciones precisas entre genotipo y fenotipo.

La genotipificación de SNP de alto rendimiento es el proceso de identificación rápida y rentable de los valores de SNP en tantos genomas humanos individuales diferentes como sea posible. Los pasos de la genotipificación de SNP implican la preparación de muestras de ADN, la amplificación por PCR y los ensayos de microarrays. Para el último paso, la tecnología debe etiquetar las ubicaciones de SNP de ambos alelos en la muestra de ADN y determinar los valores base utilizando tecnología de microarrays.

Orchid Biocomputer y Affymetrix son los líderes en el suministro de tecnología de genotipado SNP. Han desarrollado ensayos de genotipado de polimorfismo de nucleótido único (SNP) que combinan la tecnología de extensión de cebadores GBA® patentada de Orchid con una matriz universal Affymetrix GeneChip®. Sus tecnologías pueden proporcionar un rendimiento ultra alto de 100.000 genotipos / día. Es interesante notar que casi todos los genotipos de SNP usan equipo Affymetrix (incluido GenFlex, el microarray universal de Affymetrix).

El genotipado de SNP de alto rendimiento logra el objetivo de registrar los valores base de ubicación de SNP de miles de personas de una población determinada. Los datos del genotipo recopilados a partir de la genotipificación de alto rendimiento se utilizan luego para determinar los haplotipos relacionados. Esta información se utiliza luego para el mapeo SNP que se analiza más adelante en este resumen.

3 El problema del ensamblaje de haplotipos SNP

El genotipado de SNP ha introducido un problema computacional complejo (afortunadamente). Este problema fue publicado por primera vez por Lancia et al. en el artículo "Problemas, complejidad y algoritmos de SNP", y seguido de & # 196lgorithmic Strategies for the single nucleotide polimorphism haplotype assembly problem "por Lipert et al. Antes de comprender la motivación de este problema, es importante estar familiarizado con lo siguiente condiciones.

Diploide El complemento cromosómico consta de dos copias (homólogos) de cada cromosoma. En los seres humanos, cada par de cromosomas tiene un origen diferente (madre, padre). [Fuente: Purves et al. Vida: la ciencia de la biología]

Alelo Las formas alternativas de un carácter genético que se encuentran en un locus determinado de un cromosoma. [Fuente: Purves et al. Vida: la ciencia de la biología]

Homocigoto Un organismo diploide que tiene alelos idénticos de un gen dado en ambos cromosomas homólogos. [Fuente: Purves et al. Vida: la ciencia de la biología]

Heterocigoto Un organismo diploide que tiene diferentes alelos de un gen dado en ambos cromosomas homólogos. [Fuente: Purves et al. Vida: la ciencia de la biología]

Haplotipo Una combinación de alelos de loci estrechamente relacionados que se encuentran en un solo cromosoma y tienden a heredarse juntos. La disposición lineal y ordenada de los alelos en un cromosoma. [Fuentes: Purves et al. Life: The Science of Biology y PHRMA Genomics Lexicon]

El problema del ensamblaje de haplotipos de SNP implica determinar los haplotipos a partir de fragmentos de secuencia genómica determinados por genotipificación de SNP. Para obtener más información sobre los haplotipos, consulte la siguiente sección "Mapa de haplotipos". Los haplotipos también se pueden determinar directamente a partir del ADN genómico. Sin embargo, esto a veces es más costoso y lento que un método computacional para determinar haplotipos.

La tecnología de genotipado humano a gran escala introduce un interesante problema algorítmico de dividir los datos del genotipo SNP en particiones de haplotipos. El problema surge porque los fragmentos genómicos que constituyen el genotipo de un organismo diploide contienen dos copias de cada localización o cromosoma (dos haplotipos). A continuación, los fragmentos de ADN polimórfico deben ensamblarse en su haplotipo original.

Los artículos describen algoritmos para determinar haplotipos en regiones largas a partir de fragmentos de secuencia corta. Los fragmentos alineados deben dividirse en dos conjuntos de acuerdo con su homólogo original. Esta partición se logra mediante el uso de valores de SNP en conflicto entre fragmentos para crear un gráfico de conflicto de SNP o un gráfico de conflicto de fragmentos. El siguiente es un resumen de los dos artículos antes mencionados.

El problema del montaje del SNP (Lancia)
Un ensamblaje de SNP es una tupla (S, F, R) donde S es un conjunto de n SNP, F es un conjunto de m fragmentos y R es una relación R: S x F <0, A, B> que indica si un SNP s S no ocurre en un fragmento f F (marcado con 0) o si ocurre, el & # 223core "de s (A o B).

Haplotipado computacional (Lancia)
Una partición de F en dos bloques: H1 y H2 llamados haplotipos. Un ensamblaje SNP es 'factible' cuando existe un haplotipado tal que:

"s S y" f, f HI: R (s, f) = R (s, f ) o R (s, f) = 0 o R (s, f ) = 0.

Un SNP presente s S tiene valor A o B. Recuerde que el organismo es diploide y hay copias de ese SNP en fragmentos tomados de ambos homólogos del cromosoma de la muestra. Si el SNP es heterocigoto, entonces el SNP tendrá el valor A en H1 y B en H2 (o viceversa). Si el SNP es homocigoto, no se puede utilizar para ayudar a determinar el haplotipo del fragmento y, por lo tanto, no se considera.

Figura 1: Los artículos definen una matriz SNP como se muestra.

S y F se utilizan para crear gráficos de conflicto GRAMOS y GF de modo que un algoritmo pueda determinar la menor cantidad de s S o f F que deben eliminarse como errores para que las gráficas estén libres de conflictos. Dos fragmentos fI yfj están en conflicto cuando existe un SNP s S tal que R (fI, s) 0 y R (fj, s) 0 y R (fI, s) R (fj, s). Dos SNP s1 ys2 están en conflicto cuando existen dos fragmentos f1 yf2 tal que tres de R (f1, s1), R (f2, s1), R (f1, s2) o R (f2, s2) tienen el mismo valor distinto de cero y uno tiene el valor distinto de cero opuesto.

Figura 2: Ejemplo de matriz de SNP y el gráfico de conflicto de fragmentos asociado y el gráfico de conflicto de SNP.

El problema del ensamblaje del haplotipo SNP se ha convertido ahora en el Problema de eliminación de fragmentos mínimos o en el Problema de eliminación de SNP mínimo. Ambos problemas toman GF o GS respectivamente como entrada y devuelve una G máximamente grandeF que es bipartito (problema de subgrafo bipartito inducido por MAX) o una G máximamente grandeS que es un conjunto estable (Vertex Cover). Tenga en cuenta que GF es bipartito iff GS es un conjunto estable. Ambos problemas son NP-difíciles.

f Figura 3: Posible GF y GS para el ejemplo anterior.

El conjunto estable máximo (cobertura de vértice) es un problema muy bien estudiado que puede atacarse utilizando uno de los muchos algoritmos de aproximación. Por lo tanto, nos centraremos en el problema de encontrar el subgrafo bipartito más grande en GF. Un gráfico G es bipartito si no contiene ciclos impares. Por lo tanto, consideraremos el problema de MFR en términos de un problema de cobertura, el problema de cobertura de ciclo impar.

Claramente, OCC determina el conjunto mínimo de vértices F para eliminar de GF para eliminar todos los ciclos impares y, por lo tanto, hacer que el gráfico sea bipartito. OCC tiene un algoritmo de aproximación de 9/4. Aún no se ha mostrado con parámetro fijo tratable (FPT). Nos gustaría considerar un algoritmo con tiempo exponencial acotado para resolver una versión parametrizada de este problema, k-OCC. El problema de Cubierta de ciclo k-impar es como sigue: Dado un gráfico G = (V, E), encuentre V , | V | k y | V | es mínimo tal que G = V - V es bipartito. Ésta es la función central a establecer al resolver MFR. El segundo artículo describe un enfoque ingenuo de bifurcación y encuadernación basado en la búsqueda de un árbol de posibles soluciones. Nuestro enfoque implica la creación de un conjunto de reglas de reducción para condensar GF GF R, lo que permite aplicar algoritmos eficientes (parametrizados) para encontrar una pequeña (& lt k) cobertura de ciclo impar de GF R, para determinar que GF R contiene más de k ciclos impares disjuntos (y por lo tanto no tiene un OCC lo suficientemente pequeño) o contiene otra estructura de gráfico que no permite un OCC lo suficientemente pequeño.

Este es un trabajo en progreso. Sin embargo, es bueno leer los artículos de Lancia para comprender los problemas algorítmicos relacionados con la haplotipificación de SNP. Que se sepa que existen métodos estadísticos sólidos para realizar el haplotipado y, a medida que bajan los costos de los ensayos de SNP, también existen métodos biológicos para determinar los haplotipos.

4 Mapeo SNP

El mapeo de SNP (mapeo de asociación) es una de las áreas más activas de la investigación post-genómica de SNP. Este trabajo implica identificar sitios SNP a lo largo del genoma para rastrear genes de enfermedades. Un mapa SNP humano especifica las contribuciones de genes individuales a enfermedades y otros fenotipos.

SNP Consortium Ltd. es una fundación sin fines de lucro que proporciona al público más de un millón de SNP detectados y sus anotaciones. Su misión es desarrollar hasta 300.000 SNP distribuidos uniformemente en todo el genoma humano y hacer que la información relacionada con estos SNP esté disponible para el público sin restricciones de propiedad intelectual. http://snp.cshl.org/

Figura 4: El esquema del mapeo de SNP (mapeo de haplotipos) y una de sus muchas influencias en el cuidado de la salud.

4.1 Un mapa de haplotipos para el genoma humano

El mapeo de SNP logra identificar genes individuales responsables de enfermedades monogénicas como la de Huntington y la fibrosis quística; sin embargo, la mayoría de los rasgos están influenciados por múltiples genes y factores ambientales. Como una extensión del mapeo básico de SNP, la investigación de la variación genética humana determina cómo la variación entre individuos o grupos contribuye al estado de salud de ese individuo o grupo. Este tipo de investigación tiene la iniciativa de desarrollar una mapa de haplotipos del genoma humano. El propósito del mapa es relacionar la variación genética humana con la predisposición a enfermedades, específicamente trastornos comunes o complejos.

Los científicos han descubierto que existe una pequeña cantidad de versiones diferentes de ciertos bloques genéticos (una pequeña cantidad de haplotipos). Esto significa que hay una pequeña cantidad de patrones de SNP en cada posición cromosómica. Por ejemplo, para algunos bloques, solo se encontraron cuatro o cinco patrones de SNP (cuatro o cinco haplotipos diferentes) que representan el 80% -90% de la población total. Este hallazgo simplifica enormemente la búsqueda de asociaciones entre las variaciones del ADN y la enfermedad.

Además, como muchos de estos patrones de haplotipos son específicos de poblaciones (grupos), el mapa facilitará la realización de estudios de asociación en poblaciones seleccionadas donde ciertas enfermedades son más o menos prevalentes.

La siguiente información de CHI pone en contexto el mapeo de haplotipos.

[Mapa de haplotipos] Francis Collins, director de NHGRI, hablando en BIO 2001 (San Diego CA, EE. UU., Junio ​​de 2001) anunció planes para un esfuerzo público-privado para crear un mapa de haplotipos humanos. Los creadores esperan este llamado mapa de haplotipos será una herramienta para identificar los genes que contribuyen al desarrollo de enfermedades complejas como el cáncer, la diabetes y las enfermedades mentales. [L. Helmuth "Map of the Human Genome 3.0" Science 293 (5530): 583-5 27 de julio de 2001] [del Glosario de CHI].

[Mapeo de haplotipos] El mapeo de haplotipos se lleva a cabo a menudo como parte de una exploración del genoma. En una población aislada, la aparición de una enfermedad mendeliana rara casi siempre se atribuye a un solo gen fundador o mutación. El alelo de la enfermedad se puede identificar buscando una firma de haplotipo común compartida entre los pacientes. A medida que la firma del haplotipo ancestral se transmite de generación en generación, se interrumpe por recombinación. La conservación parcial de la firma del haplotipo en un paciente sugiere fuertemente que el locus de la enfermedad reside en la región conservada del haplotipo. [L. Peltonen et. al, & # 220SE DE AISLOS DE POBLACIÓN PARA EL MAPEO DE CARACTERÍSTICAS COMPLEJAS "Nature Reviews Genetics 1: 182-190 (2000)

La construcción a partir de un mapa de haplotipos plantea muchas preocupaciones éticas. Recordemos que el proyecto del genoma humano enfrentó oposición cuando se propuso inicialmente y todavía lo hace. Los problemas éticos que rodean a un mapa de haplotipos son mucho más graves y delicados. Un mapa de haplotipos puede incluir marcadores que indiquen la raza y el origen étnico de una persona.

4.2 Árboles de haplotipos (filogenia basada en haplotipos)

Los árboles de haplotipos proporcionan métodos para examinar la filogenia de individuos basados ​​en sus haplotipos y también proporcionan métodos para comprender la selección natural molecular (genómica). Están construidos para comprender la evolución humana, las cronologías históricas y para determinar genéticamente la genealogía. Estos árboles se pueden crear para una especie o se pueden crear para representar filogenias haplotípicas entre especies. Recuerde que hay una pequeña cantidad de haplotipos (patrones únicos) para la ubicación de interés elegida. Una población o grupo de haplotipos es un conjunto de haplotipos muy similares. A menudo, el haplotipo en cuestión es un gen heredado de la madre o un conjunto de ubicaciones en uno de los cromosomas sexuales. Se ha demostrado que los miembros de una población generalmente comparten el mismo patrón de haplotipos. Estos árboles a menudo se combinan con árboles basados ​​en homogía para proporcionar un retrato más confiable de las genologías.

Los árboles de haplotipos se construyen con parsimonia y los nodos del árbol representan haplotipos únicos. Los haplotipos se desarrollan a partir de haplotipos ancestrales más antiguos. Se cree que estos haplotipos más antiguos están más extendidos en la especie y, por lo tanto, generalmente están representados por nodos internos, mientras que los haplotipos más nuevos (patrones surgidos más recientemente) estarán representados por nodos de hojas. Tenga en cuenta que es fundamental seleccionar un haplotipo que sea resistente a la recombinación y las mutaciones.

Figura 5: La construcción de un árbol de haplotipos

Jin, et al describen el uso de un árbol de haplotipos para estudiar la historia migratoria, la deriva genética y la selección natural en su artículo de 1999 "La distribución de haplotipos de una región del cromosoma 21 distingue múltiples migraciones humanas prehistóricas". Los haplotipos considerados en su investigación se originan en una región del cromosoma 21 de 565 pb cerca del gen MX1 que contiene 12 ubicaciones de SNP y carecen de recombinación y eventos de mutación recurrentes. El documento señala que algunos haplotipos ocurren con mucha más frecuencia que otros y que la variedad de haplotipos presentes en diferentes poblaciones varía con las poblaciones de mayor edad que muestran una mayor variedad de haplotipos.

Figura 6: Un árbol de haplotipos de muestra según se determina en el documento mencionado anteriormente.

Un ejemplo de una aplicación comercial de árboles de haplotipos es la empresa de Internet "DNA Family Tree" - http://www.familytreedna.com/, una "empresa de pruebas genealógicas impulsada por el ADN" que se autodeclara. Los científicos de esta empresa utilizan un conjunto de métodos estadísticos y filogenéticos (construcción de árboles) que muestran los vínculos genealógicos exactos entre los haplotipos (cromosoma Y o ADN mitocondrial) para determinar el linaje antiguo de un cliente interesado. En particular, uno de los productos se utiliza para determinar si una clienta tiene ascendencia nativa americana. La empresa puede determinar esto porque "los estudios genéticos han demostrado que los ADNmt de los nativos americanos pertenecen a uno de los cinco linajes maternos distintos. Estos han sido designados como haplogrupos A, B, C, D y X. Cada uno de ellos está definido por un conjunto específico de mutaciones. / marcadores que se encuentran en las regiones codificantes y no codificantes del genoma del mtDNA ". Este uso de haplotipos introduce de nuevo muchas preocupaciones éticas y no es difícil imaginar cómo la tecnología de haplotipos podría facilitar la discriminación genómica.

5 aplicaciones SNP

Los siguientes son campos que utilizan información de SNP y mapas de haplotipos. La principal aplicación de la información del SNP es la atención médica mejorada y futurista. La genómica y específicamente la investigación de SNP se pueden utilizar para mejorar la atención médica a través de la terapia génica, para producir nuevos objetivos para el descubrimiento de fármacos, para refinar el proceso de desarrollo de fármacos y para descubrir nuevos diagnósticos.

5.1 Farmacogenómica

[Farmacogenómica] La ciencia de comprender la correlación entre la estructura genética (genotipo) de un paciente individual y su respuesta al tratamiento farmacológico. Algunos medicamentos funcionan bien en algunas poblaciones de pacientes y no tan bien en otras. El estudio de la base genética de la respuesta del paciente a la terapéutica permite a los desarrolladores de fármacos diseñar tratamientos terapéuticos de manera más eficaz. [Fuente: PHRMA Genomics Lexicon]

Todos los aspectos de la farmacogenómica requieren datos de genotipado de alto rendimiento, específicamente la población objetivo de un fármaco o la población de personas que reaccionan mal con el fármaco. Además, este tipo de investigación puede conducir a tratamientos específicos de la población. El alto costo de las retiradas de medicamentos ha proporcionado una iniciativa para el diseño avanzado de medicamentos que incluye estudios de validación del objetivo del medicamento, así como estudios para predecir eventos adversos y falta de eficacia.

Un ejemplo de experimento farmacogenómico puede proceder de la siguiente manera:

5.2 Diagnóstico SNP

[Pruebas genéticas]: el análisis del material genético de un individuo. Entre los propósitos de las pruebas genéticas podría estar recopilar información sobre la predisposición genética de un individuo a una condición de salud particular o confirmar un diagnóstico de enfermedad genética. [Fuente: PHRMA Genomics Lexicon]

El genotipo de un individuo se puede determinar y luego analizar de acuerdo con un mapa de haplotipos para determinar el riesgo de enfermedad del paciente o la recepción de diferentes tratamientos.

5.3 SNP en proteómica funcional y terapia génica

La proteómica funcional relacionada con SNP implica la identificación de SNP funcionales que modifican la estructura y función de proteínas y sitios activos de proteínas. La proteómica funcional está estrechamente relacionada con el diseño de fármacos modernos (posgenómicos) y la función de la información del SNP ayuda a descubrir nuevas dianas terapéuticas. Lo más interesante es que al desarrollar una base de datos de las modificaciones generadas por SNP funcionales (codificadores) en proteínas relacionadas con enfermedades, "se pueden diseñar nuevos compuestos para corregir o mejorar los efectos de esas mutaciones en la población". [Fuente: Genodyssee]

¿Cuáles son estos compuestos y cómo se puede utilizar el conocimiento de los efectos de los SNP para corregir poblaciones con SNP indeseables o mejorar las poblaciones mediante la introducción de las ventajas de un SNP deseable? Aparte de los medicamentos, aquí hay algunas terapias genómicas interesantes que pueden volverse más factibles a medida que la información de SNP en forma de árboles y mapas se vuelva más detallada.

[Terapia génica de la línea germinal] La terapia génica de la línea germinal implica la inserción de genes normales en células germinales o huevos fertilizados en un intento de crear un cambio genético beneficioso que se pueda transmitir a la descendencia de un organismo (por ejemplo, para corregir un rasgo genético asociado con la enfermedad). Si se introduce un cambio a través de la terapia génica de la línea germinal, ese cambio puede estar presente en la descendencia desde el nacimiento en todas las células del cuerpo. Consulte genómica y compárelo con la terapia génica de células somáticas. [Fuente: PHRMA Genomics Lexicon]

[Mutación genética de células somáticas]: una mutación genética en una célula somática. Estas mutaciones, que no se heredan de los padres sino que ocurren durante la vida de un organismo, a menudo se conocen como & # 228 mutaciones genéticas adquiridas. "Las mutaciones genéticas de células somáticas no se transmiten a la descendencia. [Fuente: PHRMA Genomics Lexicon]

[Terapia génica de células somáticas] La terapia génica de células somáticas implica la inserción de genes en las células con fines terapéuticos, por ejemplo, para inducir a las células tratadas a producir una proteína que falta en el cuerpo. No afecta la composición genética de la descendencia de un paciente y, por lo general, no cambia todas, ni siquiera la mayoría, de las células del receptor. [Fuente: PHRMA Genomics Lexicon]

6 La economía de SNP

El siguiente es un extracto del artículo del Cambridge Healthtech Institute: "El mercado de investigación de SNP podría alcanzar los $ 1.2 mil millones en 2005, si la farmacogenómica avanza el 1 de enero de 2002". Por Malorye Allison Branca. [Fuente: http://www.chireports.com/content/articles/snpresearch.asp]

Los gastos anuales en investigación del polimorfismo de un solo nucleótido (SNP) podrían multiplicarse por siete en 2005, pasando de 158 millones de dólares en 2001 a más de 1.200 millones de dólares, según un nuevo informe del Cambridge Healthtech Institute (CHI), Implicaciones comerciales de los avances en la identificación. , Mapeo y aplicación de polimorfismos de un solo nucleótido. (Para obtener más información sobre este informe, visite www.chireports.com/content/reports/snpupdate01.asp.) "

"Tres factores principales impulsarán este crecimiento:

  • Disminuciones progresivas en el costo por ensayo de genotipado, debido a los avances tecnológicos.
  • Aumento del interés en la farmacogenómica, o la adaptación del tratamiento a los pacientes en función de sus perfiles genómicos, por parte de empresas farmacéuticas, biotecnológicas y de herramientas genómicas.
  • El impulso para hacer un mayor número de ensayos por estudio ".

"En la actualidad, las aplicaciones más comunes de las herramientas de investigación relacionadas con SNP son los estudios de asociación entre genes y enfermedades y la validación de objetivos de fármacos. Otras aplicaciones populares son los estudios o diagnósticos de susceptibilidad a enfermedades, los estudios farmacogenómicos para ensayos clínicos, la detección de objetivos de fármacos y las nuevas tecnologías Anticipamos que los estudios de validación de objetivos y asociación de enfermedades continuarán siendo las tareas más comunes relacionadas con SNP en el descubrimiento y desarrollo de fármacos; sin embargo, esperamos que para 2003, la aplicación de estudios de SNP en farmacogenómica comience a aumentar de manera constante y podría rápidamente convertirse en un mercado multimillonario en sí mismo ".

7 Recursos

Artículos del Cambridge Healthtech Institute: http://www.chireports.com

Glosario del Cambridge Healthtech Institute: http://www.genomicglossaries.com/

Compañía DNA Family Tree: http://www.familytreedna.com/

Lancia, G., Afna, V., Istrail, S., Lippert, R. y Schwartz, R .. Problemas, complejidad y algoritmos de SNP. ESA 2002, LNCS 2161, págs. 182-193, 2001. Springer-Verlag Berlin Heidelberg 2001.

Jin, Li y col. La distribución de haplotipos de una región del cromosoma 21 distingue múltiples migraciones humanas prehistóricas. Proc. Natl. Acad. Sci. EE. UU. Vol. 96, págs. 3796-3800, marzo de 1999.

Lippert, R., Schwartz, R., Lancia, G. e Istrail, S. Estrategias algorítmicas para el problema del ensamblaje del haplotipo del polimorfismo de un solo nucleótido. Briefings en Bioinformática. Volumen 3, NO 1, 1-9. Febrero de 2002.

Mapa del genoma humano 3.0, BioSINO, Laura Helmuth http://www.biosino.org/bioinformatics/010814-4.htm

Orchid BioSciences www.orchid.com

Investigación farmacéutica y fabricantes de América (PhRMA) Glosario de genómica: http://genomics.phrma.org/lexicon/

Detalles de SNP: SNP Web Source, Xuan Chen (sin conexión)

Estudios de las implicaciones éticas, legales y sociales de la investigación de la variación genética humana para individuos y diversos grupos raciales y étnicos: http://grants.nih.gov/grants/guide/rfa-files/RFA-HG-02-003.html

Archivo traducido de T mi X por T T H, versión 2.25.
El 2 de mayo de 2002, 14:21.


Después de una búsqueda de 10 años, los científicos encuentran el segundo gen de "sueño breve"

Después de una década de búsqueda, los científicos de la Universidad de California en San Francisco que identificaron el único gen humano conocido por promover el "sueño corto natural", el sueño nocturno de por vida que dura solo de cuatro a seis horas pero que deja a las personas sintiéndose completamente descansado, han descubierto un segundo.

Ying-Hui Fu, PhD, dirigió los equipos de investigación que descubrieron ambos genes del sueño corto.

"Antes de identificar el primer gen del sueño corto, la gente realmente no pensaba en la duración del sueño en términos genéticos", dijo Ying-Hui Fu, PhD, profesor de neurología y miembro del Instituto Weill de Neurociencias de la UCSF. Fu dirigió los equipos de investigación que descubrieron ambos genes del sueño corto, el más nuevo de los cuales se describe en un artículo publicado el 28 de agosto de 2019 en la revista. Neurona.

Según Fu, muchos científicos alguna vez pensaron que ciertos comportamientos del sueño no podían estudiarse genéticamente. “El sueño puede ser difícil de estudiar usando las herramientas de la genética humana porque la gente usa alarmas, café y pastillas para alterar sus ciclos naturales de sueño”, dijo. Estos perturbadores del sueño, según se pensaba, dificultaban a los investigadores distinguir entre las personas que duermen naturalmente menos de seis horas y las que lo hacen solo con la ayuda de un estimulante artificial.

Las personas que duermen poco naturalmente siguieron siendo un misterio hasta 2009, cuando un estudio realizado por el equipo de Fu descubrió que las personas que habían heredado una mutación particular en un gen llamado DIC2 promediaron solo 6.25 horas de sueño por noche, los participantes del estudio que carecían de la mutación promediaron 8.06 horas. Este hallazgo proporcionó la primera evidencia concluyente de que el sueño corto natural es, al menos en algunos casos, genético. Pero esta mutación es rara, por lo que si bien ayudó a explicar algunos de los que duermen poco por naturaleza, no pudo explicarlos a todos.

Louis Ptáček, MD, coautor principal del nuevo estudio.

"El sueño es complicado", dijo Louis Ptáček, MD de UCSF, profesor distinguido John C. Coleman en enfermedades neurodegenerativas y coautor principal del nuevo estudio. "No pensamos que hubiera un solo gen o una región del cerebro que le dijera a nuestros cuerpos que se durmieran o se despertaran". Ptáček y Fu razonaron que tenía que haber otras causas, aún no descubiertas, del sueño corto.

Como describe el nuevo estudio, se produjo un gran avance cuando los investigadores identificaron una familia que incluía tres generaciones sucesivas de durmientes cortos naturales, ninguno de los cuales albergaba el DIC2 mutación. Los investigadores utilizaron la secuenciación de genes y una técnica conocida como análisis de ligamiento, que ayuda a los científicos a identificar la ubicación cromosómica exacta de las mutaciones asociadas con un rasgo en particular, para examinar el genoma de la familia. Sus esfuerzos descubrieron una mutación de una sola letra en un gen conocido como ADRB1 que, como la mutación en DIC2, se asoció con el sueño corto natural.

Ansiosos por comprender cómo la mutación recién descubierta podría conducir a un sueño breve, los investigadores realizaron una serie de experimentos en células cultivadas en laboratorio y en ratones que habían sido modificados genéticamente para albergar una mutación idéntica en la versión de ratón de ADRB1.

Los experimentos basados ​​en células revelaron que la forma mutante del receptor adrenérgico beta-1, la proteína codificada por el ADRB1 El gen, que juega un papel en una variedad de procesos biológicos esenciales, se degrada más rápidamente que la versión no mutante, lo que sugiere que también podría funcionar de manera diferente.

Esta corazonada se confirmó en experimentos con ratones. Los investigadores descubrieron que el ADRB1 El gen estaba altamente expresado en la protuberancia dorsal, una región del tronco encefálico involucrada en la regulación del sueño. Usando una técnica conocida como optogenética, en la que las células se modifican para que puedan ser activadas por la luz, los investigadores enfocaron la luz en las neuronas en la protuberancia para estimular aquellas en las que ADRB1 fue expresado. La activación de estas neuronas despertó de inmediato a los ratones dormidos, específicamente, aquellos que estaban experimentando un sueño no REM, la fase de sueño durante la cual estas neuronas no están normalmente activas, lo que demuestra que estas neuronas promueven la vigilia.

Experimentos adicionales mostraron que las neuronas promotoras de la vigilia en la protuberancia con la versión mutada de ADRB1 se activaron más fácilmente. Además, la relación entre las neuronas que promueven la vigilia y las que promueven el sueño se inclinó fuertemente hacia las primeras en ratones con la ADRB1 mutación. Estos experimentos sugieren que la forma mutante de ADRB1 promueve el sueño corto natural porque ayuda a desarrollar cerebros que son más fáciles de despertar y que permanecen despiertos por más tiempo.

Aunque duermen menos, las personas que duermen poco naturalmente no sufren ninguno de los efectos adversos para la salud asociados con la falta de sueño. “Hoy en día, la mayoría de las personas sufren privación crónica del sueño. Si necesitas de ocho a nueve horas, pero solo duermes siete, estás privado de sueño ", dijo Fu. “Esto tiene conocidas consecuencias para la salud a largo plazo. Tiene más probabilidades de sufrir enfermedades cardiovasculares, cáncer, demencia, problemas metabólicos y un sistema inmunológico debilitado ".

Pero las personas que duermen poco naturalmente parecen beneficiarse de esta peculiaridad de su biología. Fu dice que los investigadores han descubierto que las personas que duermen poco tienden a ser más optimistas, más enérgicas y mejores multitareas. También tienen un umbral de dolor más alto, no sufren de desfase horario y algunos investigadores creen que incluso pueden vivir más tiempo. Aunque se desconocen las razones exactas de estos beneficios, Fu y Ptáček creen que su trabajo representa un paso importante hacia la comprensión de la conexión entre un buen sueño y la salud en general.

“Las personas que duermen poco naturalmente experimentan una mejor calidad y eficiencia del sueño”, dijo Fu. "Al estudiarlos, esperamos aprender qué es lo que contribuye a una buena noche de sueño, para que todos podamos dormir mejor y llevar una vida más feliz y saludable".

Autores: Los autores adicionales del estudio incluyen a Guangsen Shi, Lijuan Xing, David Wu, Bula J. Bhattacharyya, Thomas McMahon, S.Y. Christin Chong y Andrew Krystal de UCSF Christopher R. Jones de la Universidad de Utah Jason A. Chen, Giovanni Coppola y Daniel Geschwind de UCLA.

Fondos: Este estudio fue apoyado por el NINDS Informatics Center for Neurogenetics and Neurogenomics (subvención P30 NS062691), el NIH (subvenciones NS099333, NS072360, NS104782 y P30 DK063720) y el William Bowes Neurogenetics Fund.

Divulgaciones: Los autores declaran no tener conflictos de intereses.

La Universidad de California, San Francisco (UCSF) se centra exclusivamente en las ciencias de la salud y se dedica a promover la salud en todo el mundo a través de investigación biomédica avanzada, educación de posgrado en ciencias de la vida y profesiones de la salud, y excelencia en la atención al paciente. UCSF Health, que funciona como el principal centro médico académico de UCSF, incluye hospitales especializados de primer nivel y otros programas clínicos, y tiene afiliaciones en todo el Área de la Bahía.


Ver el vídeo: Τι μπορείς να κάνεις μετά τις εξετάσεις. εξεταστική. katerinaop22 (Octubre 2022).