Información

27.7: Modelado de frecuencias de población y alelos - Biología


Con el advenimiento de la secuenciación de próxima generación, se está volviendo económico secuenciar los genomas de muchos individuos dentro de una población. El modelo de reproducción de Wright-Fisher ha cumplido este papel durante los últimos 70 años.

El modelo de Wright-Fisher

Al igual que los HMM, Wright-Fisher es un proceso de Markov: en cada paso, el sistema progresa aleatoriamente y el estado actual del sistema depende solo del estado anterior. En este caso, las transiciones de estado representan reproducción. Al modelar la transmisión de cromosomas a la descendencia, podemos estudiar la deriva genética.

El modelo hace una serie de suposiciones simplificadoras:

1. El tamaño de la población, N, es constante en cada generación.
2. Solo los miembros de la misma generación se reproducen (sin superposición).

3. La reproducción ocurre al azar.
4. El gen que se modela solo tiene 2 alelos.
5. Los genes se someten a una selección neutra.

Tenga en cuenta que Wright-Fisher no es una opción adecuada si está tratando de modelar el cambio en la frecuencia de un gen que se selecciona positiva o negativamente. Si usamos Wright-Fisher para modelar los cromosomas de individuos diploides, el tamaño de la población del modelo se convierte en 2N.

En inglés, así es como funciona Wright-Fisher:

En cada generación, para cada niño, seleccionamos aleatoriamente a los padres (con reemplazo). El alelo del niño se convierte en el del padre seleccionado al azar.

Repetimos este proceso durante muchas generaciones, con los niños sirviendo como los nuevos padres, ignorando el orden de los cromosomas.

Es realmente así de simple. Para determinar la probabilidad de que existan k copias de un alelo en la generación del niño cuando tenía una frecuencia de p en la generación del padre, podemos usar esta fórmula:

[ left ( begin {array} {c}
2 N
k
end {matriz} right) p ^ {k} q ^ {2 N-k} ]

Aquí, q = (1-p). Es la frecuencia de alelos no p en la generación parental.

Ahora podemos comenzar a explorar preguntas tales como: ¿qué tan probable es y cuántas generaciones se espera que sean necesarias para que un alelo determinado se fije, lo que significa que el alelo está presente en todos los miembros de la población?

El tiempo esperado (en generaciones) para la fijación, dados los supuestos hechos por Wright-Fisher, es proporcional a 4Nmi, donde NE es el tamaño efectivo de la población.

Nuevamente, es importante tener en cuenta las limitaciones de este modelo y preguntarse si realmente tiene sentido para el sistema que está tratando de representar. Considere cómo podría modificar el modelo propuesto para tener en cuenta un coeficiente de selección que oscile entre -1 (selección negativa letal) y 1 (selección positiva fuerte).

El modelo coalescente

El problema con el modelo de Wright-Fisher es que asume que conoce las frecuencias alélicas de la generación ancentral. Cuando se trata de los genomas de las especies actuales, estas cantidades se desconocen. El modelo coalescente resuelve este enigma pensando en retrospectiva. Es decir: partimos de los alelos de la generación actual y avanzamos hacia atrás en el tiempo. El modelo de coalescencia básico hace los mismos supuestos que Wright-Fisher. En cada generación, preguntamos: ¿cuál es la probabilidad de que los dos alelos idénticos se fusionen o compartan un padre en la generación anterior?

Podemos plantear la probabilidad de que ocurra un evento de coalescencia en la generación anterior como la probabilidad de que la coalescencia no ocurra en ninguna de las generaciones t-1 anteriores a la última, multiplicada por la probabilidad de que ocurra en la anterior (la t-ésima). Generacion. Esto es equivalente a la expresión:

[P_ {c} (t) = left (1- frac {1} {2 N_ {e}} right) ^ {t-1} left ( frac {1} {2 N_ {e} }Derecha)]

Donde Nmi es el tamaño efectivo de la población.

Aproximando esta distribución geométrica como una exponencial: (P_ {c} (t) = frac {1} {2 N_ {e}} e ^ {- left ( frac {t-1} {2 N_ { e}} right)} ), podemos determinar el número esperado de generaciones hasta la coalescencia, que resulta ser 2Nmi, con una desviación estándar de 2Nmi.

Preguntar por la coalescencia de múltiple linajes en una generación dada, debemos, como en Wright-Fisher, usar una distribución binomial. La probabilidad de que k linajes se fusionen por primera vez en la generación t es:

[P left (T_ {k} = t right) = left (1- left ( begin {array} {l}
k
2
end {matriz} right) frac {1} {2 N} right) ^ {t-1} left ( begin {matriz} {l}
k
2
end {matriz} right) frac {1} {2 N} ]

Y nuevamente, esto se puede aproximar con una distribución exponencial para k suficientemente grande. El individuo en el que convergen dos linajes se conoce como el Ancestro común más reciente. Moviéndonos continuamente hacia atrás hasta que todos los antepasados ​​se unan, ¡terminamos con un nuevo tipo de árbol! Y al comparar el árbol resultante de la coalescencia con un árbol genético que hemos construido, las discrepancias entre los dos pueden indicar que se han violado ciertos supuestos del Modelo Coalescente. Es decir, puede estar ocurriendo una selección.

El modelo coalescente de múltiples especies

Podemos llevar esta idea un paso más allá y rastrear los eventos de coalescencia en múltiples especies. Aquí, cada genoma de una especie individual se trata como un linaje.

Tenga en cuenta que hay un lapso de tiempo entre la separación de dos poblaciones y el momento en que dos linajes de genes se fusionan en un ancestro común. También observe cómo la tasa de coalescencia se ralentiza a medida que N se hace más grande y para ramas cortas.

En la imagen de arriba, la coalescencia profunda se representa en azul claro para tres linajes. Las especies y los árboles genéticos aquí son incongruentes ya que C y D son hermanas en el árbol genético, pero no el árbol de especies.

Existe una ( frac {2} {3} ) posibilidad de que ocurra una incongruencia porque una vez que llegamos a la sección celeste, Wright-Fisher no tiene memoria y solo hay ( frac {1} {3} ) posibilidad de que sea congruente. El efecto de la incongruencia se llama Clasificación de linaje incompleto. Al medir la frecuencia con la que ocurre ILS, obtenemos información sobre poblaciones inusualmente grandes o longitudes de ramas inusualmente cortas dentro del árbol de la especie.

Puede construir un árbol de especies de máxima parsimonia basado en la noción de minimizar el número de eventos ILS en lugar de minimizar los eventos de duplicación / pérdida implícitos como se mencionó anteriormente. Incluso es posible combinar estos dos métodos para, idealmente, crear una filogenia que sea más precisa de lo que sería individualmente cualquiera de ellos.


00:00 Pantalla de introducción / Resultados de aprendizaje

00:18 en la lección anterior

00:42 Braquidactilia Punnett Square

00:56 - Necesitamos recapitular algunos términos clave

01:10 Definición 1. Población

01:27 Definición 2. Fenotipo

01:38 Definición 3. Genotipo (Homocigoto Dominante, Heterocigoto y Homocigoto Recesivo).

02:26 Definición 4. Fondo de genes

02:55 Definición 5. Frecuencia alélica

03:36 Examen Hardy-Weinberg Estilo Q y A (1).

08:48 Examen Hardy-Weinberg Estilo Q y A (2).

12:04 Examen Hardy-Weinberg Estilo Q y A (3).

14:38 Examen Hardy-Weinberg Estilo Q y A (4).

Verifique las especificaciones de su examen

★ Referencia de especificación de biología de nivel AQA A: - 3.7.1 Herencia (solo nivel A). En un organismo diploide, los alelos en un locus específico pueden ser homocigotos o heterocigotos. Monohíbrido y cruzado con participación de alelos dominantes, recesivos y. Los estudiantes podrían usar información para representar proporciones fenotípicas en cruces monohíbridos. Los estudiantes podrían demostrar comprensión de la probabilidad asociada con la herencia. 3.7.2 Poblaciones (solo nivel A). El principio de Hardy & ndashWeinberg proporciona un modelo matemático que predice que las frecuencias alélicas no cambiarán de generación en generación. Las condiciones en las que se aplica el principio. La frecuencia de alelos, genotipos y fenotipos en una población se puede calcular utilizando la ecuación de Hardy & ndashWeinberg. Los estudiantes podrían recopilar datos sobre la frecuencia de fenotipos observables dentro de una sola población. Los estudiantes podrían calcular frecuencias de alelos, genotipos y fenotipos a partir de datos apropiados utilizando la ecuación de Hardy & ndashWeinberg.

★ Referencia de especificación de biología de nivel CIE A: - 17.2 Natural y artificial: d) Utilice el principio de Hardy & ndashWeinberg para calcular las frecuencias de alelos, genotipos y fenotipos en poblaciones y explicar situaciones en las que este principio no aplica la selección.

★ Edexcel A Level Biology (Biología A & ndash Salters-Nuffield) Referencia de la especificación: - Tema 2: Genes y salud. 2.13 i) Conocer el significado de los términos: gen, alelo, genotipo, fenotipo, recesivo, dominante, homocigoto y heterocigoto. ii) Comprender los patrones de herencia, incluida la interpretación de la herencia monohíbrida. Tema 4: Biodiversidad y recursos naturales: 4.5 i) Comprender cómo se puede usar la ecuación de Hardy-Weinberg para ver si se está produciendo un cambio en la frecuencia de los alelos en una población a lo largo del tiempo.

★ Edexcel A Nivel Biología (Biología B) Referencia de especificación: - 8.2 Transferencia de información genética: Comprenda los términos y lsquogenotype y fenotipo y rsquo, y rsquo homocigoto y heterocigoto y rsquo, y lsquodominance rsquo, y lsquorecessive y rsquo. Ser capaz de construir cruces genéticos. 8.3 Agrupaciones de genes: comprender cómo se puede usar la ecuación de Hardy-Weinberg para monitorear los cambios en las frecuencias alélicas en una población.

★ OCR A Nivel Biología (Biología A) Referencia de la especificación: - 6.1.2 Patrones de herencia. (f) el uso del principio de Hardy & ndashWeinberg para calcular las frecuencias alélicas en poblaciones. Las ecuaciones para el principio de Hardy & ndashWeinberg se proporcionarán cuando sea necesario en las evaluaciones y no es necesario recordarlas.

★ OCR A Nivel Biología (Biología B) Referencia de la especificación: - 5.1.2 Genética y epigenética de poblaciones. (c) el uso de las ecuaciones de Hardy-Weinberg para analizar los cambios en las frecuencias de los alelos en las poblaciones. Las ecuaciones para el principio de Hardy-Weinberg se proporcionarán cuando sea necesario en las evaluaciones y no es necesario recordarlas.

★ Referencia de especificación de biología de nivel A de WJEC: - Continuidad de vida: 6. Variación y evolución. (g) el uso del principio y la ecuación de Hardy-Weinberg. (h) las condiciones en las que se aplica el principio de Hardy-Weinberg.


Ver el vídeo: Clase 1. Repaso genética poblaciones I (Enero 2022).