Matrices de Substitución PAM Y BLOSUM

49
Matrices de Matrices de Substitución Substitución PAM Y BLOSUM PAM Y BLOSUM ALUMNOS: Enciso Benavides, ALUMNOS: Enciso Benavides, Nathaly Nathaly Málaga Machaca, Málaga Machaca, Edith Edith Poma Castre, Roger Poma Castre, Roger Pomarí Juárez, Pomarí Juárez, Romeo Leonidas Romeo Leonidas

description

Matrices de Substitución PAM Y BLOSUM. ALUMNOS: Enciso Benavides, Nathaly Málaga Machaca, Edith Poma Castre, Roger Pomarí Juárez, Romeo Leonidas Sifuentes Mesía, Elsa Cecilia. Índice. Introducción Matrices PAM Ejemplo de Matriz PAM Matrices BLOSUM - PowerPoint PPT Presentation

Transcript of Matrices de Substitución PAM Y BLOSUM

Matrices de SubstituciónMatrices de SubstituciónPAM Y BLOSUMPAM Y BLOSUM

ALUMNOS: Enciso Benavides, Nathaly ALUMNOS: Enciso Benavides, Nathaly

Málaga Machaca, EdithMálaga Machaca, Edith

Poma Castre, RogerPoma Castre, Roger

Pomarí Juárez, Romeo Pomarí Juárez, Romeo LeonidasLeonidas

Sifuentes Mesía, Elsa CeciliaSifuentes Mesía, Elsa Cecilia

IntroducciónIntroducción Matrices PAMMatrices PAM Ejemplo de Matriz PAMEjemplo de Matriz PAM Matrices BLOSUMMatrices BLOSUM Ejemplo de Matriz BLOSUM Ejemplo de Matriz BLOSUM ReferenciasReferencias

ÍndiceÍndice

INTRODUCCIÓN INTRODUCCIÓN Una matriz de sustitución se elabora bajo una teoría de Una matriz de sustitución se elabora bajo una teoría de

evolución.evolución. El resultado de la comparación de dos o más secuencias El resultado de la comparación de dos o más secuencias

depende fuertemente de la matriz de sustitución que se haya depende fuertemente de la matriz de sustitución que se haya seleccionado.seleccionado.

Las matrices de sustitución son utilizadas en los análisis Las matrices de sustitución son utilizadas en los análisis comparativos de secuencias.comparativos de secuencias.

Los algoritmos de alineamiento (comparación ) funcionan Los algoritmos de alineamiento (comparación ) funcionan igual con una matriz de distancias o con una matriz de igual con una matriz de distancias o con una matriz de sustitución (aunque se pueden obtener diferentes resultados). sustitución (aunque se pueden obtener diferentes resultados).

Una matriz de distancias es muy útil en la reconstrucción de Una matriz de distancias es muy útil en la reconstrucción de un árbol filogenético, mientras que una matriz de sustitución un árbol filogenético, mientras que una matriz de sustitución es utilizada para realizar busqueda en bases de datos.es utilizada para realizar busqueda en bases de datos.

En biología evolutiva una matriz de sustitución, o de puntuación, describe el ritmo al que un carácter en una secuencia cambia a otro carácter con el tiempo

Tipos de matricesTipos de matrices X matriz única para uso siempre.

Familia de proteínas + grado de similitud >.

• Las más utilizadas.

– PAM: Percent Accepted Mutation Matrix• Alineamientos globales de secuencias cercanamente

relacionadas.• PAM40 PAM250.: > Nº = > distancia evolutiva

– BLOSUM• Alineamientos locales de secuencias distantes• BLOSUM90 BLOSUM45 El Nº = % de identidad

La cuestión era observar qué sustituciones ocurrian entre proteínas homólogas en un tiempo evolutivo. PAM = cambio de aa x otro que ha sido "aceptado" por la

selección natural (SN).

Los cambios más aceptados por la SN son los de tipoconservativo, ej. isoleucina por valina (hidrofòbicos y detamaño similar).

Permite relacionar familias de proteínas por su distanciaevolutiva.

MATRICES PAM (Percent Accepted Mutations)

MATRICES PAM (Percent Accepted Mutations)

Las matrices dan los cambios esperados Las matrices dan los cambios esperados para un periodo de tiempo evolutivo, la para un periodo de tiempo evolutivo, la similaridad de la secuencia decrece como similaridad de la secuencia decrece como los genes que codifican la misma proteína los genes que codifican la misma proteína divergen con el incremento del tiempo divergen con el incremento del tiempo evolutivo.evolutivo.

Una unidad PAM es una medida arbitraria de divergencia evolutiva en la que se asume que el 1% de los aminoácidos han cambiado entre dos proteínas.

De acuerdo a la región a alinear:

●Local (sub región de la secuencia)●Global (secuencia completa)

PAM

BLOSUM

MATRIZ PAM

• Nº sustituciones aa. = matriz PAM-1.

• La matriz PAM-1 = variación media 1% posiciones aa .

• Las matrices PAM para grandes distancias evolutivas puede extrapolarse a partir de la matriz PAM-1.

• PAM250 = 250 mutaciones por 100 residuos.

• > Nº = > distancia evolutiva

Como fueron Como fueron construidas ???construidas ???

1. Alineamiento1. Alineamiento

alienaron 1572 secuencias de 71 proteínas alienaron 1572 secuencias de 71 proteínas diferentes diferentes

2. Árbol filogenético

3. Mutaciones Aceptadas3. Mutaciones Aceptadas

se calculó la tasa de se calculó la tasa de Mutaciones AceptadasMutaciones Aceptadas por la selección natural (por la selección natural (AijAij las veces que las veces que ii cambia a cambia a jj en todas las comparaciones) en todas las comparaciones)

las secuencias se comparan por pares y los cambios las secuencias se comparan por pares y los cambios encontrados se presumen que se han presentado por encontrados se presumen que se han presentado por selección naturalselección natural..

4. Mutación….4. Mutación….

calcularon la mutabilidad de cada aminoácido, calcularon la mutabilidad de cada aminoácido, la tendencia del aminoácido la tendencia del aminoácido jj a ser sustituido, a ser sustituido, mjmj

Es la propensión que dado un aminoácido j sea Es la propensión que dado un aminoácido j sea reemplazado por cualquier otro aminoácidoreemplazado por cualquier otro aminoácido

5. Matriz de probabilidad de 5. Matriz de probabilidad de mutación mutación

PAM 1 (es decir 1 cambio en 100 PAM 1 (es decir 1 cambio en 100 aminoácidos) con las siguientes formulasaminoácidos) con las siguientes formulas

Propiedades de una matriz de Propiedades de una matriz de probabilidad de mutación:probabilidad de mutación:

La matriz M1 establece una unidad de cambio evolutivo.La matriz M1 establece una unidad de cambio evolutivo.

Aplicaciones sucesivas de una matriz MAplicaciones sucesivas de una matriz M11 a una secuencia a una secuencia produce matrices Mproduce matrices M22, M, M33, ..., M, ..., Mnn..

Los elementos de la matriz PAM 0 son 1 para MLos elementos de la matriz PAM 0 son 1 para Mii ii y 0 para My 0 para Mijij. .

La PAM 1 acepta una mutación cada 100 aminoácidos

En general, k unidades de evolución = M k2

kalgún para

ijkjikij MMMM

iki

Los datos fueron multiplicados por 10,000 para facilitar la presentación

6. Matriz 6. Matriz log oddslog odds

posteriormente se calculó la matriz posteriormente se calculó la matriz log oddslog odds tomando los resultados del punto anterior y tomando los resultados del punto anterior y aplicando la siguiente manera:aplicando la siguiente manera:

se divide cada elemento de la matriz PAM 1 entre la ocurrencia del residuo

residuo 

donde fi es la frecuencia de i,

y por último se calculó el logaritmo de cada Rij para obtener Sij 

TIPSTIPS

i -> j = j -> i i -> j = j -> i Porque para dos secuencias cualquiera, el a.a ancestro en el Porque para dos secuencias cualquiera, el a.a ancestro en el árbol filogenético no es conocido usualmente.árbol filogenético no es conocido usualmente.(Mount 78)(Mount 78)

Odds score : Cociente de cambio de substitución de un Odds score : Cociente de cambio de substitución de un amino ácido.amino ácido.

Permite determinar si las secuencias :Permite determinar si las secuencias : Variación evolutiva autenticaVariación evolutiva autentica Secuencias aleatorias con ninguna significancia Secuencias aleatorias con ninguna significancia

biológica. biológica.

El modelo de Darhoff es un proceso de Markov.El modelo de Darhoff es un proceso de Markov.

Calculo para obtener el Log odds score por cambios entre Phe y Try en una

PAM 250

• Calculamos la frecuencia de cambio de F x Y 0.0021.

• Calculamos los valores de PAM250.• En PAM250 el valor de frecuencia de F x Y es 0.15.• Para construir nuestra MDM. • 0.15/0.04 =3.75 Log(3.75) = 0.57• 0.57 x 10 =5.7

• De la misma forma para Y x F.• 0.20/0.03 = 6.7 Log(6.7) = 0.83• 0.83 x 10 = 8.3

Calculamos el promedio de 5.7 y 8.3 = 7

MDM Mutation Data Matrix

7. PAM7. PAMnn

Para obtener matrices PAM de mayor distancia Para obtener matrices PAM de mayor distancia (por ejemplo PAM 100) se multiplica por si (por ejemplo PAM 100) se multiplica por si misma el número de veces que sea requiera (en misma el número de veces que sea requiera (en el ejemplo 100 veces.), antes de calcular su el ejemplo 100 veces.), antes de calcular su log log oddsodds, después del paso 6 pero antes del 7, después del paso 6 pero antes del 7

Calcular la matriz "Log Odds" de similaridad: Se Calcular la matriz "Log Odds" de similaridad: Se divide cada elemento de la Matriz de probabilidad de divide cada elemento de la Matriz de probabilidad de Mutación (M), entre la frecuencia de occurrencia de Mutación (M), entre la frecuencia de occurrencia de cada aminoácido:cada aminoácido:

Rij = Mij/fi Rij = Mij/fi Donde:Donde:R es la matriz "Relatedness Odds".R es la matriz "Relatedness Odds".fi es la frecuencia del aminoácido i.fi es la frecuencia del aminoácido i.La Matriz "Log Odds" (S) se calcula a partir de la La Matriz "Log Odds" (S) se calcula a partir de la matriz "Relatedness Odds" (R) de la siguiente forma:matriz "Relatedness Odds" (R) de la siguiente forma:S ij = Log (Rij)S ij = Log (Rij)

AA BB NN DD CC QQ EE GG HH II LL KK MM FF PP SS TT WW YY V

A (Ala)A (Ala) 1313 66 99 99 55 88 99 1212 66 88 66 77 77 44 1111 1111 1111 22 44 99

R (Arg)R (Arg) 33 1717 44 33 22 55 33 22 66 33 22 99 44 11 44 44 33 77 22 22

N (Asn)N (Asn) 44 44 66 77 22 55 66 44 66 33 22 55 33 22 44 55 44 22 33 33

D (Asp)D (Asp) 55 44 88 1111 11 77 1010 55 66 33 22 55 33 11 44 55 55 11 22 33

C (Cys)C (Cys) 22 11 11 11 5252 11 11 22 22 22 11 11 11 11 22 33 22 11 44 22

Q (Gln)Q (Gln) 33 55 55 66 11 1010 77 33 77 22 33 55 33 11 44 33 33 11 22 33

E (Glu)E (Glu) 55 44 77 1111 11 99 1212 55 66 33 22 55 33 11 44 55 55 11 22 33

G (Gly)G (Gly) 1212 55 1010 1010 44 77 99 2727 55 55 44 66 55 33 88 1111 99 22 33 77

H (His)H (His) 22 55 55 44 22 77 44 22 1515 22 22 33 22 22 33 33 22 22 33 22

I (Ile)I (Ile) 33 22 22 22 22 22 22 22 22 1010 66 22 66 55 22 33 44 11 33 99

L (Leu)L (Leu) 66 44 44 33 22 66 44 33 55 1515 3434 44 2020 1313 55 44 66 66 77 1313

K (Lys)K (Lys) 66 1818 1010 88 22 1010 88 55 88 55 44 2424 99 22 66 88 88 44 33 55

M (Met)M (Met) 11 11 11 11 00 11 11 11 11 22 33 22 66 22 11 11 11 11 11 22

F (Phe)F (Phe) 22 11 22 11 11 11 11 11 33 55 66 11 44 3232 11 22 22 44 2020 33

P (Pro)P (Pro) 77 55 55 44 33 55 44 55 55 33 33 44 33 22 2020 66 55 11 22 44

S (Ser)S (Ser) 99 66 88 77 77 66 77 99 66 55 44 77 55 33 99 1010 99 44 44 66

T (Thr)T (Thr) 88 55 66 66 44 55 55 66 44 66 44 66 55 33 66 88 1111 22 33 66

W (Trp)W (Trp) 00 22 00 00 00 00 00 00 11 00 11 00 00 11 00 11 00 5555 11 00

Y (Tyr)Y (Tyr) 11 11 22 11 33 11 11 11 33 22 22 11 22 1515 11 22 22 33 3131 22

V (Val)V (Val) 77 44 44 44 44 44 44 44 55 44 1515 1010 44 1010 55 55 55 7272 44 1717

PAM250PAM250

Selección de PAMSelección de PAMObjetivo.Detectar similaridad de secuencias.Objetivo.Detectar similaridad de secuencias.Premisa: El score de alineamiento sin gaps puede ser más alto, cuando se usa una matríz Premisa: El score de alineamiento sin gaps puede ser más alto, cuando se usa una matríz correctacorrecta

Base. Homología de proteínas (Distancia evolutiva)Base. Homología de proteínas (Distancia evolutiva)

PAM 1: 1 mutación cada 100aaPAM 1: 1 mutación cada 100aa

PAM 200 : 25% similaridadPAM 200 : 25% similaridadPAM120 : 40% similaridadPAM120 : 40% similaridadPAM80 : 50% similaridadPAM80 : 50% similaridadPAM60 : 60% similaridadPAM60 : 60% similaridad

La PAM1 por ejemplo es la matriz calculada a partir de comparaciones de secuencias con no La PAM1 por ejemplo es la matriz calculada a partir de comparaciones de secuencias con no más del 1% de divergencia . Otras matrices PAM fueron extrapoladas a partir de PAM1. más del 1% de divergencia . Otras matrices PAM fueron extrapoladas a partir de PAM1.

PAM70PAM70

A R N D C Q E G H I L K M F P S T W Y V B Z

A 2 -2 0 0 -2 0 0 1 -1 -1 -2 -1 -1 -3 1 1 1 -6 -3 0 2 1 R -2 6 0 -1 -4 1 -1 -3 2 -2 -3 3 0 -4 0 0 -1 2 -4 -2 1 2 N 0 0 2 2 -4 1 1 0 2 -2 -3 1 -2 -3 0 1 0 -4 -2 -2 4 3 D 0 -1 2 4 -5 2 3 1 1 -2 -4 0 -3 -6 -1 0 0 -7 -4 -2 5 4 C -2 -4 -4 -5 12 -5 -5 -3 -3 -2 -6 -5 -5 -4 -3 0 -2 -8 0 -2 -3 -4 Q 0 1 1 2 -5 4 2 -1 3 -2 -2 1 -1 -5 0 -1 -1 -5 -4 -2 3 5 E 0 -1 1 3 -5 2 4 0 1 -2 -3 0 -2 -5 -1 0 0 -7 -4 -2 4 5 G 1 -3 0 1 -3 -1 0 5 -2 -3 -4 -2 -3 -5 0 1 0 -7 -5 -1 2 1 H -1 2 2 1 -3 3 1 -2 6 -2 -2 0 -2 -2 0 -1 -1 -3 0 -2 3 3 I -1 -2 -2 -2 -2 -2 -2 -3 -2 5 2 -2 2 1 -2 -1 0 -5 -1 4 -1 -1 L -2 -3 -3 -4 -6 -2 -3 -4 -2 2 6 -3 4 2 -3 -3 -2 -2 -1 2 -2 -1 K -1 3 1 0 -5 1 0 -2 0 -2 -3 5 0 -5 -1 0 0 -3 -4 -2 2 2 M -1 0 -2 -3 -5 -1 -2 -3 -2 2 4 0 6 0 -2 -2 -1 -4 -2 2 -1 0 F -3 -4 -3 -6 -4 -5 -5 -5 -2 1 2 -5 0 9 -5 -3 -3 0 7 -1 -3 -4 P 1 0 0 -1 -3 0 -1 0 0 -2 -3 -1 -2 -5 6 1 0 -6 -5 -1 1 1 S 1 0 1 0 0 -1 0 1 -1 -1 -3 0 -2 -3 1 2 1 -2 -3 -1 2 1 T 1 -1 0 0 -2 -1 0 0 -1 0 -2 0 -1 -3 0 1 3 -5 -3 0 2 1 W -6 2 -4 -7 -8 -5 -7 -7 -3 -5 -2 -3 -4 0 -6 -2 -5 17 0 -6 -4 -4 Y -3 -4 -2 -4 0 -4 -4 -5 0 -1 -1 -4 -2 7 -5 -3 -3 0 10 -2 -2 -3 V 0 -2 -2 -2 -2 -2 -2 -1 -2 4 2 -2 2 -1 -1 -1 0 -6 -2 4 0 0 B 2 1 4 5 -3 3 4 2 3 -1 -2 2 -1 -3 1 2 2 -4 -2 0 6 5 Z 1 2 3 4 -4 5 5 1 3 -1 -1 2 0 -4 1 1 1 -4 -3 0 5 6

PAM 250

C

-8 17

W

W

Errores en las matrices PAMErrores en las matrices PAM

Muchas secuencias se desvian de la composición Muchas secuencias se desvian de la composición promedio.promedio.

Se encontraron reemplazos muy poco frecuentes Se encontraron reemplazos muy poco frecuentes que no se podian explicar por las probabilidades que no se podian explicar por las probabilidades encontradas.encontradas.

Cualquier error en la PAM1 es “super-Cualquier error en la PAM1 es “super-magnificado” en la PAM250magnificado” en la PAM250

Los procesos de Markov son una explicacion de la Los procesos de Markov son una explicacion de la evolución que no obedece a la realidad. La evolución que no obedece a la realidad. La probabilidad: X probabilidad: X →Y es distinta a la probabilidad →Y es distinta a la probabilidad Y→X.Y→X.

BLOSUM (BLOcks Substitution BLOSUM (BLOcks Substitution Matrix)Matrix)

Steve Henikoff, 1992Steve Henikoff, 1992Basadas en la comparación de Basadas en la comparación de BLOQUES de secuencias derivadas BLOQUES de secuencias derivadas de la base de datos de la base de datos BlocksBlocks..Valores basados en la frecuencia Valores basados en la frecuencia de sustitución en bloques de de sustitución en bloques de alineamientos locales.alineamientos locales.Regiones conservadas.Regiones conservadas.

>2000 bloques de >500 grupos de proteínas relacionadas.

MATRIZ BLOSUMMATRIZ BLOSUM Matrices BLOSUM difieren en el porcentaje de identidad de Matrices BLOSUM difieren en el porcentaje de identidad de

agrupamiento.agrupamiento. BLOSUM 62 es derivada de bloques que tienen una BLOSUM 62 es derivada de bloques que tienen una

identidad identidad >>62% en un alineamiento sin gaps.62% en un alineamiento sin gaps.

BLOSUM62BLOSUM62

Diferencias entre matricesDiferencias entre matrices

PAMPAM Basada en modelo evolutivo.Basada en modelo evolutivo. Calculada a partir de Calculada a partir de

alineamientos globales.alineamientos globales. Construida a partir de una Construida a partir de una

cantidad pequeña de datos.cantidad pequeña de datos. Proteínas cercanamente Proteínas cercanamente

relacionadas.relacionadas. Matrices son extrapolaciones Matrices son extrapolaciones

matemáticas de PAM1.matemáticas de PAM1. Mayor serie PAM, mayor Mayor serie PAM, mayor

divergencia.divergencia.

BLOSUMBLOSUM Basado en secuencias Basado en secuencias

conservadas cortas conservadas cortas (bloques).(bloques).

Calculada a partir de Calculada a partir de alineamientos locales.alineamientos locales.

Construida a partir de una Construida a partir de una gran cantidad de datos.gran cantidad de datos.

Proteínas evolutivamente Proteínas evolutivamente divergentes.divergentes.

Cada matriz es resultado Cada matriz es resultado de un alineamiento de de un alineamiento de bloques.bloques.

Menor serie BLOSUM, Menor serie BLOSUM, mayor divergencia.mayor divergencia.

Equivalencias entre matricesEquivalencias entre matrices

Proteína de rata vs. proteína de ratón

Proteína de rata vs. proteína de bacteria

¿Qué matriz usar?¿Qué matriz usar?

MatrizMatriz UsoUso % Similaridad% Similaridad

PAM140PAM140BLOSUM9BLOSUM900

Alineamientos pequeños, Alineamientos pequeños, alta similitudalta similitud 70 – 9070 – 90

PAM160PAM160BLOSUM8BLOSUM800

Miembros de una familia de Miembros de una familia de proteínasproteínas 50 – 6050 – 60

BLOSUM6BLOSUM622

Encontrar todas las Encontrar todas las similitudes potencialessimilitudes potenciales 30 – 4030 – 40

PAM250PAM250 Alineamiento largos, Alineamiento largos, secuencias más divergentessecuencias más divergentes

AproximadameAproximadamente 30nte 30

PAM250PAM250 Alineamiento largos, Alineamiento largos, secuencias más divergentessecuencias más divergentes < 30< 30

Otras matrices de puntuación de Otras matrices de puntuación de aminoácidosaminoácidos

Criterios usados en las matrices para el alineamiento de secuencias:Criterios usados en las matrices para el alineamiento de secuencias:1.- Simple identidad:1.- Simple identidad: Match Match MismatchMismatch ATATKKDPTHDPTHDDAA ATATDDDPTHDPTHAAAA2.-Cambios en el código genético Cambios de nucletidos por: 2.-Cambios en el código genético Cambios de nucletidos por: -Cambio de un aa por otro aa en un codon -Cambio de un aa por otro aa en un codon -Semejanza estructural de la cadena lateral (R) aminoácido -Semejanza estructural de la cadena lateral (R) aminoácido Feng,1985Feng,1985 --Benner,1994 Benner,1994 el código genetico influye en la sustitución de aael código genetico influye en la sustitución de aa

3.-3.-Vogt et al.1995 Vogt et al.1995 Matrices basadas en : Matrices basadas en : -Similaridad química-Similaridad química -Hidrofobicidad y polaridad de -Hidrofobicidad y polaridad de -Volúmen molecular-Volúmen molecular

4.-Risler et al. 1988 sustituciones de aa en aa 4.-Risler et al. 1988 sustituciones de aa en aa estructuralmente alineadosestructuralmente alineados

-Sander y Schneder 1991 además obs. sustituciones -Sander y Schneder 1991 además obs. sustituciones encontradas en grupo de proteínas con igual encontradas en grupo de proteínas con igual estructura.estructura.

5.-Gonnett et al. 1994 sustituciones de aa dependian 5.-Gonnett et al. 1994 sustituciones de aa dependian de los aa vecinos ,el medio externo rol en la de los aa vecinos ,el medio externo rol en la evolución de la proteína.evolución de la proteína.

6.-Jones et al. 1994 matriz de clasificación para 6.-Jones et al. 1994 matriz de clasificación para proteínas de membrana, usó analisis similar a proteínas de membrana, usó analisis similar a dayhoff PAM entonces estima la distancia dayhoff PAM entonces estima la distancia evolutiva entre mienbros de estas proteínasevolutiva entre mienbros de estas proteínas

-No muy útiles-No muy útiles

-Disenadas para alinear proteínas-Disenadas para alinear proteínas

por características del aa y no enpor características del aa y no en

un modelo evolutivo.un modelo evolutivo.

-Útiles para encontrar relaciones-Útiles para encontrar relaciones

estructurales y funcionales o relación entreestructurales y funcionales o relación entre

familias de proteínas familias de proteínas

Matrices de puntuación PAM de Matrices de puntuación PAM de Acidos Nucleicos Acidos Nucleicos

Proveen imformación de análisis mutacional:Proveen imformación de análisis mutacional:

-Transición sustición entre A y G o entre C y T -Transición sustición entre A y G o entre C y T más probablemás probable

-Transversión entre purinas a pirimidinas y -Transversión entre purinas a pirimidinas y pirimidinas a purinas menos probablepirimidinas a purinas menos probable

AA TT CC GG

AA 00 55 55 11

TT 55 00 11 55

CC 55 11 00 55

GG 11 55 55 00

Para preparar estas matrices PAM de AND se calculó una matriz de Para preparar estas matrices PAM de AND se calculó una matriz de mutacion PAM1 99% conservación de la secuenciamutacion PAM1 99% conservación de la secuencia

PAM de distancia evolucionaria 1% de mutaciones.PAM de distancia evolucionaria 1% de mutaciones.

Un modelo en el que las mutaciones de un nucleotido a otroUn modelo en el que las mutaciones de un nucleotido a otro

nucleotidos son igualmente probables y los 4 nucleotidos estan ennucleotidos son igualmente probables y los 4 nucleotidos estan en

igual frecuenciaigual frecuencia

Posibles cambios para un nucleotido es 1%(3X0.00333=0.00999)Posibles cambios para un nucleotido es 1%(3X0.00333=0.00999)

Un modelo de mutacion sesgada: transición es 3 veces mas probable que una Un modelo de mutacion sesgada: transición es 3 veces mas probable que una transversion donde ….una transicion =0.006 y las dos posibles transversion donde ….una transicion =0.006 y las dos posibles transversiones =0.002 y la suma para c/nucleotido es 1% transversiones =0.002 y la suma para c/nucleotido es 1% (0.006+0.002+0.002= 0.01)(0.006+0.002+0.002= 0.01)

No cambios

Cambios

Todos los valores son usados para producir Todos los valores son usados para producir Matriz de puntuacion de log odds (frecuencia Matriz de puntuacion de log odds (frecuencia de sustituciones esperadas en el incremento de de sustituciones esperadas en el incremento de distancias evolutivas distancias evolutivas