Bioinformatica: recopilación y almacenamiento de información biológica (AND/ARN) proteina...
-
Upload
jorge-loredo -
Category
Documents
-
view
238 -
download
0
Transcript of Bioinformatica: recopilación y almacenamiento de información biológica (AND/ARN) proteina...
• Bioinformatica: recopilación y almacenamiento de información biológica
(AND/ARN) proteina
• Biología computacional: El desarrollo de algoritmos y métodos estadísticos para el análisis de datos biológicos.
• Aunque en concepto son diferentes, los términos Bioinformática y Biología computacional se usan indistintamente.
¿Que es Bioinformática/ ¿Que es Bioinformática/ Biología Computacional? Biología Computacional? ¿Que es Bioinformática/ ¿Que es Bioinformática/ Biología Computacional? Biología Computacional?
Source: http://ccb.wustl.edu/
¿Que es Bioinformática/ ¿Que es Bioinformática/ Biología Computacional? Biología Computacional? ¿Que es Bioinformática/ ¿Que es Bioinformática/ Biología Computacional? Biología Computacional?
• No se busca la solución “exacta” sino la biológicamente relevante
– No interesan los mínimos globales porque la función de costo es heurísitca y puede tener mínimos irrelevantes.
– Se introduce la noción designificado biológico de una solución óptima o quasi-óptima desde elpunto de vista matemático
• La definición del problema es imprecisa (entre otras cosas por falta de conocimiento)
¿Que es diferente en BC? ¿Que es diferente en BC? ¿Que es diferente en BC? ¿Que es diferente en BC?
• Es prioritario analizar conjuntos de soluciones quasi-óptimas, en lugar de únicamente la óptima.
• La validación experimental de los algoritmos tiene precedencia sobre el análisis matemático.
• La definición del modelo es la parte mas relevante de la resolución del problema.
• Bioinformática =/= Biología + Computación
¿Que es diferente en BC? ¿Que es diferente en BC? ¿Que es diferente en BC? ¿Que es diferente en BC?
• Oferta/Demanda: Hay muy poca gente con una formación adecuada en biología e informática
• Los proyectos de secuenciación genómica, análisis en microchips (microarrays), proteómica, metabolómica, etc.… estan produciendo enormes cantidades de datos que tienen que ser analizados.
• Ahorra gran cantidad de tiempo y dinero
¿Porqué está de actualidad la BC? ¿Porqué está de actualidad la BC? ¿Porqué está de actualidad la BC? ¿Porqué está de actualidad la BC?
Classificationin biology
Carl von Linne (1707-1778)
EvolutionEvolution
GeneticsGenetics Gregor Mendel (1822-1884)
Charles Darwin (1807-1882)
Discovery of nuclein Friedrich Miescher (1844-1895)
DNA is the genetic material Hershey-Chase
Molecular structure of DNA Chargaff, 1962 Nobel Prize James Watson, Francis Crick
Recombinant DNA, DNA sequencing 1980 Nobel Prize Walter Gilbert, Frederick Sanger, Paul Berg
Amplification of DNA (PCR) Kary Mullis & others, 1993 Nobel Prize
186919521953
1970
1983
Un poco de HistoriaUn poco de HistoriaUn poco de HistoriaUn poco de Historia
H. influenzae 1.8 Mbp (1995)S. cerevisiae 12 Mbp (1997)C. elegans 100 Mbp (1998)Drosophila 180 Mbp (2000)H. sapiens 3200 Mbp (2001)
H. influenzae 1.8 Mbp (1995)S. cerevisiae 12 Mbp (1997)C. elegans 100 Mbp (1998)Drosophila 180 Mbp (2000)H. sapiens 3200 Mbp (2001)
Overview: TIGR (The institute of genomic research)
http://www.tigr.org/tdb/mdb/mdbcomplete.htmlhttp://www.tigr.org/tdb/mdb/mdbinprogress.html
Un poco de HistoriaUn poco de HistoriaUn poco de HistoriaUn poco de Historia
Entries
Bases x 1000
20.000.000
10.000.000
Entries
Bases x 1000
20.000.000
10.000.000
Number of Entries in EMBL DatabaseJune 2002: 23.860.228.282 Bases; 17.807.526 Entries
Un poco de HistoriaUn poco de HistoriaUn poco de HistoriaUn poco de Historia
Source HUSAR
15 February 2001
Un poco de HistoriaUn poco de HistoriaUn poco de HistoriaUn poco de Historia
Secuenciacion completa del genoma humano
• It is smallIt is small• It is emptyIt is empty• It is unoriginalIt is unoriginal• It is repetitiveIt is repetitive
El genoma humano es:El genoma humano es:
ORGANISM CHROMOSOMES GENOME SIZE GENES
Homo sapiens (Humans)
23 3,200,000,000 ~ 30,000
Mus musculus(Mouse)
20 2,600,000,000 ~30,000
Drosophila melanogaster
(Fruit Fly)
4 180,000,000 ~18,000
Saccharomyces cerevisiae
(Yeast)
16 14,000,000 ~6,000
Zea mays (Corn)
10 2,400,000,000 ???
Comparación de genomasComparación de genomasComparación de genomasComparación de genomas
46250
Lysandra atlanticaOphioglossum
reticulatum
1260
La complejidad del genomaLa complejidad del genomaNO se correlaciona con el númeroNO se correlaciona con el número
cromosomascromosomas
La complejidad del genomaLa complejidad del genomaNO se correlaciona con el númeroNO se correlaciona con el número
cromosomascromosomas
Homo sapiens
46
La complejidad del genomaLa complejidad del genomaNO se correlaciona con su tamañoNO se correlaciona con su tamaño
La complejidad del genomaLa complejidad del genomaNO se correlaciona con su tamañoNO se correlaciona con su tamaño
Homo sapiens3,4 x 10 9 bp
Amoeba dubia6,7 x 10 11 bp
~31,000 genes~31,000 genes~26,000 genes~26,000 genes
~50,000 genes~50,000 genes
La complejidad del genomaLa complejidad del genomaNO se correlaciona con el número de NO se correlaciona con el número de
genesgenes
La complejidad del genomaLa complejidad del genomaNO se correlaciona con el número de NO se correlaciona con el número de
genesgenes
CHIMP GENOME Chimpanzees are similar to humans in so many ways: they are socially complex, sensitive and communicative, and yet indisputably on the animal side of the man/beast divide. Scientists have now sequenced the genetic code of our closest living relative, showing the striking concordances and divergences between the two species, and perhaps holding up a mirror to our own humanity.
Comparación con genomas mas Comparación con genomas mas cercanoscercanos
Comparación con genomas mas Comparación con genomas mas cercanoscercanos
From Olson and Varki(2002) Nat Rev Gen 4: 20-28Humanos Humanos
vs vs PrimatesPrimates
Humanos Humanos vs vs
PrimatesPrimates
La comparación del genoma humanocon el de los Primates dio como resultado
diferencias de solo el 1%
Homo sapiens y Pan troglodytes (Orangutan) 99.0% identical
Homo sapiens y Chimpance 99.9 % identical !!!!!
Humans are not at all original in comparison with other vertebrates.
Dogma Central de Dogma Central de la Biología Molecularla Biología MolecularDogma Central de Dogma Central de
la Biología Molecularla Biología Molecular
The central dogma states that once “information” has passed into protein, it cannot get out again. The transfer of information from nucleic acid to nucleic acid, or from nucleic acid to protein may be possible, but transfer from protein to protein, or from protein to nucleic acid, is impossible. Information means here the precise determination of sequence, either of bases in the nucleic acid or of amino acid residues in the protein.
Francis Crick, 1958
RNA
cDNA
PhenotypeDNA
protein
• El dogma:
No se puede aplicar a todas las funciones biológicas.
• Los procesos celulares implican una gran cantidad de productos genicos asi como interacciones entre ellos.
Los procesos celulares son complejos y multidimensionales.
Condiciones que llaman la atención sobre la necesidad de hacer otro tipo de investigación…. ahi es donde entra en juego la bioinformatica.
Gen Proteina Función
Los límitesLos límitesLos límitesLos límites
• Células
• ADN (DNA)
• ARN (RNA)
• Amino Acidos (AA)
• Proteinas
Biología Molecular: un resumenBiología Molecular: un resumenBiología Molecular: un resumenBiología Molecular: un resumen
• Sistema complejo envuelto en una membrana
• Los organismos pueden ser unicelulares (bacteria, levadura) o multicelulares
• Humanos:– 60 trillion células – 320 tipos de células
Célula Animalwww.ebi.ac.uk/microarray/ biology_intro.htm
Biología Molecular: CélulasBiología Molecular: CélulasBiología Molecular: CélulasBiología Molecular: Células
• Eucariotas: tienen una membrana nuclear y orgánulos (plantas, animales, hongos,…)
Biología Molecular: ProcariotasBiología Molecular: ProcariotasVs EucariotasVs Eucariotas
Biología Molecular: ProcariotasBiología Molecular: ProcariotasVs EucariotasVs Eucariotas
•Procariotas: no tienen una membrana
Que separe núcleo y orgánulos (bacteria)
•NO todos los organismos unicelulares son procariotas (levadura)BIOS Scientific Publishers Ltd, 1999
GCCACATGTAGATAATTGAAACTGGATCCTCATCCCTCGCCTTGTACAAAAATCAACTCCAGATGGATCTAAGATTTAAATCTAACACCTGAAACCATAAAAATTCTAGGAGATAACACTGGCAAAGCTATTCTAGACATTGGCTTAGGCAAAGAGTTCGTGACCAAGAACCCAAAAGCAAATGCAACAAAAACAAAAATAAATAGGTGGGACCTGATTAAACTGAAAAGCCTCTGCACAGCAAAAGAAATAATCAGCAGAGTAAACAGACAACCCACAGAATGAGAGAAAATATTTGCAAACCATGCATCTGATGACAAAGGACTAATATCCAGAATCTACAAGGAACTCAAACAAATCAGCAAGAAAAAAATAACCCCATCAAAAAGTGGGCAAAGGAATGAATAGACAATTCTCAAAATATACAAATGGCCAATAAACATACGAAAAACTGTTCAACATCACTAATTATCAGGGAAATGCAAATTAAAACCACAATGAGATGCCACCTTACTCCTGCAAGAATGGCCATAATAAAAAAAAATCAAAAAAGAATAAATGTTGGTGTGAATGTGGTGAAAAGAGAACACTTTGACACTGCTGGTGGGAATGGAAACTAGTACAACCACTGTGGAAAACAGTACCGAGATTTCTTAAAGAACTACAAGTAGAACTACCATTTGATCCAGCAATCCCACTACTGGGTATCTACCCAGAGGAAAAGAAGTCATTATTTGAAAAAGACACTTGTACATACATGTTTATAGCAGCACAATTTGCAATTGCAAAGATATGGAACCAGTCTAAATGCCCATCAACCAACAAATGGATAAAGAAAATATGGTATATATACACCATGGAACACTACTCAGCCATAAAAAGGAACAAAATAATGGCAACTCACAGATGGAGTTGGAGACCACTATTCTAAGTGAAATAACTCAGGAATGGAAAACCAAATATTGTATGTTCTCACTTATAAGTGGGAGCTAAGCTATGAGGACAAAAGGCATAAGAATTATACTATGGACTTTGGGGACTCGGGGGAAAGGGTGGGAGGGGGATGAGGGACAAAAGACTACACATTGGGTGCAGTGTACACTGCTGAGGTGATGGGTGCACCAAAATCTCAGAAATTACCACTAAAGAACTTATCCATGTAACTAAAAACCACCTCTACCCAAATAATTTTGAAATAAAAAATAAAAATATTTTAAAAAGAACTCTTTAAAATAAATAATGAAAAGCACCAACAGACTTATGAACAGGCAATAGAAAAAATGAGAAATAGAAAGGAATACAAATAAAAGTACAGAAAAAAAATATGGCAAGTTATTCAACCAAACTGGTAATTTGAAATCCAGATTGAAATAATGCAAAAAAAAGGCAATTTCTGGCACCATGGCAGACCAGGTACCTGGATGATCTGTTGCTGAAAACAACTGAAAATGCTGGTTAAAATATATTAACACATTCTTGAATACAGTCATGGCCAAAGGAAGTCACATGACTAAGCCCACAGTCAAGGAGTGAGAAAGTATTCTCTACCTACCATGAGGCCAGGGCAAGGGTGTGCACTTTTTTTTTTCTTCTGTTCATTGAATACAGTCACTGTGTATTTTACATACTTTCATTTAGTCTTATGACAATCCTATGAAACAAGTACTTTTAAAAAAATTGAGATAACAGTTGCATACCGTGAAATTCATCCATTTAAAGTGAGCAATTCACAGGTGCAGCTAGCTCAGTCAGCAGAGCATAAGACTCTTAAAGTGAACAATTCAGTGCTTTTTAGTATATTCACAGAGTTGTGCAACCATCACCACTATCTAATTGGTCTTAGTCTGTTTGGGCTGCCATAACAAAATACCACAAACTGGATAGCTCATAAACAACAGGCATTTATTGCTCACAGTTCTAGAGGCTGGAAGTGCAAGATTAAGATGCCAGCAGATTCTGTGTCTGCTGAGG
¿Que es el ADN?¿Que es el ADN?¿Que es el ADN?¿Que es el ADN?
Es un alfabeto de 4 caracteres
Este alfabeto de 4 caracteres contiene suficiente información paracrear organismos complejos, mediante el uso de largas palabras
Similitud con el codigo binario
Image source: www.biotec.or.th/Genome/whatGenome.html
¿Que es el ADN?¿Que es el ADN?¿Que es el ADN?¿Que es el ADN?
• DNA: Deoxyribonucleic Acid (ácido dexosiribonucleíco)
• 4 nucleotidos:– Adenosina (A)– Citosina (C)– Guanina (G)– Timina (T)
Bases nitrogenadas• Purinas (A and G)• Pirimidinas (C and T)Un azúcar (deoxiribosa)Un fosfato
Image Source: www.ebi.ac.uk/microarray/ biology_intro.htm
Acidos nucleicosAcidos nucleicosAcidos nucleicosAcidos nucleicosEl bloque básico necesario es:
• Los cuatro nucleótidos pueden unirse mediante fosfatos para formar cadenas de nucleótidos
• Los finales de la hebra son distintos
• Hay direccionalidad en la hebra de ADN
• Por convencion se marca la hebra codificante como 5’ to 3’
http://www.emc.maricopa.edu/faculty/farabee/BIOBK/BioBookDNAMOLGEN.html
Polinucleótidos de ADNPolinucleótidos de ADNPolinucleótidos de ADNPolinucleótidos de ADN
El ADN en realidad está formado por dos cadenas
Doble hebra de ADNDoble hebra de ADNDoble hebra de ADNDoble hebra de ADN
Las cadenas avanzan en sentido opuesto
y que están ligadas por enlaces
complementarios de bases nitrogenadas : A, T, G y C
Eso significa que la segunda cadena esreversa y complementaria
La doble hélice tiene siempre una anchuraconstante porque las purinas se enfrentansiempre a las pirimidinas.
• La doble hélice es la estructura más estable del ADN.
Image source; www.ebi.ac.uk/microarray/ biology_intro.htm
5’ GTAAAGTCCCGTTAGC 3’ | | | | | | | | | | | | | | | |3’ CATTTCAGGGCAATCG 5’
Doble héliceDoble héliceDoble héliceDoble hélice
•RNA can be:–Hebra simple–Hebra doble–Hebra hibrida AND-AR
Acido Ribonucléico ARNAcido Ribonucléico ARNAcido Ribonucléico ARNAcido Ribonucléico ARN
base(uracil)
phosphate group
sugar (ribose)
base(uracil)
phosphate group
sugar (ribose)
•Similar al ADN, el bloque consta de:• Bases nitrogenadas: A, C, G. La Timina (T) se reemplaza por un Uracilo (U)• Un azúcar, en este caso una Ribosa• Un fosfato
El RNA puede formar estructuras terciarias
• ARN mensajero (mRNA)
– Contiene la información para construir
una proteina.
• ARN ribosomal (rRNA)
– Componente mayoritario de los
ribosomas
• ARN transferente (tRNA)
– Encargado de llevar los amino acidos a
los ribosomas para la síntesis de
proteinas
Tipos de ARNTipos de ARNTipos de ARNTipos de ARN
• Molécula linear que contiene información genética copiada del AND. Tiene regiones codificadoras y regiones no codificadoras como la cabeza o líder y la cola.
• Los mensajeros de eucariotas tienen un cap o gorra en el extremo 5’ y una cola polyA en el extremo 3’.
• Transcription: es el proceso por el cual una molécula de AND es copiada a una de ARN.
ARN mensajeroARN mensajeroARN mensajeroARN mensajero
Dirección de la transcipción
ARN transferenteARN transferenteARN transferenteARN transferente
Tienen una estructura tridimensional muy bien definida
codon in mRNA
anticodon in tRNA
amino acid
Juega un papel crítico en la sintesis de proteinas llevando aa al ribosoma
Doble papel:• adaptador que reconoce al amino ácido en el extremo 3’• El anticodón se empareja con el codón en el ARNm
Amino ácido
5’ GTAAAGTCCCTTTAGC 3’
Anti codonARNm
ARN ribosomalARN ribosomalARN ribosomalARN ribosomal
Componente mayoritario de los ribosomas
Los ribosomas llevan a cabo la síntesis de proteínas asociándose conlos diferentes ARNm que proporcionan la secuencia de codificaciónreal y los ARNt que les proporcionan los aa
• 4 nucleótidos posibles (A, C, G, U)• Un codón tiene 3 bases• 4 * 4 * 4 = 64 codones posibles• Codón de inicio: AUG• Codón de parada o Stop: UAA, UAG, UGA• 61 codones codifican amino ácidos (AUG también Metionina)• Solo existen 20 amino acidos – redundancia del código genetico
code
Código genéticoCódigo genéticoCódigo genéticoCódigo genético
• Todos los organismos usan el mismo código genético
• Un amino ácido esta codificado por 3 nucleótidos = Código genético
Código genético es UniversalCódigo genético es UniversalCódigo genético es UniversalCódigo genético es Universal
• 4 nucleótidos posibles (A, C, G, U)
• Un codón tiene 3 bases
• 4 * 4 * 4 = 64 codones posibles
• Codón de inicio: AUG
• Codón de parada o Stop: UAA, UAG, UGA
• 61 codones codifican amino ácidos (AUG también Metionina)
DNA
mRNA
mRNAcodons
threonine proline glutamate glutamate lysine
amino acids
•Solo existen 20 amino acidos – pero 64 codones posibles
Redundancia del Código genéticoRedundancia del Código genéticoRedundancia del Código genéticoRedundancia del Código genético
• Elementos constitutivos de las proteinas (20 different)• Tienen un grupo radical variable que los caracteriza
Amino ácidosAmino ácidosAmino ácidosAmino ácidos
• Los amino ácidos tienen diferentes características bioquímicas y físicas, las cuales determinan su capacidad de ser reemplazados enla evolución.
CP
GGAVIL
MF
YW H
KR
E Q
DNS
TCSH
S+S
positivos
cargadospolares
alifáticos
aromaticos
pequeños
muy pequeños
hidrofóbicos
Los ARNm se pueden leer en tres diferentes marcos de lectura, pero solouno de ellos codifica la proteína correcta
Código genéticoCódigo genéticoCódigo genéticoCódigo genético
ProteínasProteínasProteínasProteínas
Los aa se unen mediante enlaces peptídicos entre el grupo carboxilo terminal de un aa y el grupo amino de otro.
Péptido: Cadena corta de aa (< 30) Polipéptido: cadena larga de aa (hasta 4000 residuos).
La secuencia de aa, su tipo y orden constituyen la Estructura primaria dela proteína
Residuo aminoterminal
Residuo carboxiloterminal
Tyr Gly GlyPhe Leu Val Ser
ProteínasProteínasProteínasProteínas
Estructura secundaria: producto del establecimiento de puentes de hidrógeno entre distintos átomos de los aa
Helices alfa: enrrollamiento espiral p.ejem proteinas fibrosas como piel y uñas
Cada hélice tiene 3,6 aa por vuelta
ProteínasProteínasProteínasProteínas
Estructura secundaria: producto del establecimiento de puentes de hidrógeno entre distintos átomos de los aa
Beta plegada: estructura en zig-zag resistente y flexiblep.ejem fibroína (proteína de la seda)
Dos o mas polipéptidos se situan de forma paralela entre ellos y se unen mediante puentes de hidrógeno. Estos puentes de hidrógeno se establecen entre diferentes segmentos del polipétido a diferencia con las alfa hélices
ProteínasProteínasProteínasProteínas
Estructura terciaria: Es la forma global de cada proteína. Depende de las interacciones entre los grupos radicales de la misma cadena polipetídica ocasionada por: puentes de hidrógeno, atración iónica, condición hidrofóbica o hidrofílica y puentes disulfuro.
Figure shows the tertiary structure of Chain B of Protein Kinase C Interacting Protein
Péptido individual doblado
ProteínasProteínasProteínasProteínas
Estructura cuaternaria: Es propia de las proteínas globulares y es la conformación tridimensional de la unión de dos o más cademas polipeptídicas, generadas por las mismas interacciones anteriormente citadas.
Agregado de dos o más péptidos
Figure shows the tertiary structure of Chain B of Protein Kinase C Interacting Protein
Volvemos al principio…Volvemos al principio…““El dogma central”El dogma central”
Volvemos al principio…Volvemos al principio…““El dogma central”El dogma central”
ADN
ARN
Proteína
Trascripción
Translación
Traducción