Post on 26-Nov-2015
Dra. Silvina E. Wilkowsky Lab. de Hemoparsitos Inst. de Biotecnologa
INTA Castelar
La genmica de parsitos comenz en el ao 2002
QUE PARTICULARIDADES TIENEN LOS DATOS GENOMICOS?
Acceso a informacin comparativa (patgeno vs. no-patgeno, rango de hospedadores): blanco en genes involucrados en patognesis o
resistencia a frmacos
GENOMICA COMPARATIVA
Qu genes estn compartidos entre genomas?
Qu familias gnicas son compartidas o fueron amplificadas o reducidas?
Qu fuerzas evolutivas estn actuando sobre los genes?
Qu otras secuencias no gnicas estn conservadas?
Como fue cambiando la estructura genmica?
MALARIA Causada por Plasmodium spp.
4 especies de Plasmodium infectivas para el ser humano: P.vivax, P.falciparum,
P.ovale, P. malariae
300-500 millones de casos,1.5-2.7 millones de muertes/ao
Cada 40 segundos muere un nio por causa de malaria Existe resistencia a la droga cloroquina, la ms barata existente y est presente
en casi todos los pases endmicos
Ha aparecido resistencia a la mayora de las nuevas drogas antimalricas
No existe vacuna disponible
NECESIDAD DE NUEVOS METODOS PARA PREVENCION Y TRATAMIENTO
DISTRIBUCION MUNDIAL DE LA MALARIA
Sachs and Malaney, Nature 415: 680-685 (2002)
El parsito causante de la malaria es intracelular. Permanece la mayor parte de su ciclo de vida residiendo y dividindose en la clula hospedadora. Presenta mecanismos de evasin de la respuesta inmune y su localizacin le permite el acceso a una variada provisin de nutrientes.
Las vacunas contra la malaria deben estar dirigidas contra los estados hepticos, sexuales o las formas invasivas.
Los frmacos de uso humano deben alcanzar los estados parasitarios hepticos o eritrocitarios.
22.853.764 bp
19.4% GC
1 gen cada 4.3kb (52% codificantes)
Set mnimo de tRNAs
7 operones de RNA ribosomales (no repetidos en tandem)
~90% de los genes no haban sido previamente descriptos in Plasmodium.
~50% no tienen homlogos conocidos
Gardner, Hall and Fung et al (2002) Nature, 419:498
GENOMA DE
PLASMODIUM FALCIPARUM
QUE UTILIDAD TIENEN ESTOS DATOS.?
Factores de virulencia en Plasmodium falciparum
La virulencia particular de P.falciparum estara dada por la forma en la cual el parsito altera la superficie del glbulo rojo
Aproximadamente 16 hs despus de entrar al eritrocito, las protenas Pfemp1 (Plasmodium falciparum erythrocyte membrane protein 1) aparecen en la superficie del glbulo rojo.
Promueven la unin a una gran variedad de tipos celulares, llevando a una enfermedad severa Inducen una respuesta inmune protectora que el parsito evade cambiando continuamente estas protenas Pfemp1
EFECTOS?
Estructura de PfEMP-1
59 genes var en total.
Un tipo predominante (tipo 1)
Estructura cromosmica de P. falciparum
El principal antgeno y factor de virulencia de P. falciparum (Pfemp1) es predominantemente subtelomrico.
Solo uno de los tipos mayoritarios es adyacente al telmero Muchas otras familias antignicas tambin estn localizadas en ubicaciones subtelomricas.
Mapas de sintenia de los cromosomas del gnero Plasmodium
Comparacin de ortlogos putativos de los proteomas de P. falciparum (Pf), P. vivax (Pv), P. knowlesi (Pk), P. y. yoelii (Py) De los 3,336 ortlogos encontrados entre las 6 especies (P.berghei y P.chabaudi son completamente sintnicos a P.y.yoelii), 3,305 (99%) estn conservados posicionalmente. La sintenia se corta en los genes especie-especficos.
Nature. 2008 October 9; 455(7214): 757763.
QUE UTILIDAD TIENE LOS DATOS GENMICOS? PARTE I Existe resistencia a los antimalricos tradicionales (cloroquina)Qu
pasa con las drogas de nueva generacin como la artemisinina?
Artemisinina ATPasa 6
P.vivax
A263
S1008
P.falciparum
L263
N1039
El cambio en el residuo 263 de Leucina a Alanina resulta en una disminucin de 3 veces de la susceptibilidad de P. falciparum a la artemisinina. La IC50
(concentracin inhibitoria por la cual el 50% de los parsitos mueren) para
algunas cepas de P. vivax podra ser mas alta que la IC50 para P. falciparum
Se estudiaron las interacciones entre las drogas antimalricas y las protenas parasitarias involucradas en unin al frmaco y resistencia analizando las estructuras cristalinas y desarrollando modelos de homologa entre las protenas de P.vivax y los ortlogos de P. falciparum en donde se hayan reportado mutaciones que otorgan resistencia.
APLICACIN DE LOS DATOS GENMICOS I
CMO LOS PARSITOS DESARROLLAN VARIABILIDAD GENTICA LIGADA A SU RESPUESTA A CAMBIOS AMBIENTALES U OTROS FENOTIPOS ADAPTATIVOS
APLICACIN DE LOS DATOS GENMICOS II
Core genome: set de genes ortlogos derivados de un ancestro comn y compartidos por todas las cepas de una especie Son combinaciones hipotticas de genes, no existen en la naturaleza
CORE GENOME DE 6 ESPECIES DE PLASMODIOS
2 especies de Plasmodium infectivas para el ser humano: P.vivax, P.falciparum
1 especie: P. knowlesi, infectiva para los monos Macacos
3 especies: P. yoelii yoelii, P. berghei y P. chabaudi infectivas para los roedores
Anlisis de los genomas completos: http://www.plasmodb.org
Identificacin de genes ortlogos y parlogos: BLASTP all-against-all
CRITERIOS E-value < e-10 Similitud (I) >30% si L>150 aa. Si L50% de la protena ms larga Se filtran las regiones de baja complejidad
Agrupacin de genes en gene clusters usando OrthoMCL (algoritmo de Markov)
Alineamientos con Clustal W y T-Coffee, anlisis filogentico por Neighbour-Joining y clasificacin funcional en la base de datos de Gene Ontology
LSE: lineage specific expansion: surgimiento de copias gnicas mltiples por duplicacin o transferencia lateral de genes en
un linaje especfico
*: ORF predichos, anotacin incompleta de los 2 genomas
*
Genes duplicados en slo un genoma sin ortlogos en los otros 5 genomas. Estos genes tienen probablemente mayor impacto
en el genoma porque llevan una marca especie-especfica
REPLICATION: DNA replication factors TRANSCRIPTION: RNA polymerase II transcription factors and cofactors TRASLATION: initiatior, elongation and termination regulators REPAIR CELL MOTION: microtubule and actin-based movement
PROCESAMIENTO DE LA
INFORMACION GENETICA
CELL CYCLE: meiosis, mitosis, cyclin-dependent protein kinase activity SIGNAL TRANSDUCTION: Rho, G-protein, PKC RESPONSE TO ENVIRONMENTAL CHALLENGES: oxidative stress, heat PATHOGENESIS: entry, response to drugs, cytoadherence
APLICACIN DE DATOS GENOMICOS: PARTE III
SE PUEDE SECUENCIAR UN GENOMA DIRECTAMENTE DE UNA MUESTRA CLINICA?
Eritrocitos infectados de 5-mL de sangre provenientes de un paciente febril, positivo al frotis para malaria por P. vivax con parasitemia de 1.9% (IQ07)
La muestra se pas por un filtro de leucocitos CF11 y se aisl el DNA genomico
Se descart coinfeccin con P. falciparum y se confirm por RFLP para el antgeno merozoite surface protein 3 (msp3)- que la infeccin fuese monoallica
El DNA genmico total se someti a Whole-Genome Amplification (WGA) y se secuenci utilizando la plataforma Illumina
WGA =>Lisis-Desnaturalizacin alcalina-Neutralizacin-PCR isotrmica a 300C overnight con DNA Pol
Validacin de datos de SNPs utilizando whole-genome tiling microarray Comparacin de datos IQ07 vs. Sal I (cepa referencia genoma, El Salvador 1972)
58 millones de lecturas
40pb promedio
Cobertura promedio 30X
El aislamiento peruano IQ07 estuvo sometido a 35 aos de presin selectiva con drogas modernas en comparacin con la cepa SalI de 1972
TILING MICROARRAY
Ambos mtodos encontraron mutaciones en los genes pvhdfr (dihidrofolato reductasa), pvdhps
(dihidropteroato sintetasa) y pvmdr1 (gen de resistencia multidroga). Este ltimo gen present un cociente dN/dS infinito
P-valorproblemas de alineamiento en regiones de baja complejidad
PRESION POSITIVA
HEMOPARSITOS BOVINOS
Babesia bovis
Babesia bigemina
Anaplasma marginale
Theileria parva
Theileria annulata
Ausentes en el continente americano
Babesia spp.
Protozoo perteneciente al phylum Apicomplexa, junto con Plasmodium sp, Toxoplasma sp, Theileria sp y Eimeria sp. Transmitido por la garrapata Boophilus microplus.
Las especies de mayor importancia econmica en Argentina afectan al ganado bovino y son Babesia bovis y B. bigemina
2 hospedadores: invertebrado (garrapata) y vertebrado (bovino) donde se desarrolla como parasito intraeritroctico
CICLO DE VIDA DE B. BOVIS
Hembra adulta de B. microplus
kinetos
Gland. salival
esporonte
esporozotos
gametas
merozotos
cigota
Clula intestinal
Eritrocitos
Sintomas: anemia hemoltica, daos neurolgicos, renales, shock respiratorio, alta mortalidad en adultos. Importantes perdidas econmicas a la ganadera de Argentina: 9.900.000 bovinos expuestos (19% de la poblacin total del pas) Mtodos de control:
- Tratamiento farmacolgico: imidocarb y derivados - Control de garrapatas: acaricidas (resistencia) - Vacunas vivas
Laboriosas Inestables, necesidad de cadena de fro Morbilidad elevada Posible infeccin con otros patgenos Permanencia del parsito en el rea
Babesiosis bovina
Anaplasma marginale
Estrategia de secuenciacin: ADNg digerido con Hind III Separacin por Pulse Field Gel Electrophoresis Clonado en BACs y screening con sondas bovinas y especficas Ruptura del DNA de los clones positivos con Hydroshear y clonado en pCRScript Secuenciacin Big Dye Chemistry (ABI) Long distance PCR y genome walking para completar gaps
Cepa: St. Maries aislada de caso agudo. Transmisible por garrapatas.
Purificar o no? Shotgun?
1 leucocito bovino=3000 genomas de A. marginale!
Library de BACs de DNA bovino y del
patgeno
GENOMA ANAPLASMA MARGINALE
ANOTACION
Prediccin de ORFs y CDSs por Glimmer y Orpheus
BLAST y RBSFINDER para determinar inicio de CDSs
Pptido seal por SignalP
Determinacin de familias y superfamilias por Pfam
Asignacin de CDSs a categoras en la base de datos de COGs (Cluster of Orthologous Groups) y a rutas metablicas utilizando KEGG y ECOCYC
La base 1 se asign arbitrariamente por anlisis del sesgo de GCs (G-C/G+C). Los genes dnaA, gyrA, gyrB y otros tpicos del origen de replicacin se encuentran dispersos en el genoma.
Sesgo GC
rRNA
tRNA
CDS reverse
CDS forward
BACs
msp2
msp1
CARACTERISTICAS GENERALES DEL GENOMA DE ANAPLASMA MARGINALE
Tamao genoma, bp 1,197,687
G C, % 49 Densidad de genes codif. % 86 Genes codif. protenas 949 Asignacin funcional 567 Asignacin funcional conservada 107 Hipotticas conservadas 126 Hypotticas 151 Pseudogenes funcionales 14 ORFs con dominios partidos 8 Densidad de genes 0.79
Long. promedio de genes 1,077 Ribosomal RNAs 3 Transfer RNAs 37
Alto (Rickettsiales: 31%) Alta: tpica de bact. intr. obligadas
Pseudogenes?
Copias truncadas de genes que solo se expresan como parte de una proteina full length luego de recombinar en un sitio nico de expresin
Superfamilia msp2
Comprende los genes msp2,msp3 y msp4
Son protenas inmunodominantes, antignicamente variables: evasin del SI
msp2 se transcribe como parte de un opern de 4 genes: a los 3 restantes se los denomina operon associated genes (opags) 1-3
Este opern muestra una expresin diferencial: opag1 no se traduce, opag2 y msp2 se expresan en el eritrocito y en el intestino y glnd.salivales de la garrapata y opag 3 solo se expresa en el eritrocito.
Se encontraron adems 15 genes no identificados previamente con identidad de secuencia a la superfamilia msp2-4. Se los denomin OMP1-15
Existen ortlogos de msp2 en miembros del gnero Erlichia (E. ruminantium, E.canis y E. chaffensis). Anaplasma y Erlichia pertenecen al orden Rickettsiales
Aunque existe sintenia entre estos genes de Erlichia y msp2, el mecanismo para generar variacin antignica es muy distinto: las especies de Erlichia usan varios genes de un arreglo en tndem de OMPs mientras que Anaplasma utiliza el mecanismo de recombinacin.
Una explicacin a esto es que la enzima mutL (reparacin de mismatches) en A. marginale contiene un segmento variable de residuos G que muchas veces resulta en un frameshift y por ende en una molcula inactiva. Por ende, la tasa de mutacin y recombinacin en este organismo es alta.
METABOLISMO La mayora de las enzimas glucolticas estn presentes Ni la glucokinasa ni transportadores de azcares estn presentes: utilizacin de gluconeognesis No se detectaron pathways completos de sntesis de aminocidos A.marginale realiza respiracin aerbica a travs del ciclo TCA Se hallaron todas las enzimas necesarias para la sntesis de cidos grasos y sntesis de novo de purinas
y pirimidinas
TRANSPORTADORES A pesar de que A.m. sintetiza muy pocos aminocidos, se hallaron pocos transportadores de los
mismos (solo se pudo asignar 1 para Prolina y un putativo para Alanina) Sin embargo se hallaron muchos transportadores de tipo ATP binding-cassettes que podran realizar
esta funcin. Se identificaron tambin sistemas transportadores de cationes, aniones, oligopptidos, dos bombas
de resistencia a multidrogas, ribonucletidos y fosfatos. La va sec de secrecin de polipptidos y el sistema de secrecin IV estn presentes y el sistema tat
contiene solamente tatC
COMPONENTES DE LA PARED CELULAR Varios genes de sntesis de LPS estn ausentes y tambin todos los genes de la biosntesis del lpido A No se encontr la va completa de sntesis de pptidoglicano La falta de una pared celular tradicional parece ser una caracterstica comn de la familia
Anaplasmataceae, pero no del orden Rickettsiales, en donde algunos miembros pueden sintetizar LPS y peptidoglicano.
A.marginale sera capaz de reforzar su pared de modo alternativo: muchas de las MSPs estan ligadas covalente y no covalentemente en complejos homomricos y heteromricos en la superficie celular.
Hemoparsitos protozoarios transmitidos por vectores
Vector Clula Huesped Sndrome clnico
Babesia bovis
Garrapatas Eritrocitos
bovinos
(citoplasma)
Anemia,
secuestro de
eritrocitos en
capilares,
alteraciones
neurolgicas,
aborto
Theileria
spp.
Garrapatas Eritrocitos
bovinos
(citoplasma) y
linfocitos
Fiebre,
linfoadenopatas,
distrs
respiratorio,
signos
neurolgicos
Plasmodium spp. Mosquito Hepatocitos y
eritrocitos
humanos
(vacuola
parasitfora)
Anemia,
secuestro de
eritrocitos en
capilares,
alteraciones
neurolgicas,
aborto
Genoma de Babesia bovis
Features Species
P. falciparum T. parva B. bovis
Size (Mbp) 22.8 8.3 8.2 Number of chromosomes 14 4 4 Total GC composition (%) 19.4 34.1 41.8 Size of apicoplast genome (kbp) 35 39.5 33 Size of mitochondrial genome (kbp) ; 6 linear 6 linear 6 linear Number of nuclear protein coding genes 5,268 4,035 3,670 Average protein coding gene length (bp)a 2,283 1,407 1,514 Percent genes with introns 53.9 73.6 61.5 Mean length of intergenic region (bp) 1,694 405 589 G+C composition of intergenic region 13.8 26.2 37 G+C composition of exons (%) 23.7 37.6 44 G+C composition of introns (%) 13.6 25.4 35.9 Percent coding 52.6 68.4 70.2 Gene densityb 4,338 2,057 2,228 a Not including introns. b Genome size/number of protein coding genes.
Cepa utilizada: T2bo
Virulenta, transmisible por garrapatas
CROMOSOMAS DE BABESIA BOVIS
Cromosoma 1: 2,623,761 pb
Cromosoma 2: 2,593,321 pb
Cromosoma 3: 1,729,419 pb
Cromosoma 4: 1,107,195 pb
Mitocondria: 6005 pb
Plstido:35107 pb
3.13
2.70
2.35 1.81 1.66 1.37 1.05
MW MW Mpb
Figure 1. Representation of B. bovis Centromeres, ves1,
and smorf Genes
Each chromosome is represented by a black line, with the
chromosome number shown on the left. Centromeres are
depicted as black dots. Ves1 loci are depicted as colored boxes,
and the number of ves1 and smorf genes in each locus is shown
above or below the colored boxes, respectively. Red and blue
boxes indicate the presence of at least one ves1a/ves1b or
ves1a/ves1a pair, respectively, within the cluster.
El perfil metablico predicho de Babesia bovis es similar al de Theileria parva
APICOPLASTO Organela semiautnoma similar a un plstido presente en muchos miembros del phylum
Apicomplexa
Derivado de un evento endosimbintico secundario
El genoma del apicoplasto de B. bovis es similar
en tamao, contenido gnico y orden a los de
Eimeria tenella, P. falciparum, T. parva, y
Toxoplasma gondii
Es extremadamente rico en AT (78.2%), en contraste
al genoma nuclear (58.2%).
El apicoplasto sera un blanco deseable
para el desarrollo de nuevas drogas antiparasitarias
dado que las vas biosintticas all representadas
son de origen cianobacteriano y muy distintas de
las del husped mamfero.
En T. gondii se ha demostrado que la sntesis de
cidos grasos en el apicoplasto es necesaria para
la biognesis y mantenimiento del mismo.
Qu pasa en B. bovis? Coding sequences (CDSs) with functional annotation are depicted in
red, while hypothetical CDSs are shown in lack. Genes encoding
tRNA genes are shown as blue bars, while rRNA genes are shown as
yellow arrows. All genes are unidirectionally encoded
MITOCONDRIA
Diagram of B. bovis mitochondrial genome. CDSs are depicted in red, large subunit
rRNA genes in blue, and inverted terminal repeats as black arrows.
La organizacin gnica es idntica a la de Theileria spp. pero diferente a la de
P. falciparum.
Cada una de las protenas codificadas emplea el codn ATG como inicio de la
traduccin, a diferencia del gen de la subunidad I del citocromo C de T. parva
que utiliza AGT como codn inicial.
PRINCIPALES FAMILIAS DE PROTEINAS EN BABESIA BOVIS
El proteoma predicho por Tribe-MCL mostr que adems de los genes housekeeping
comunes a otros eucariotas, B. bovis posee 2 grandes familias de protenas: ves y
smORFs (small open reading frames)
Otras familias minoritarias son sbp2 (spherical body protein 2) y vmsa (variable surface
merozoite antigen)
Los genes ves codifican para la protena VESA1, un heterodmero que se expresa en la superficie del
eritrocito. Son la familia de genes ms abundantes del genoma
A diferencia de lo que se encuentra en P.falciparum para los genes var de localizacin exclusivamente
telomrica, en B. bovis estos genes se encuentran dispersos por todo el cromosoma
VESA1 es un antgeno de variacin rpida implicado en evasin de la respuesta inmune y
citoadhesin PATOGENIA
El anlisis genmico predice aproximadamente 150 genes ves distribudos en los 4 cromosomas
smORFs
Asociados a los genes ves y tambin distribudos en los 4 cromosomas
Son 44 genes de entre 381 a 1,377 nucletidos sin identidad a ningn gen o protena depositada en las bases de datos disponibles
Alto grado de homologa con las protenas VESA (28-95%)
La prediccin bioinformtica indica que estaran localizadas extracelularmente
La existencia de pptidos seales cannicos en las SmORFs y su asociacin uniforme con los clusters de genes ves1 sugiere que estas protenas tendran un rol funcional en la biologa de las VESA o que por s mismas contribuiran a la variacin antignica, la evasin inmune o ambas.
ANALISIS COMPARATIVO DE LOS PROTEOMAS DE LOS HEMOPROTOZOARIOS
Agrupamiento por similitud de los proteomas predichos en COGs
Genes especficos de los
estados en mosquito o de
los esporozotos que se
expresan en el vector, no
comparten COGs con B.
bovis y T. parva
TRAP, p36, Pf12, Sir2,
PfATP6, y P0.
p36 result ser
inmunoprotectivo en
experimentos con knockout
en P.falciparum
Dado que P. falciparum, T. parva, y B. bovis tienen ciclos de vida complejos que involucran un vector
artrpodo y un husped mamfero, se utilizaron los datos de los COGs pesados por el ndice de Jaccard para buscar ortlogos de B. bovis que hayan sido caracterizados como blancos de inmunidad protectiva o
que jueguen un papel en la biologa del parsito.
Indice de Jaccard
J (A,B)=AB AUB
ANALISIS DE SINTENIA
Se realiz este anlisis debido a que por
presin evolutiva, los homlogos funcionales
de protenas de B. bovis, T. parva y P.
falciparum hayan divergido en su secuencia
de aminocidos
Los bloques sintnicos se definieron como el
par de genes que pertenecen al mismo Jf-
COG
No se pudieron identificar homlogos evidentes para la mayora de las protenas de
P. falciparum estado especficas o involucradas en la inmunidad del hospedador
Genes ortlogos a T. parva. Cada color indica uno de los 4 cromosomas de este parsito.
1: rojo, 2:verde, 3: azul, 4: naranja
Genes ves
Otros genes
Se observaron grandes bloques de sintenia entre B. bovis y T. parva.
La sintenia disminuye a medida que nos acercamos a los telmeros
Babesia bigemina: genoma en secuenciacin
Es posible realizar bsquedas
por BLAST en los contigs
disponibles.