Caracterización molecular de procesamientos no canónicos ...
Transcript of Caracterización molecular de procesamientos no canónicos ...
Trabajo de Grado
Caracterización molecular de procesamientos no canónicos del
factor de transcripción Ikaros en pacientes con Leucemia Linfoide
Aguda tipo B.
Presentado por: Victor Andres Villamizar
Directores: Valeriano López Segura, Helena Groot De Restrepo
Resumen
Íkaros es un factor de transcripción involucrado en varios niveles dentro del control de la hematopoyesis. Este
control se encuentra determinado por una expresión específica de las distintas isoformas del gen, y un desbalance
de estos niveles de expresión se ha visto relacionado con distintas neoplasias hematopoyéticas. En un trabajo
previo del grupo de investigación se estandarizó un nuevo método cuantitativo para la evaluación de los niveles
de expresión del gen Ikaros, este estudio encontró adicionalmente la presencia de procesamientos aberrantes en
un gran número de pacientes. Tomando en cuenta los resultados obtenidos en el trabajo previo, en el presente
trabajo se procedió a caracterizar los posibles procesamientos no canónicos del factor de transcripción Ikaros
(IKZF1) encontrados en pacientes con Leucemia Linfoide Aguda tipo B. Para esto se realizó en primer lugar un
análisis bioinformático de las regiones interexónicas de interés entre los exones 4 y 5, y los exones 6 y 7 del gen
IKZF1 en las cuales se sospecha la presencia de un splicing alternativo en búsqueda de sitios de splicing crípticos.
Este análisis resultó en la identificación de cuatro posibles sitios de splicing alternativos correspondientes a dos
inserciones a los extremos de los exones 4 y 5 de 129pb y 48pb correspondientemente, una inserción en el
extremo del intrón 7 de 69pb y una deleción de 30pb del extremo del intrón 6 la cual ya ha sido reportada
previamente en pacientes con Leucemia Linfoide Aguda de células T. Finalmente, se realizó caracterización
molecular mediante clonación y secuenciación de las regiones interexónicas amplificadas, sin embargo, no se ha
logrado obtener resultados concretos todavía.
Palabras claves: Factor de transcripción, Ikaros, splicing alternativo, leucemia linfoide aguda tipo B.
Introducción
La familia de factores de transcripción Ikaros es
esencial en la regulación de genes involucrados en
el desarrollo de las líneas celulares
hematopoyéticas (Dovat & Payne, 2010). Los
genes más importantes a este respecto son los
genes Íkaros, Helios y Aiolos, mientras que Eos y
Pegasus tienen funciones menos conocidas. Es
bien sabido que el factor de transcripción Íkaros
se encuentra involucrado en varios niveles dentro
del control de la hematopoyesis. Este control que
ejerce Ikaros, en conjunto con otros genes de la
misma familia, viene determinado por un control
específico de los niveles de expresión de las
distintas isoformas del gen (Ruiz et al., 2004).
Cambios en los perfiles de expresión de las
isoformas de estos genes se han visto relacionadas
con el desarrollo de trastornos hematopoyéticos
debido a una supuesta falta de su función como
supresores de tumores (Westman, Mackay, &
Gell, 2002). La identificación de los perfiles de
expresión de estos genes en pacientes con
neoplasias hematológicas permitiría una mayor
comprensión de estas enfermedades (Meleshko et
al., 2008) y en un futuro un diagnostico más
preciso.
El splicing alternativo de estos genes da como
resultado la obtención de diferentes mRNAs y
proteínas con distinta actividad y capacidad de
unión al ADN (Meleshko et al., 2008). Sin
embargo, existe una correlación directa entre la
probabilidad de que un gen sea catalogado como
causante de una enfermedad y el número de
intrones presentes en dicho gen (López-Bigas,
Audit, Ouzounis, Parra, & Guigó, 2005). La edición
precisa del pre-ARN requiere de un complicado
control en el interior de la célula, y mientras
mayor sea la cantidad de modificaciones
postranscripcionales que sufra un pre-ARN, mayor
será la probabilidad que se produzcan errores en
dicho procesamiento (López-Bigas et al., 2005).
En el caso del gen Ikaros (IKZF1), la sobreexpresión
de ciertas isoformas producidas por un splicing
alternativo con un comportamiento dominante
negativo se ha visto relacionada en muchas
ocasiones con neoplasias hematopoyéticas,
particularmente en pacientes con LLA-B (Davis,
2011).
En un trabajo previo del grupo de investigación
se estandarizó un nuevo método cuantitativo para
la evaluación de los niveles de expresión del gen
Ikaros que permitió de una manera costo-efectiva
y sencilla diferenciar diversos tipos de neoplásicas
basándose en la amplificación de las regiones
inter-exónicas. De este modo se pudo diferenciar
de un modo altamente significativo el grupo de
Leucemias mieloides crónicas (LMC), Leucemias
linfoides crónicas (LLC) y Mielomas multiples
(MM).
Junto a la cuantificación de la expresión de
cada región inter-exónica a estudio, otra
característica interesante en dicho estudio fue la
presencia de procesamientos no canónicos,
característica ya conocida en diversas isoformas
de la familia como puede ser la deleción de 30 pb
al final del exón 6 de Ikaros en pacientes con LLA o
una inserción de 60 pb al final del exón 2 (Sun
et al., 1999). El diseño inter-exónico de los
amplicones estaba desarrollado para este fin, de
modo que se pudo constatar a través de la
valoración de la curva de melting de algunos inter-
exones la presencia de dos picos de melting
asociados a la presencia de un procesamiento no
canónico. Concretamente se puedo observar
como la presencia de dos picos de melting en el
interéxón 4-5 era algo muy específico de los casos
de LLA-B, en los que más del 80% de los casos lo
presentaban.
Teniendo esto en cuenta, en el presente
estudio se planteó caracterizar molecularmente
estos procesamientos encontrados en los
pacientes de LLA-B. Para ello los amplicones que
obtuvieron dos picos de melting se clonaron y
secuenciaron. Adicionalmente, se realizó un
estudio bioinformático para estudiar la posible
presencia de sitios de splicing crípticos que
puedan explicar teóricamente la presencia de
dichos procesamientos no canónicos. La
comprobación de un mismo patrón de splicing en
todos los casos de LLA-B supondría un hallazgo
excepcional ya que supondría una característica
muy importante de la enfermedad y con un alto
nivel de poder discriminatorio, para la cual se
podrían diseñar sistemas de cribado rápido y
efectivo para este tipo de neoplasia.
Materiales y métodos
Análisis bioinformático
En primer lugar se procedió a la identificación
de sitios crípticos de splicing alternativo, éste se
realizó con ayuda del programa ESEfinder (2001-
2006, Cold Spring Harbor Laboratory).
Posteriormente se realizó la predicción de los
sitios de unión a secuencias potenciadoras
exónicas (ESEs) en los alrededores de los sitios de
splicing crípticos identificados empleando el
programa Alamut 2.3 (2013, Interactive
Biosoftware Ltd.). Posteriormente, coempleando
el programa Geneious (2005-2013, Biomatters
Ltd.), se seleccionaron las mutaciones que no
presentaran cambios en el marco de lectura y se
construyeron las diferentes isoformas teóricas que
pudieran ocurrir por la selección de uno de los
sitios de splicing alternativos encontrados. Para
finalizar, empleando el mismo programa, se
examinó la existencia de modificaciones en los
dominios de la proteína.
Caracterización molecular
Se utilizaron las muestras de los interexones
amplificados por RT-PCR de los pacientes donde
se observó la presencia de dos picos en la curva de
melting. La ligación se realizó utilizando el
plásmido pGEM®-T Easy (Promega) y ligasa T4. La
transformación con el plásmido se realizó en
bacterias E. coli supercompetentes mediante un
protocolo de shock térmico y fueron cultivaron en
placas de 2xTY con Ampicilina, IPTG y X-gal para la
selección de transformantes. Las plasmipreps de
las colonias seleccionadas se realizaron mediante
un protocolo de lisis alcalina y precipitación salina.
Para la comprobación de la presencia del
inserto, se realizaron digestiones con ADN
plasmídico obtenido de cada clon empleando la
enzima EcoR1 (Promega) y posteriormente se
observaron mediante electroforesis en gel de
agarosa al 2%.
La secuenciación de los clones se realizó por el
método Sanger en el Laboratorio de
Secuenciación de ADN del Departamento de
Ciencias Biológicas de la Universidad de los Andes.
Solo se secuenciaron los clones donde se observó
la presencia de una banda correspondiente a la
presencia del inserto en la electroforesis después
de la digestión.
Resultados
Los análisis bioinformáticos revelaron la
presencia de posibles sitios de sitios de splicing no
canónicos tanto en los extremos de los intrones
como dentro de los exones.
Figura 1. Ubicación espacial de
los sitios de splicing canónicos y
los posibles sitios de splicing
alternativos ubicados en los
extremos de los intrones 4, 6 y
sus exones adyacentes.
Figura 2. Regiones de
reconocimiento de secuencias
consenso de unión de factores
potenciadores de splicing. Se
muestran subrayados en rojo
los punto de corte alternativo
ubicados an (a) 129 pb dentro
del extremo 5’ del intrón 4,
(b) a 48 pb dentro del
extremo 3’ del intrón 4 (c) a
30 pb dentro del extremo 3’
del exón 6 y (d) a 69 pb
dentro del extremo 3’ del
exón 6. (e) leyenda de
relación entre colores y el
reconocimiento de alguna de
las proteínas potenciadores
del splicing.
Tabla I. Secuencias consenso identificadas como posibles sitios de splicing con su ubicación relativa con respecto al sitio canónico y el puntaje. En amarillo se encuentran los sitios de splicing alternativos que conservan el marco de lectura y en negrita los nucleótidos donde ocurre el splicing.
Tabla I. Secuencias consenso identificadas como posibles sitios de splicing con su ubicación relativa con respecto al sitio canónico y el puntaje. En amarillo se encuentran los sitios de splicing alternativos que conservan el marco de lectura y en negrita los nucleótidos donde ocurre el splicing.
La Figura 1 muestra la presencia de los posibles
sitios de splicing identificados por la búsqueda de
secuencias conservadas consistentes tanto con los
sitios donantes como los receptores utilizando el
programa ESEfinder (2001-2006, Cold Spring
Harbor Laboratory). En la Tabla I se presentan las
secuencias de los sitios de splicing predichos por
el programa con su posición relativa al sitio de
splicing canónico y con un valor de puntaje
otorgado por el mismo. Este valor corresponde a
un puntaje relativo basado en el parentesco de la
secuencia identificada con respecto a las
secuencias consenso manejadas por el programa.
Mediante la predicción de la proteina que se
formaría tomando en cuenta los sitios de corte
encontrados, se confirmo la presencia de un sitio
de splicing alternativo posible en cada extremo del
intrón, los cuales permiten que se mantenga el
marco de lectura sin alterar la integridad del resto
de la proteína. En la región interxónica 4-5 se
identificaron dos inserciones: una de 129pb al
extremo del exón 4 y otra de 48pb al extremo del
intrón 5. En la región interexónica 6-7 se identificó
una inserción en el extremo del intrón 7 de 69pb y
una deleción de 30pb del extremo del intrón 6
(Tabla I y Figura 3).
Tabla I. Secuencias consenso identificadas como posibles sitios de splicing con su ubicación relativa con respecto al sitio canónico y el puntaje. En amarillo se encuentran los sitios de splicing alternativos que conservan el marco de lectura y en negrita los nucleótidos donde ocurre el splicing.
Figura 3. Construcción, predicción de estructuras terciarias y ubicación de dominios funcionales de distintas isoformas
hipotéticas. Ik.1: isoforma canoníca. El número de las isoformas alternativas indica el exón donde ocurrió la modificación.
Signo + o – indica presencia de inserción o deleción respectivamente en el exón, mientras que su posición indica el lugar de
la modificación, en el extremo 5’ (derecha) o 3’ (izquierda) del exón. Dominios funcionales en rojo en la parte inferior de la
isoforma. Estructura terciaria (rosado: hélices alfa, amarillo: láminas beta, azul: giros) en la parte superior
El estudio de las ESEs reveló una alta presencia
de sitios de unión para una gran cantidad de
proteínas potenciadoras del splicing alrededor de
los cuatro sitios de splicing crípticos encontrados.
Como se puede observar en la figura 2, estos
posibles sitios de unión se concentran
principalmente en la región exónica de cada sitio
de corte alternativo como es esperado.
Al construir las diferentes isoformas teóricas
que pueden ser formadas por la selección de los
sitios de splicing alternativo y evaluar los cambios
tanto en los dominios funcionales como en la
estructura secundaria de la proteína, se observó
que en ninguno de los caso se presentaban
cambios significativos en la estructura de las
proteínas. Los dominios funcionales importantes
para su funcionamiento, tales como lo son los
cuatro dominios para la unión al ADN y los dos
dominios de dimerización se mantienen intactos
en todos los casos, y con la excepción de la
pérdida o ganancia de unas pequeñas regiones de
hélices alfa y pequeños giros, no se presenta un
cambio significativo evidente (Figura 3).
Para la caracterización molecular de los
procesamientos no canónicos se seleccionaron 6
muestras para secuenciación correspondientes a 4
pacientes diferentes. Las muestras fueron
seleccionadas según el tamaño de la banda
observada en el gel del producto digerido para
asegurar que se encontrara el amplicón insertado
(figura 4). Los resultados de la secuenciación
mostraron la presencia del splicing canónico entre
el exón 4 y el 5, sin embargo hasta los momentos
no se ha logrado identificar la presencia del
splicing aberrante por este método.
Discusión
En primera instancia, el estudio bioinformático
de las regiones interexónicas de interés en las
cuales se sospechaba la presencia de un splicing
alternativo (sitio de splicing entre los exones 4 y 5
y los exones 6 y 7), reveló la presencia de posibles
sitios de splicing crípticos.
Tomando en cuenta el sitio de splicing
canónico reportado para el gen IKZF1, la
amplificación del interexón 4-5 produciría un
amplicón de 156pb, de los cuales 76pb pertenecen
al exón 4 y 89pb al exón 5. Las curvas de melting
de las RT-PCR realizadas para los pacientes con
LLA-B mostraron para los 14 pacientes estudiados
un pico alrededor de los 86.5oC en todos los
casos. Sin embargo, en 13 de los 14 pacientes se
Figura 4. Digestiones del ADN plasmídico de las bacterias transformadas. Se observa en la parte superior el
plásmido en dos conformaciones diferentes y una banda inferior correspondiente al fragmento del amplicon
insertado. Las flechas indican las muestras que fueron seleccionadas para secuenciación
observó la presencia de un segundo pico a 84oC.
Tomando en cuenta que el pico de 86.5oC se
observó en la totalidad de los pacientes con LLA-B
así como en todos los otros pacientes de las otras
neoplasias hematopoyéticas estudiadas, se puede
asumir que éste corresponde al splicing canónico
del gen.
El programa ESEfinder (2001-2006, Cold Spring
Harbor Laboratory) evalúa los posibles sitios de
Splicing por su semejanza a una base de datos de
sitios de splicing de exones constitutivos,
otorgando un puntaje con valores arbitrarios
dependiendo de dicha semejanza (Cartegni et al.,
2003). El programa establece un umbral cercano a
6.7 correspondiente al primer cuantil de todos los
puntajes de los sitios de splicing en la base de
datos. Mediante este programa, se encontraron 4
posibles sitios de splicing en esta región: 2 de ellos
correspondientes a los sitios de splicing canónicos,
y otros 2 dentro del intrón 4 cerca de sus
extremos 5’y 3’.
La predicción de la proteína formada tomando
en cuenta ambos sitios alternativos de splicing
presentaría una inserción de 43 aminoácidos en el
extremo del intrón 4, o de 16 aminoácidos en el
extremo del intrón 5 y se mantiene el marco de
lectura en ambos casos.
La amplificación del sitio de splicing entre el
exón 6 y 7 produciría un amplicón de 152pb, de
los cuales 50pb pertenecen al exón 6 y 102pb al
exón 7. Las curvas de melting mostraron
estudiados un pico a los 85oC para los 14
pacientes con LLA-B, adicionalmente, en 5 de los
14 pacientes se observó la presencia de un
segundo pico a 82oC. Considerando que el pico de
85oC fue encontrado en todos los pacientes
estudiados, es posible asumir que este
corresponde al splicing canónico, mientras que el
segundo pico encontrado en 5 pacientes con LLA-
B, puede corresponder a otra forma de splicing no
canónica.
Al evaluar la presencia de sitios de splicing en
los extremos del intrón 6 y en los exones 6 y 7, se
encontraron un total de 10 posibles sitios de
splicing: los 2 sitios de corte canónicos, 1 en el
interior del exón 6, 2 dentro del intrón en el
extremo cercano al exón 6, 3 dentro del intrón en
el extremo cercano al exón 7, y 2 dentro del exón
7.
De los 8 sitios de splicing crípticos encontrados,
solamente dos de ellos permitía la conservación
del marco de lectura de la proteína sin la inserción
de ningún codón de parada: un sitio de splicing 5’
encontrado a 30 pb dentro del exón 6, y un sitio
de splicing 3’ ubicado a 69 pb dentro del intrón 6
en el extremo cercano al exón 7. La predicción de
la estructura de la proteína muestra que un
splicing alternativo en los sitios crípticos
encontrados significaría una deleción de 10
aminoácidos del exón 6 o una inserción de 23
aminoácidos contiguos al exón 7 respectivamente.
Al observar la estructura primaria y secundaria
de las proteínas formadas empleando los sitios de
splicing alternativos identificados se aprecia que,
aunque se pierden o se ganan pequeñas porciones
de estructuras secundarias, no se ve alterada a
primera vista ningún motivo funcional de la
proteína. Sin embargo, el cambio de las distancias
entre los motivos existentes puede ser el
responsable de los cambios en la actividad de la
proteína. La expresión de isoformas de Ikaros
presentando pequeñas inserciones o deleciones
in-frame, aunque no necesariamente esté
inhibiendo por completo la funcionalidad de la
proteína, puede estar afectando las interaciones
específicas de dicha proteína con algún proceso
celular en particular (Zhong et al., 2009).
El sitio de splicing críptico responsable de una
deleción de 30pb en el extremo del exón 6,
corresponde con los resultados encontrados por
Sun y colaboradores (1999) los cuales reportaron
la expresión de isoformas de Ikaros presentando
esta deleción en pacientes con LLA de células T.
Aunque no se conoce con exactitud cuál es el
efecto que causa esta deleción en el
funcionamiento de la proteína, como ya se ha
mencionado, es probable que altere la
distribución de los motivos funcionales y por lo
tanto pudiendo alterar su capacidad de unión al
ADN, de dimerización o hasta de localización
subcelular (Sun et al., 1999).
Tomando en cuenta los valores del puntaje de
los sitios de splicing encontrados por el software
ESEfinder, los sitios de corte alternativos del
extremo 3’ del intrón presentaron un puntaje muy
bajo en comparación con los sitios de corte
canónicos, sugiriendo que no se encuentran tan
bien conservados y por lo tanto con una menor
probabilidad de ser utilizado como sitio de splicing
alternativo. Por otro lado, los sitios de corte 5’ en
ambos casos si muestran un puntaje mayor al
umbral establecido por el programa, e incluso, en
el caso de la deleción en el intrón 6 ya reportada,
presenta un puntaje mayor al del punto de corte
canónico.
Al realizar la búsqueda de sitios de unión
exónicos de potenciadores de splicing (ESEs), se
observó que los cuatro sitios encontrados
presentaban en sus alrededores una gran cantidad
de posibles sitios de unión, los cuales se
encontraban principalmente en las regiones
exónicas. La presencia de estos sitios de unión a
proteínas potenciadores del splicing no
representan en ningún caso una prueba infalible
de la ocurrencia de un splicing alternativo en los
sitios crípticos identificados, sin embargo, como se
ha demostrado en numerosos estudios (Krainer,
Conway, & Kozak, 1990; Long & Caceres, 2009;
Swanson, Sherer, & Malim, 2010) la presencia de
las proteínas de la familia SR como las SRp40 y
SRp55, así como el factor SF2/ASF son
componentes necesarios para que pueda ocurrir
de forma correcta el splicing del pre-ARNm.
La caracterización molecular por clonación de
cada uno de estos posibles eventos de splicing
alternativo aclarará finalmente cual es la
estructura del splicing aberrante. El análisis
bioinformático ha permitido predecir los posibles
diferentes cambios en el splicing que pueden
explicar la presencia de dos amplicones al
momento de estudiar los sitios de empalme entre
los exones constitutivos.
Conclusiones
El análisis bioinformático permitió predecir
cuatro posibles sitios de splicing alternativos
que pueden explicar la presencia de los dos
picos en las curvas de melting de las regiones
interexónicas estudiadas, notoriamente
permitió la identificación de la deleción de
30pb en el exón 6 la cual ya ha sido reportada
también en estudios previos. La confirmación
de la presencia de estos procesamientos no
canónicos seria definitiva mediante la
secuenciación de estas regiones, sin embargo,
hasta este punto los resultados de la
caracterización molecular solamente han
resultado en la identificación del splicing
canónico. No obstante, se seguirán continuando
los esfuerzos para lograr identificar estas posibles
nuevas variantes de splicing.
Referencias
Cartegni, L., Wang, J., Zhu, Z., Zhang, M. Q., & Krainer,
A. R. (2003). ESEfinder: a web resource to identify
exonic splicing enhancers. Nucleic acids research,
31(13), 3568-3571.
Davis, K. L. (2011). Ikaros: master of hematopoiesis,
agent of leukemia. Therapeutic Advances in
Hematology, 2(6), 359-368.
Dovat, S., & Payne, K. J. (2010). Tumor suppression in T
cell leukemia–the role of Ikaros. Leukemia research,
34(4), 416.
Krainer, A. R., Conway, G. C., & Kozak, D. (1990). The
essential pre-mRNA splicing factor SF2 influences 5′
splice site selection by activating proximal sites. Cell,
62(1), 35-42.
Long, J., & Caceres, J. (2009). The SR protein family of
splicing factors: master regulators of gene expression.
Biochem. J, 417, 15-27.
López-Bigas, N., Audit, B., Ouzounis, C., Parra, G., &
Guigó, R. (2005). Are splicing mutations the most
frequent cause of hereditary disease? FEBS Letters,
579(9), 1900-1903. doi:10.1016/j.febslet.2005.02.047
Meleshko, A. N., Movchan, L. V., Belevtsev, M. V., &
Savitskaja, T. V. (2008). Relative expression of different
Ikaros isoforms in childhood acute leukemia. Blood
Cells, Molecules, and Diseases, 41(3), 278-283.
Ruiz, A., Jiang, J., Kempski, H., & Brady, H. J. (2004).
Overexpression of the Ikaros 6 isoform is restricted to t
(4; 11) acute lymphoblastic leukaemia in children and
infants and has a role in B‐cell survival. British journal of
haematology, 125(1), 31-37.
Sun, L., Crotty, M.-L., Sensel, M., Sather, H., Navara, C.,
Nachman, J., … Mao, C. (1999). Expression of dominant-
negative Ikaros isoforms in T-cell acute lymphoblastic
leukemia. Clinical Cancer Research, 5(8), 2112-2120.
Swanson, C. M., Sherer, N. M., & Malim, M. H. (2010).
SRp40 and SRp55 promote the translation of unspliced
human immunodeficiency virus type 1 RNA. Journal of
virology, 84(13), 6748-6759.
Westman, B. J., Mackay, J. P., & Gell, D. (2002). Ikaros:
a key regulator of haematopoiesis. The international
journal of biochemistry & cell biology, 34(10), 1304-
1307.
Zhong, Q., Simonis, N., Li, Q.-R., Charloteaux, B., Heuze,
F., Klitgord, N., … Mou, D. (2009). Edgetic perturbation
models of human inherited disorders. Molecular
systems biology, 5(1).