Post on 11-Jan-2016
description
1
Agrupamiento de relaciones no lineales entre expresiones de
genes
Por Roberto Barchino Garrido
21/09/2009Institut de Biotecnologia i de Biomedicina
2
Índice
Introducción Programas desarrollados y análisis
de los resultados Conclusiones
3
Introducción: Objetivos
Clasificar las relaciones transitivas. Estudiar la relación entre procesos. Buscar los métodos y algoritmos
que faciliten los puntos anteriores. Analizar los resultados y obtener
conclusiones.
Introducción
Fase 1
Fase 2
Fase 3
Trabajo Futuro
Conclusiones
4
Introducción: Microarrays
Cada celda representa a un gen.
La intensidad de color representa el nivel de expresión.
Introducción
Fase 1
Fase 2
Fase 3
Trabajo Futuro
Conclusiones
5
Introducción: Microarrays Niveles de expresión del gen SCHPDH
bajo diferentes condiciones muestralesIntroducción
Fase 1
Fase 2
Fase 3
Trabajo Futuro
Conclusiones
6
Introducción: Microarrays
Introducción
Fase 1
Fase 2
Fase 3
Trabajo Futuro
Conclusiones
7
Fase 1 y 2 Clasificar las relaciones transitivas
entre grupos de genes cuyas expresiones mantengan todos ellos una relación no lineal.
Estudiar los procesos y que relación a nivel de expresión tienen entre sí.
Buscar los métodos y algoritmos que faciliten los puntos anteriores.
Analizar los resultados y obtener conclusiones.
Introducción
Fase 1
Fase 2
Fase 3
Trabajo Futuro
Conclusiones
8
Fase 1
¿Qué es una relación transitiva? Una relación todos con todos
A -> B B -> C C -> A
Representación: grafos
A C
B
Introducción
Fase 1
Fase 2
Fase 3
Trabajo Futuro
Conclusiones
9
Fase 1 Representación actual de las relaciones.
Introducción
Fase 1
Fase 2
Fase 3
Trabajo Futuro
Conclusiones
10
Fase 1
Necesidad de un algoritmo para encontrar relaciones transitorias entre las expresiones no lineales de genes.
Búsqueda de subgrafos completos dentro de grafos: Cliques
Introducción
Fase 1
Fase 2
Fase 3
Trabajo Futuro
Conclusiones
11
Fase 1
¿Qué es un clique? Es un subgrafo completo dentro
de un grafo.
AC
B
EH
G
F
I
D
Introducción
Fase 1
Fase 2
Fase 3
Trabajo Futuro
Conclusiones
12
Fase 1
Problema: Algoritmo NP-Completo
Solución: MACE (MAximal Clique Enumerater)
Introducción
Fase 1
Fase 2
Fase 3
Trabajo Futuro
Conclusiones
AC
B
EH
G
F
I
D
13
Fase 1 Leemos los datos de las relaciones no lineales entre las expresiones de genes de nuestra microarray.
Creamos una matriz en la que se representa el grafo de relaciones
Ejecutamos MACE Recuperamos la información de las relaciones.
Estudiamos los datos obtenidos.
Introducción
Fase 1
Fase 2
Fase 3
Trabajo Futuro
Conclusiones
14
Fase 1
Número Nodos Número total Cliques Porcentaje
3 1758 72%
4 632 26%
5 54 2%
Introducción
Fase 1
Fase 2
Fase 3
Trabajo Futuro
Conclusiones
15
Fase 2 Clasificar las relaciones según su tipo. Encontrar grafos isomorfos
Problema NP-(completo).
Introducción
Fase 1
Fase 2
Fase 3
Trabajo Futuro
Conclusiones
16
Fase 2 Realmente no nos importa tanto la
morfología como el tipo de relaciones que hay.
Si tenemos en cuenta la morfología obtendremos muchas clases con pocos datos.
En cualquier caso conviene agruparlos para facilitar la investigación.
El investigador ya mirará en detalle el significado biológico de esa relación.
Introducción
Fase 1
Fase 2
Fase 3
Trabajo Futuro
Conclusiones
17
Fase 2
Solución: IsoTypes. A cada tipo de relación se le asigna un valor.
Se ordenan las relaciones de menor a mayor.
Se clasifica por matching.
Introducción
Fase 1
Fase 2
Fase 3
Trabajo Futuro
Conclusiones
18
Fase 2
Finalmente se obtienen 420 clases diferentes.
Cada clase está formada por los cliques que tienen el mismo IsoType.
No todas las clases son interesantes a nivel biológico.
Introducción
Fase 1
Fase 2
Fase 3
Trabajo Futuro
Conclusiones
19 Relación 1: Activadora. Relación 8: Mutuamente excluyente
Introducción
Fase 1
Fase 2
Fase 3
Trabajo Futuro
Conclusiones
20 Relación 8 y 17: Mutuamente excluyente. Relación 10: Inhibidora
Introducción
Fase 1
Fase 2
Fase 3
Trabajo Futuro
Conclusiones
21 Relación 0: Activadora. Relación 9 y 12: inhibidoras
Introducción
Fase 1
Fase 2
Fase 3
Trabajo Futuro
Conclusiones
22 Relación 5: Activadora. Relación 9: inhibidora. Relación 26: Activadora/Desactivadora
Introducción
Fase 1
Fase 2
Fase 3
Trabajo Futuro
Conclusiones
23
Fase 3 Clasificar las relaciones transitivas
entre grupos de genes cuyas expresiones mantengan todos ellos una relación no lineal.
Estudiar los procesos y que relación a nivel de expresión tienen entre sí.
Buscar los métodos y algoritmos que faciliten los puntos anteriores.
Analizar los resultados y obtener conclusiones.
Introducción
Fase 1
Fase 2
Fase 3
Trabajo Futuro
Conclusiones
24
Fase 3 ¿Qué es un proceso?
Varios genes que se coexpresan a la vez.
proceso
relaciones lineales
IntroducciónIntroducción
Fase 1
Fase 2
Fase 3
Trabajo Futuro
Conclusiones
25
Fase 3 ¿Qué buscamos?
La relación a nivel de proceso. Clique de
relaciones no lineales
Proceso
Introducción
Fase 1
Fase 2
Fase 3
Trabajo Futuro
Conclusiones
26
Fase 3 Para cada clique. Comprobar con todos los cliques que tengan el mismo IsoType que los genes mantienen una relación lineal.
Caso que sí: guardar.
Introducción
Fase 1
Fase 2
Fase 3
Trabajo Futuro
Conclusiones
27
Fase 3
Problema: En caso de que el clique tenga aristas repetidas es necesario permutar para comprobar la linealidad.
Permutar Complejidad factorial.
Introducción
Fase 1
Fase 2
Fase 3
Trabajo Futuro
Conclusiones
28
Introducción
Fase 1
Fase 2
Fase 3
Trabajo Futuro
Conclusiones
29
Trabajo Futuro
Crear una herramienta que automatice la elaboración de procesos con diversas maneras construcción a partir de los archivos generados en la fase 3. En forma de clique de cliques. En forma de grafo de cliques
lineales.
Introducción
Fase 1
Fase 2
Fase 3
Trabajo Futuro
Conclusiones
30
Conclusiones
Objetivos cumplidos.
Transitividad predecible. Procesos con relaciones no
complejas. Programa automatizado.
Introducción
Fase 1
Fase 2
Fase 3
Trabajo Futuro
Conclusiones
31
Agrupamiento de relaciones no lineales entre expresiones de
genes
Por Roberto Barchino Garrido
Institut de Biotecnologia i de Biomedicina