Post on 26-Jun-2015
Instituto Tecnológico de Durango
Departamento de Sistemas y Computación
Licenciatura en Informática
Taller de Investigación II
Proyecto de Investigación:
“LA BIONFORMÁTICA COMO NUEVA
ÁREA DE TRABAJO EN MÉXICO”
Realizó: Oscar Iván Saucedo Romero
Durango, Dgo. a 15 de Diciembre de 2010
La Bioinformática como Nueva Área de Trabajo en México
Oscar Iván Saucedo Romero - Diciembre 2010 2 Instituto Tecnológico de Durango - Licenciatura en Informática
Tabla de Contenido
Capitulo 1: Introducción ................................................................................................................................ 4
1.1. Definición del Problema ..................................................................................................................... 4
1.2. Justificación ........................................................................................................................................ 5
1.3. Objetivo General ................................................................................................................................ 5
1.4. Objetivos Específicos .......................................................................................................................... 5
1.5. Preguntas de Investigación ................................................................................................................ 6
1.6. Metodología ....................................................................................................................................... 6
1.7. Alcances y Limitaciones ...................................................................................................................... 7
Capítulo 2. La Bioinformática y su situación en México ................................................................................ 8
2.1. Concepto de Bioinformática, Biocomputación, Biología Computacional e Informática Médica ....... 8
2.2. Historia de la Bioinformática ............................................................................................................ 12
2.3. La Bioinformática en la Actualidad ................................................................................................... 15
2.5. El Futuro de la Bioinformática y sus Perspectivas ............................................................................ 18
2.6. La Bioinformática en México ............................................................................................................ 21
Capitulo 3. Principales Áreas de Investigación y Desarrollo ....................................................................... 23
3.1. Medicina Molecular, Genómica e Individual. ................................................................................... 23
3.2. Análisis de Mutaciones en el Cáncer ................................................................................................ 24
3.3. Epidemiología ................................................................................................................................... 25
3.4. Biología Evolutiva Computacional .................................................................................................... 25
3.6. Modelado de Sistemas Biológicos .................................................................................................... 29
3.7. e-Salud .............................................................................................................................................. 29
3.8 Medición de la Biodiversidad ............................................................................................................ 29
Capitulo 4. Resultados ................................................................................................................................. 31
Conclusiones ................................................................................................................................................ 31
Referencias Bibliográficas ........................................................................................................................... 32
La Bioinformática como Nueva Área de Trabajo en México
Oscar Iván Saucedo Romero - Diciembre 2010 3 Instituto Tecnológico de Durango - Licenciatura en Informática
Tabla de Figuras
Figura 1. La Bioinformática como convergencia multidisciplinaria (Fuente: Coltell i Simon, 2004) ... 9
Figura 2. La Informática Biomédica (Fuente: Cañedo Andalia & Arencibia Jorge, 2004) .............. 12
La Bioinformática como Nueva Área de Trabajo en México
Oscar Iván Saucedo Romero - Diciembre 2010 4 Instituto Tecnológico de Durango - Licenciatura en Informática
Capitulo 1: Introducción
“Biología y Computación, ya interdependientes, van a permanecer inextricablemente unidas.”
(John Maddox, citado en Guigó Serra, 2000).
La Bioinformática se define como la aplicación de las tecnologías de las computadoras a
la gestión y análisis de datos biológicos. Es la investigación, desarrollo o aplicación de
herramientas computacionales y aproximaciones para la expansión del uso de datos biológicos,
médicos, conductuales o de salud, incluyendo aquellas herramientas que sirvan para adquirir,
almacenar, organizar, analizar o visualizar tales datos.
Es importante señalar que para desarrollar el software que ayuda a solucionar los
problemas de estas áreas de la biología se requiere de diferentes conocimientos que incluyen,
además de la informática, las matemáticas aplicadas, estadística, ciencias de la computación,
inteligencia artificial, química y bioquímica, entre otros.
El presente proyecto de investigación nos dará a conocer de qué trata esta disciplina, así
como su historia. También describirá su situación en nuestro país y nos enlistará las principales
áreas en la que los egresados de las carreras relacionadas a las Tecnologías de la Información y
Comunicación podrían ejercer su profesión si estuvieran interesados en la Bioinformática.
1.1. Definición del Problema
Durante las últimas décadas, las Tecnologías de la Información y la Comunicación (TICs) se
han convertido en una herramienta importante para las organizaciones, ya sean gubernamentales
o privadas, debido a la enorme ayuda que les proporciona al momento de realizar sus labores.
La Bioinformática como Nueva Área de Trabajo en México
Oscar Iván Saucedo Romero - Diciembre 2010 5 Instituto Tecnológico de Durango - Licenciatura en Informática
Dentro de éstos organismos, se en encuentran aquellos que tienen alguna relación con la
biología y ciencias afines, que sin duda alguna han encontrado un gran apoyo, gracias al aporte
de software y equipo especializado, así como de nuevas tecnologías, que han permitido un gran
avance dentro de estas dependencias. Es por esto que dentro del área de la Informática, ha
surgido un campo en el cual se agrupan todas estas herramientas y tecnologías: La
Bioinformática.
Y aunque esta disciplina nació en los 50 y se consolidó en los 80, en México apenas está
empezando a desarrollarse (Cañedo Andalia & Arencibia Jorge, 2004). Por tal razón, esta
investigación nos ayudará a conocer lo que es la Bioinformática, y las principales áreas en que se
aplica este tipo de informática y en las cuales, los informáticos podríamos desempeñarnos.
1.2. Justificación
El motivo principal de la esta investigación es el de conocer si la Bioinformática se podrá
convertir en un futuro no muy lejano, en una nueva área de oportunidad en México, en la cual los
profesionistas del área de las Tecnologías de la Información, principalmente los Informáticos,
puedan ejercer su profesión.
1.3. Objetivo General
Analizar las posibilidades de que la Bioinformática pueda ofrecerse como un nuevo e
importante campo laboral en México, en el cual los informáticos, y estudiantes del área de
computación en general, puedan ejercer su profesión.
1.4. Objetivos Específicos
Definir de forma clara y precisa lo que es la Bioinformática.
La Bioinformática como Nueva Área de Trabajo en México
Oscar Iván Saucedo Romero - Diciembre 2010 6 Instituto Tecnológico de Durango - Licenciatura en Informática
Describir brevemente la historia de la Bioinformática y enlistar los hechos trascendentales
de la misma.
Analizar la historia y situación actual de la Bioinformática en México.
Detallar las principales áreas en las que se podría aplicar la Bioinformática en México.
Especificar algunas de las técnicas y herramientas de software que se usan en la
Bioinformática.
1.5. Preguntas de Investigación
¿Qué es la Bioinformática?
¿Cuáles han sido los hechos relevantes dentro de la historia del desarrollo de la
Bioinformática?
¿Cómo ha sido el desarrollo de la Bioinformática en México?
¿Cuál es la situación actual de la Bioinformática en México?
¿Cuáles son las principales áreas en las que se aplica la Bioinformática en México?
¿Qué tan bien (o mal) esta remunerado el trabajar en estas áreas?
1.6. Metodología
Esta investigación es de Naturaleza Cualitativa, debido a que no se recolectarán ningún
tipo de datos numéricos para usarse en estadísticas o probabilidades. Tendrá un Enfoque
Inductivo ya que analizará si la Bioinformática un futuro cercano se pueda convertir en una nueva
área de trabajo en México.
Su Diseño es No Experimental, Transversal ya que sólo se examinará el pasado y presente
de la Bioinformática para hacer una hipótesis de su futuro, más no se comprobará esa hipótesis
posteriormente.
La Bioinformática como Nueva Área de Trabajo en México
Oscar Iván Saucedo Romero - Diciembre 2010 7 Instituto Tecnológico de Durango - Licenciatura en Informática
Sus alcances son Exploratorio, pues la Bioinformática es relativamente nueva en México, y
Descriptivo, debido a que se examina su historia y los posibles áreas laborales en las que se
podría emplear la Bioinformática.
1.7. Alcances y Limitaciones
Esta investigación examinará la posibilidad de que en un futuro cercano la Bioinformática
se pueda convertir en una productiva área de oportunidad para los egresados de carreras
relacionadas con las Tecnologías de la Información y la Comunicación, más no lo comprobará
debido a que no existe el tiempo suficiente para seguir un estudio detallado.
Lo que sí se definirá será los campos laborales en los que se podría aplicar la
Bioinformática en México.
La Bioinformática como Nueva Área de Trabajo en México
Oscar Iván Saucedo Romero - Diciembre 2010 8 Instituto Tecnológico de Durango - Licenciatura en Informática
Capítulo 2. La Bioinformática y su situación en México
Desde los siglos XVIII y XIX, los biólogos se enfrentaron a problemas relacionados con el
procesamiento masivo de la información. Darwin, por ejemplo en su viaje en el Beagle, recolectó
y procesó manualmente una multitud de datos sobre las especies (Cañedo Andalia & Arencibia
Jorge, 2004).
En 1943, el descubrimiento de la molécula de ADN y, sobre todo, en 1953, el anuncio del
descubrimiento de la estructura del ADN, realizado por el bioquímico James Watson y el biofísico
Francis Crack, marcaron el inicio de una nueva era en el campo de las ciencias biológicas,
caracterizada por el avance impetuoso del conocimiento a un nivel de profundidad totalmente
nuevo, la molécula (Joyanes Aguilar, citado en Cañedo Andalia & Arencibia Jorge, 2004).
El desarrollo de la ingeniería genética y las nuevas tecnologías de la información durante
la última década del siglo XX, condicionaron el surgimiento de una disciplina que generó vínculos
indisolubles entre la Informática y las Ciencias Biológicas: la Bioinformática (Perezleo Solórzano,
Arencibia Jorge, Conill González, Achón Veloz, & Araújo Ruiz, 2003).
2.1. Concepto de Bioinformática, Biocomputación, Biología Computacional e
Informática Médica
La bioinformática es una disciplina emergente que utiliza las tecnologías de la información
para captar, organizar, analizar y distribuir información biológica con el propósito de responder
preguntas complejas en biología. Sin embargo, el objetivo final es mucho más amplio y consiste en
utilizar esta información para desarrollar nuevas formas de tratar, curar o prevenir las miles de
enfermedades que afligen a la humanidad (Cañedo Andalia & Arencibia Jorge, 2004).
La Bioinformática como Nueva Área de Trabajo en México
Oscar Iván Saucedo Romero - Diciembre 2010 9 Instituto Tecnológico de Durango - Licenciatura en Informática
Esta disciplina está orientada fundamentalmente a la investigación aplicada, relacionada
principalmente con las siguientes áreas: biología molecular, genómica, proteómica, ciencias
biomédicas, ciencias de la computación, matemáticas, física y estadística (Ver Figura 1). Así
mismo, se considera que es un enfoque interdisciplinario, puesto que al menos un científico experto
en biología y otro científico experto en las tecnologías de la información y la computación, deben
colaborar estrechamente para alcanzar un objetivo común (Coltell i Simon, 2004).
Figura 1 La Bioinformática como convergencia multidisciplinaria (Fuente: Coltell i Simon, 2004)
Una definición más general, la ubica como el estudio de la información biológica a partir
de la teoría de la información, la computación y las matemáticas. El reto más importante al que
se enfrenta esta ciencia es responder a la avalancha de datos que provienen del proyecto
"Genoma humano" y de la genómica (Rivas M., citado por Cañedo Andalia & Arencibia Jorge,
2004).
El término Bioinformática es relativamente reciente, y apareció en la literatura a principios
de 1990, cuando comenzaba a estructurarse el llamado "Proyecto Genoma Humano" y el
National Center for Biotechnology Information de los Estados Unidos, daba sus primeros pasos
(Perezleo Solórzano, Arencibia Jorge, Conill González, Achón Veloz, & Araújo Ruiz, 2003).
La Bioinformática como Nueva Área de Trabajo en México
Oscar Iván Saucedo Romero - Diciembre 2010 10 Instituto Tecnológico de Durango - Licenciatura en Informática
La bioinformática proporciona herramientas y recursos para favorecer la investigación
biomédica; trata de desarrollar sistemas que sirvan para entender el flujo de información desde
los genes a las estructuras moleculares, su función bioquímica, conducta biológica y, finalmente, su
influencia en las enfermedades y la salud. La bioinformática es la fusión de las técnicas
computacionales con el entendimiento y apreciación de datos biológicos, el almacenamiento,
recuperación, manipulación y la correlación de datos procedentes de distintas fuentes (Rivas M.
citado en Cañedo Andalia & Arencibia Jorge, 2004).
Igualmente, la bioinformática ofrece modelos, métodos y técnicas a la comunidad
investigadora para ordenar los datos y extraer conocimientos útiles al campo de la biomedicina.
Los centros de investigación, la industria farmacéutica y las empresas biotecnológicas han
realizado un gran esfuerzo para la adaptación a estos nuevos enfoques (Cañedo Andalia &
Arencibia Jorge, 2004).
La magnitud de la información que genera la investigación genómica es tal que,
probablemente, supera la magnitud de la información que genera la investigación en otras
disciplinas científicas (Guigó Serra, 2000).
La bioinformática comprende tres subespecialidades (Bibgen, citado en Cañedo Andalia &
Arencibia Jorge, 2004):
La Bioinformática
La Biología Computacional
La Biocomputación
La Bioinformática abarca la investigación y desarrollo de la infraestructura y de los
sistemas de información y comunicación que requiere la biología moderna -redes y bases de
datos para el genoma, estaciones de trabajo para procesamiento de imágenes, etcétera. Entre
las áreas de interés de la Bioinformática se encuentran: la administración de datos en el
laboratorio; la adquisición de datos y descifrado; la alineación y ensamblaje de secuencias, la
predicción de dominios funcionales en las secuencias del genoma, la búsqueda en bases de datos
La Bioinformática como Nueva Área de Trabajo en México
Oscar Iván Saucedo Romero - Diciembre 2010 11 Instituto Tecnológico de Durango - Licenciatura en Informática
de estructuras, la determinación y predicción de estructuras macromoleculares, la construcción de
árboles filogenéticos, las bases de datos compartidas y la robótica aplicada a tareas
relacionadas con el mapeo y secuenciación de ADN (Cañedo Andalia & Arencibia Jorge, 2004).
La Biología Computacional comprende la computación aplicada a la comprensión de las
cuestiones biológicas básicas, a partir de la modelación y simulación -sistemas de vida artificial,
algoritmos genéticos, redes de neuronas artificiales (Sánchez F. y García V., citado en Cañedo
Andalia & Arencibia Jorge, 2004).
Si bien la bioinformática puede definirse como la disciplina científica que se ocupa de la
adquisición, procesamiento, almacenamiento, distribución, análisis e interpretación de datos e
información biológica por medio de métodos y herramientas informáticas, la Biología
Computacional, por su parte, atiende las simulaciones y la modelación matemática de los
procesos biológicos, aunque en los últimos años la frontera entre estas disciplinas se ha hecho
borrosa, como resultado de la disponibilidad de técnicas de alto rendimiento (Sánchez F. y
García V., citado en Cañedo Andalia & Arencibia Jorge, 2004).
La Biocomputación incluye el desarrollo y utilización de sistemas computacionales
basados en modelos y materiales biológicos -biochips, biosensores, computación basada en ADN,
entre otros (Amgen, citado en Cañedo Andalia & Arencibia Jorge, 2004).
La Informática Médica es el campo de las ciencias de la información que se ocupa del
análisis y la diseminación de datos médicos mediante diferentes aplicaciones informáticas sobre
aspectos del cuidado de la salud y medicina (Ver Figura 2). Es la disciplina que trata los aspectos
teóricos y prácticos relacionados con el procesamiento y la comunicación eficiente de información
sobre salud. (Cañedo Andalia & Arencibia Jorge, 2004).
La Bioinformática como Nueva Área de Trabajo en México
Oscar Iván Saucedo Romero - Diciembre 2010 12 Instituto Tecnológico de Durango - Licenciatura en Informática
Figura 2 La Informática Biomédica (Fuente: Cañedo Andalia & Arencibia Jorge, 2004)
2.2. Historia de la Bioinformática
Durante la segunda mitad del siglo XX, la bioquímica mostró un avance acelerado, sobre
todo, a partir del desarrollo de nuevas técnicas como la cromatografía, la difracción de rayos X,
el marcaje por isótopos y la aparición del microscopio electrónico, que abrieron el camino para el
análisis detallado y el descubrimiento de muchas moléculas y rutas metabólicas de la célula. Y con
ella, avanzaron, también con un ímpetu desconocido, la biología celular, la biología molecular, la
biotecnología y la genética, entre otras (Barreto Hernández, 2008).
Así, al principio de los años 60, el número creciente de secuencias de aminoácidos era uno
de los factores principales que contribuyó al desarrollo de la biología computacional (Cañedo
Andalia & Arencibia Jorge, 2004). La cantidad de datos que debían analizarse y la mejora del
rendimiento, y los precios más asequibles de las computadoras, hicieron posible su introducción en
los ambientes biológicos y académicos. La tecnología proporciona las herramientas prácticas
para que los científicos puedan explorar las proteínas y el ADN. (Cañedo Andalia & Arencibia
Jorge, 2004).
La Bioinformática como Nueva Área de Trabajo en México
Oscar Iván Saucedo Romero - Diciembre 2010 13 Instituto Tecnológico de Durango - Licenciatura en Informática
Paralelamente, una perspectiva científica surge en los años sesenta, con la idea de que la
genética podría estudiarse considerando la codificación, almacenamiento y el flujo de
información entre las moléculas. Esta perspectiva queda en el origen de la disciplina conocida
como biología computacional (Cañedo Andalia & Arencibia Jorge, 2004).
En esta década también, aparecieron los primeros signos de una convergencia entre la
biología, bioquímica, ingeniería e informática que conduciría después al nacimiento de la
Bioinformática. No obstante, el uso de las computadoras para la investigación biológica durante
estos años no se reconocía como un elemento importante para la investigación en el laboratorio
(Cañedo Andalia & Arencibia Jorge, 2004).
El campo de la bioinformática necesitaba un liderazgo y una financiación, similar al que
comenzaba a gestarse al mismo tiempo por los profesionales de la informática médica. Después,
algunos investigadores mostraron que las computadoras podían acelerar dramáticamente la
secuenciación y la determinación de estructuras de la proteína. Los métodos informatizados para
la secuenciación del ADN empezaron a aparecer y los primeros bancos de datos de secuencias
de proteína se hicieron presentes. También, se emplearon técnicas computacionales para predecir
la estructura secundaria del ARN (Cañedo Andalia & Arencibia Jorge, 2004).
Hacia finales de los años 80, comenzó a emplearse el término bioinformática, aunque
algunos pioneros habían aplicado las computadoras con éxito a los problemas de la biología
molecular, incluso una década antes de que fuera posible la secuenciación del ADN. Entre estas
aplicaciones, Margaret Dayhoff desarrolló los primeros programas para determinar la secuencia
de aminoácidos de una proteína en 1965 y preparó el primer banco de datos de secuencias de
proteínas que luego evolucionó para convertirse en PIR (Protein Information Resource) en 1983
(Cañedo Andalia & Arencibia Jorge, 2004).
También en esta década se desarrollaron programas bioinformáticos en los centros
académicos que rápidamente se convirtieron en productos comerciales, y se comenzaron a
distribuir como paquetes integrados de herramientas para la administración de datos en el
campo de la biología molecular. Las mejoras en los sistemas computacionales permitieron el
avance de las técnicas de aprendizaje automático con clara aplicabilidad en bioinformática. Se
La Bioinformática como Nueva Área de Trabajo en México
Oscar Iván Saucedo Romero - Diciembre 2010 14 Instituto Tecnológico de Durango - Licenciatura en Informática
aplicaron redes de neuronas artificiales, modelos de Markov ocultos o métodos de clustering para
analizar los conjuntos de datos no caracterizados (Cañedo Andalia & Arencibia Jorge, 2004).
Sin embargo, en esta época, el campo de acción de la bioinformática estaba
relativamente limitado, y lo impulsó la generación de bases de datos primarias para almacenar y
catalogar la información generada. El rápido crecimiento de las bases de datos primarias exigió
el desarrollo de herramientas de consulta basadas en similitud de secuencias para poder
consultar las bases de datos y recabar información de utilidad en experimentación biológica
(Martínez Barnetchet, 2007).
Otro avance importante y fundamental fue el desarrollo del WWW, como un medio
universal para acceder a bases de datos biológicas y programas bioinformáticos. Esto permitió el
desarrollo de muchas bases en las que los investigadores pueden encontrar la información que
requiere su trabajo experimental. El WWW también es la infraestructura que soporta al
intercambio activo de información entre investigadores (Cañedo Andalia & Arencibia Jorge,
2004).
La bioinformática dio un giro en su enfoque a mediados de los años noventa, perfilándose
como una área de investigación gracias al desarrollo de proyectos de secuenciación, como el del
genoma humano y de otros organismos importantes, en las áreas de la salud y la industria, lo cual
propició el desarrollo de herramientas bioinformáticas que se han utilizado para realizar estudios
en la organización de genomas, el descubrimiento de genes, la relación entre las mutaciones y la
alteración de la función biológica, y la evolución de diferentes organismos, entre muchas otras,
que han facilitado el desarrollo de disciplinas como la genómica, la proteómica y la filogenia
(Barreto Hernández, 2008).
En el año 2003, con la conclusión del proyecto concertado por la Human Genome
Organization desde el año 1988, fue posible determinar el orden preciso de los cerca de 3 200
millones de nucleótidos que forman nuestro genoma y elaborar un mapa que ubica a sus genes.
Así es como nacieron la medicina molecular, y la Genómica, que estudia sistemáticamente, y a
escala global, la estructura y función de todos los genes de una especie. (Coltell O. y Corella D.,
citado en Cañedo Andalia & Arencibia Jorge, 2004).
La Bioinformática como Nueva Área de Trabajo en México
Oscar Iván Saucedo Romero - Diciembre 2010 15 Instituto Tecnológico de Durango - Licenciatura en Informática
2.3. La Bioinformática en la Actualidad
Durante los últimos años, la bioinformática ha trabajado con muchas bases de datos que
almacenaban información biológica en la medida que aparecía. Esto conllevaba a que muchos
científicos se quejaran de la creciente complejidad que representaba encontrar información útil en
un "laberinto de datos". Para mejorar esta situación, se desarrollaron técnicas que integran la
información dispersa, gestionan bases de datos distribuidas, las seleccionan automáticamente,
evalúan su calidad y facilitan su accesibilidad a los investigadores (Cañedo Andalia & Arencibia
Jorge, 2004).
La revelación de la secuencia completa del genoma humano posibilitó conocer las causas
moleculares de las enfermedades, así como descubrir la significación de las diferencias genéticas
entre las personas para el desarrollo de enfermedades (Barreto Hernández, 2008).
La industria médica se erige sobre los conocimientos, los recursos y las tecnologías
emanadas de dicho proyecto para lograr una mejor contribución de la genética a la salud
humana. Durante los últimos años, la genética ha adquirido una significación especial para el
diagnóstico, seguimiento y tratamiento de las enfermedades (Cañedo Andalia & Arencibia Jorge,
2004).
Sin embargo, la secuenciación -determinación del orden en el que se disponen las bases
que forman una molécula de DNA- del genoma humano ha originado cantidades enormes de
información que debe procesarse para poderse utilizar convenientemente. Los datos obtenidos
deben analizarse. Es imprescindible encontrar la manera de almacenarlos para poder
recuperarlos y distribuirlos cuando se requiera. En todas las fases anteriores, la informática ocupó
un lugar sobresaliente para poder transformar los datos en información y ésta en conocimiento
(Barreto Hernández, 2008).
El crecimiento de los datos biológicos, que han pasado de 606 secuencias de ADN
almacenadas en 1982, a más de 82 millones hoy en día, fue impulsado por el desarrollo de la
técnica Reacción en Cadena de la Polimerasa (PCR) en el año de 1986, y ahora por la aparición
La Bioinformática como Nueva Área de Trabajo en México
Oscar Iván Saucedo Romero - Diciembre 2010 16 Instituto Tecnológico de Durango - Licenciatura en Informática
de las denominadas nuevas tecnologías de alto rendimiento en experimentación biológica
(Barreto Hernández, 2008).
Los acelerados avances en el desarrollo de la siguiente generación de las tecnologías de
secuenciación, han conllevado a la producción de equipos comerciales de muy alto rendimiento,
capaces de producir diariamente enormes cantidades de datos. Las primeras aplicaciones de
estas nuevas metodologías de secuenciación incluyen análisis de genómica comparativa, genómica
de microorganismos, la detección de STP de alto rendimiento, secuenciación, y análisis de ARN
pequeños, identificación de mutaciones de genes en rutas metabólicas asociadas a enfermedades,
determinación de genes con bajas tasas de expresión en sus ambientes naturales, entre otros
(Barreto Hernández, 2008).
El inmenso volumen de datos que se está generando, una vez almacenados, requiere
también de nuevos modelos de análisis que permitan hacerlos comparables en la medida que son
obtenidos utilizando un variado conjunto de técnicas y condiciones experimentales. Así mismo, la
enorme generación de datos hace que muchos grupos de investigación en bioinformática se
encuentren desarrollando nuevas metodologías estadísticas de análisis que modelen factores de
variación, y permitan tener una medida estándar y confiable de la expresión de genes, que
posibiliten su comparación independientemente de la técnica experimental usada (Barreto
Hernández, 2008).
Aunque aún estamos lejos de entender por completo los sistemas biológicos debido a su
complejidad por tratarse de sistemas naturales, y de que no es posible conocer todas las
interacciones que ocurren a cierto nivel para modelarlas de forma integral, un esfuerzo mayor en
el desarrollo de herramientas bioinformáticas para la integración y modelación, nos acercará
cada vez más a esto, permitiéndonos nuevas e interesantes aplicaciones (Barreto Hernández,
2008).
Sin embargo, la bioinformática actual es uno de los pilares del estudio de los sistemas
vivos desde el punto de vista sistémico, y de hecho es conocida también como “Biología de
Sistemas”. En las ciencias de la salud comienza a revelarse su utilidad de forma paulatina, ya que
se ha observado un gran avance en la caracterización de la variabilidad genética en seres
La Bioinformática como Nueva Área de Trabajo en México
Oscar Iván Saucedo Romero - Diciembre 2010 17 Instituto Tecnológico de Durango - Licenciatura en Informática
humanos y en la forma en que esta variabilidad se vincula con determinados riesgos de
enfermedades (Martínez Barnetchet, 2007).
La bioinformática combina dos de las tecnologías clave para el siglo XXI: la biotecnología
y la informática; y ha sido una de las primeras disciplinas científico-técnicas en aprovechar las
características de los sistemas basados en Internet para desarrollar sus soluciones y posibilitar la
compartición de datos, la distribución de software y el trabajo de colaboración entre grupos y
científicos (Martín Sánchez, 2000).
Con el crecimiento explosivo de Internet y la terminación de la primera fase del Proyecto
Genoma Humano, se está apreciando una tendencia, que corre en paralelo a la del comercio
electrónico en otras áreas de actividad, consistente en la aparición de portales en Internet para
facilitar el acceso de los investigadores a datos genéticos y a herramientas bioinformáticas.
También en el ámbito del diagnóstico genético existen iniciativas para desarrollar servicios de
teleconsulta mediante biochips a través de Internet o de captación de material genético de
pacientes para la investigación desde portales médicos en Internet (Martín Sánchez, 2000).
Es importante destacar que en la actualidad cualquier proyecto a nivel mundial que
busque realizar investigación en genómica, transcriptómica, proteómica, metabólica, y cualquier
otra ómica, requiere de un fuerte apoyo de la bioinformática en el desarrollo y implementación
de nuevas aplicaciones particulares que permitan rentabilizar la información generada, sobre
todo si se considera que, con base a los resultados obtenidos utilizando los desarrollos
bioinformáticos, se avanzará mucho más rápido y con mayor confianza en la experimentación
biológica de cualquier tipo (Barreto Hernández, 2008).
2.4. Las Barreras de la Bioinformática
Una de las principales limitaciones de la Bioinformática, es el hecho de que la información
que produce (especialmente la genómica) crece a una velocidad muy superior a la que crecen (y
a la que pueden crecer) los recursos necesarios para analizarla. Y no se trata sólo de recursos
computacionales, Se trata, sobre todo, de recursos humanos. Esto quiere decir que se tiene una
La Bioinformática como Nueva Área de Trabajo en México
Oscar Iván Saucedo Romero - Diciembre 2010 18 Instituto Tecnológico de Durango - Licenciatura en Informática
escasez de científicos, investigadores y técnicos interesados en la utilización y el desarrollo de
herramientas computacionales para el análisis de este tipo de datos.
Aparte, la bioinformática se enfrenta a grandes problemas para conseguir el
reconocimiento académico y profesional. Los científicos de la computación consideran que la
informática aplicada es sólo una rama de un tronco común que soporta todas las teorías y los
logros científicos. Según esta visión, la bioinformática es simplemente una aplicación de la
informática a la medicina y la biología. Para muchos médicos, los bioinformáticos son
profesionales de la tecnología que construyen software y bases de datos para ayudarlos en su
práctica habitual (Cañedo Andalia & Arencibia Jorge, 2004).
Los investigadores de esta área han luchado para desarrollar sus propios campos
independientes, con departamentos, conferencias y revistas científicas especializadas. En ambos
casos, la mayoría de los pioneros tenían alguna formación en campos técnicos como la informática
o la ingeniería. Así mismo, los profesionales de la bioinformática sienten que necesitan demostrar
que su especialidad es una disciplina científica establecida, que merece reconocimiento
académico y profesional. Sólo así, pueden lograrse programas universitarios, laboratorios
independientes, mecanismos propios de financiación y el desarrollo de verdaderas carreras
profesionales dentro de los departamentos tradicionales de biología, medicina o informática
(Cañedo Andalia & Arencibia Jorge, 2004).
2.5. El Futuro de la Bioinformática y sus Perspectivas
La comprensión sobre cómo las variantes genéticas y el medio ambiente regulan el
fenotipo de las células, tejidos y órganos, ocupará la investigación del siglo XXI. Los datos
obtenidos por las nuevas técnicas de secuenciación, además de ayudar al descubrimiento de
mejores estrategias para el diagnóstico, tratamiento y prevención de enfermedades, jugarán un
papel importante, en hacer realidad la medicina personalizada ya que, relativamente pronto, se
espera alcanzar la meta de secuenciar un genoma humano por 1000 dólares. (Barreto
Hernández, 2008).
La Bioinformática como Nueva Área de Trabajo en México
Oscar Iván Saucedo Romero - Diciembre 2010 19 Instituto Tecnológico de Durango - Licenciatura en Informática
La masiva cantidad de datos que se generarán en un futuro inmediato por la utilización
de las nuevas tecnologías de secuenciación, conlleva necesariamente al reto de diseñar procesos
que permitan almacenar, actualizar y poner a disposición de otros investigadores, estos datos de
manera permanente y confiable. (Cañedo Andalia & Arencibia Jorge, 2004).
Los grupos de investigación dedicados a la bioinformática tendrán que desarrollar formas
distribuidas de almacenamiento para sus bases de datos, a fin de hacer más fácil su
almacenamiento local, pues aunque los costos de almacenamiento siguen disminuyendo, la
disponibilidad de almacenamiento que se requiere en un futuro implicará costos elevados, y por
ello se hará necesario una mayor optimización de este recurso. Así mismo, se prevé que se
tendrán que implementar, a través de internet, estrategias de comunicación con distribuidores de
datos cada vez más eficientes y veloces, para permitir la actualización, sincronización y consulta
permanente de las bases de datos, y que funcionen adecuadamente dentro de las limitaciones de
la Internet, y el enorme volumen de datos que implican las principales bases de datos biológicos
(Cañedo Andalia & Arencibia Jorge, 2004).
Igualmente, la tendencia de esta disciplina apunta hacia la integración del conocimiento
biológico a varios niveles, desde el genoma, el transcriptoma y el proteoma, hasta las formas de
organización más complejas de los elementos de la vida, como el metaboloma y el interactima,
de tal forma que será posible el estudio de la biología basado más en principios. Al final, la
bioinformática permitirá una representación virutal de un organismo, lo cual será de utilidad
invaluable, ya que serán posibles simulaciones ante perturbaciones virtuales que en forma
experimental son imposibles (Martínez Barnetchet, 2007).
En cuanto al área de la salud y las enfermedades, su evolución responderá, entre otros
factores, a las necesidades de una medicina individualizada, a la carta o centrada en el paciente
y a un avance tecnológico sin precedentes (Cañedo Andalia & Arencibia Jorge, 2004). Incluso, ya
hay quien prevé que, dentro de pocos años, una persona podrá pedir su perfil genético en un
laboratorio, obtenerlo en un CD-ROM y contrastarlo vía web con librerías genéticas que podrán
informarle acerca de su predisposición a padecer ciertas enfermedades o de los fármacos a los
que presente mejor tolerancia (Martín Sánchez, 2000).
La Bioinformática como Nueva Área de Trabajo en México
Oscar Iván Saucedo Romero - Diciembre 2010 20 Instituto Tecnológico de Durango - Licenciatura en Informática
La computación móvil y la comunicación inalámbrica, la integración de la telefonía e
Internet, la aparición de nuevas interfaces con voz en lenguaje natural, el establecimiento de una
nueva generación de Internet con una alta calidad de servicio, la generalización de aplicaciones
multimedia interactivas sobre redes de banda ancha, o el diagnóstico por imagen avanzado, la
realización de intervenciones asistidas mediante neuronavegación, la simulación de cirugía y
radiación asistida por imágenes, el progreso de la robótica en la cirugía, así como el crecimiento
de los sistemas diagnósticos basados en nanotecnología, la ingeniería microelectrónica, la
creación de tarjetas personales inteligentes, dispensadores automáticos de medicamentos y de
nuevos sensores y biochips para obtener información bioquímica o genética de forma rápida y
costoefectiva, entre otros muchos avances, propondrán un panorama realmente revolucionario en
el entorno clínico del futuro (Cañedo Andalia & Arencibia Jorge, 2004).
En la medida que se engrana la información sobre los genes con la información sobre las
enfermedades, se asiste a una convergencia de la informática clínica con la bioinformática, que
se reflejará, en el futuro cercano, en la introducción de datos genéticos en la historia clínica de los
pacientes o en nuevos sistemas de apoyo a la toma de decisiones para el diagnóstico y la
terapia, entre otras áreas (Cañedo Andalia & Arencibia Jorge, 2004).
La informática deberá responder a la necesidad de gestionar distintos niveles de
información sobre salud: repositorios de información molecular sobre causas genéticas de las
enfermedades, registros sobre las características y diferencias genéticas entre los pacientes,
datos personales de salud y la historia clínica virtual, fuentes de información médica de interés,
así como bases de datos sobre enfermedades con información para la práctica, ensayos clínicos y
bases de conocimiento sanitario globales desagregables por niveles -regional, nacional o
internacional- con información poblacional, epidemiológica y relacionada con factores
medioambientales, indicadores de salud, etcétera (Cañedo Andalia & Arencibia Jorge, 2004).
Estos niveles de información sanitaria encontrarán su nexo de unión en el registro personal
de salud. Todos los ciudadanos dispondrán de su registro de salud multimedia con información
clínica, genética y sobre su estilo de vida. El registro individual de salud se encontrará distribuido,
el lugar físico de almacenamiento de sus datos de salud será transparente para el paciente. Su
historia clínica se enriquecerá constantemente con los nuevos resultados procedentes de las
La Bioinformática como Nueva Área de Trabajo en México
Oscar Iván Saucedo Romero - Diciembre 2010 21 Instituto Tecnológico de Durango - Licenciatura en Informática
investigaciones realizadas en los marcos de la medicina basada en la evidencia (Cañedo Andalia
& Arencibia Jorge, 2004).
En el futuro, se asistirá a una revolución basada en las tecnologías que posibilitará la
medicina a la carta o individualizada, en la que el paciente participe en la toma de decisiones y
tenga acceso a un tratamiento de alta calidad, adaptado a sus características individuales,
peculiaridades de su desarrollo y condiciones del entorno (Cañedo Andalia & Arencibia Jorge,
2004).
El costo y la complejidad de biotecnologías emergentes, demandan una revisión
significativa de los currículos y la reorganización de los departamentos académicos, relacionados
con ciencias de la vida y con las biotecnologías. Tanto en las universidades como en la industria,
se requiere urgentemente una cooperación interdisciplinaria activa para la investigación y el
desarrollo; esta cooperación debe involucrar bioquímicos, bioingenieros, matemáticos, científicos
computacionales, informáticos, analistas de sistemas y especialistas en bioinformática (Hulse,
2006).
2.6. La Bioinformática en México
Esta disciplina se está desarrollando en nuestro país de manera discreta, pero se está
trabajando. Algunas de las instituciones que están desarrollando trabajos en esta área son
(Hernández Valdelamar, 2002):
Centro de Investigación sobre la Fijación del Nitrógeno, con su programa de investigación
en genómica computacional (http://www.cifn.unam.mx/) y en colaboración con Red
Europea de Biología Molecular desarrollan el Nodo Nacional de Bioinformática EMBnet
México (http://embnet.cifn.unam.mx/).
Instituto de Biotecnología y el Instituto de Química de la UNAM
(http://www.ibt.unam.mx/).
Departamento de Biotecnología, UAM-Iztapalapa
(http://www.iztapalapa.uam.mx/iztapala.www/division.cbs/biotecnolo/).
La Bioinformática como Nueva Área de Trabajo en México
Oscar Iván Saucedo Romero - Diciembre 2010 22 Instituto Tecnológico de Durango - Licenciatura en Informática
Unidad Profesional Interdisciplinaria de Biotecnología (http://www.upibi.ipn.mx/).
ITESM, con su programa de Verano de Investigación
(http://w3.mor.itesm.mx/~esucar/veraniegos.html).
UAEM, con su especialidad en biología molecular (http://www.fc.uaem.mx).
En septiembre de 2001 se creó el Nodo Nacional de Bioinformática EMBnet (European
Molecular Biology Network), cuyo principal objetivo era atender las necesidades del Proyecto
genómico titulado: “Desarrollo de la Ciencia Genómica en México: el genoma de Rhizobium
etli como sistema modelo”, impulsado por el Dr. Juan Ramón de la Fuente. Este proyecto, con sede
en el Centro de Ciencias Genómicas (CCG) y el Instituto de Biotecnología (IBt), ambos de la
Universidad Nacional Autónoma de México (UNAM), promovió y ofreció apoyo, tanto educativo
como tecnológico, a la comunidad científica de nuestro país, razón por la que se obtuvo la
membresía a una de las redes de bioinformática de mayor importancia a nivel internacional
(EMBnet). Asimismo, derivado de este proyecto se creó la Licenciatura en Ciencias Genómicas
(LCG) de la UNAM y la Sociedad Mexicana de Ciencias Genómicas (SMCG) (Acerca del Nodo
Nacional de Bioinformática, 2010).
Para el 2007, la Dirección General de Servicios de Cómputo Académico (DGSCA) de la
UNAM promovió ampliar su gama de servicios y de esta forma ofrecer aquellos relacionados con
la Bioinformática, para lo cual solicitó apoyo al CCG y al IBt. Con esta iniciativa se propuso la
creación del Nodo Nacional de Bioinformática de la Universidad Nacional Autónoma de México
(NNB-UNAM), cuyo objetivo principal es, a través de un sitio web, ofrecer información,
herramientas, bases de datos y foros de discusión, donde la comunidad científica y académica
pudiera intercambiar opiniones y apoyo en áreas relacionadas con la bioinformática y las
ciencias genómicas en general (Acerca del Nodo Nacional de Bioinformática, 2010).
A inicios de 2008 se hizo un análisis y revisión del trabajo realizado y se decidió
optimizar y formalizar estos esfuerzos por medio de la creación de un consorcio al cual se puedan
integrar más instituciones, públicas o privadas, que tengan intereses y objetivos afines a los de
este proyecto (Acerca del Nodo Nacional de Bioinformática, 2010),
La Bioinformática como Nueva Área de Trabajo en México
Oscar Iván Saucedo Romero - Diciembre 2010 23 Instituto Tecnológico de Durango - Licenciatura en Informática
Capitulo 3. Principales Áreas de Investigación y Desarrollo
De acuerdo a los resultados de un análisis bibliométrico hecho a la base de datos
Medline, la principales aplicaciones de la bioinformática fueron: la gestión de datos en los
laboratorios, la automatización de experimentos, el ensamblaje de secuencias contiguas, la
predicción de dominios funcionales en secuencias génicas, la alineación de secuencias, las
búsquedas en bases de datos de estructuras, la determinación y predicción de la estructura de las
macromoléculas, la evolución molecular y los árboles filogenéticos (Perezleo Solórzano, Arencibia
Jorge, Conill González, Achón Veloz, & Araújo Ruiz, 2003).
Según este estudio, la Genética Médica constituye la especialidad que ha recibido mayor
influencia de la Bioinformática desde su aparición en 1990 (42,5 %), seguida por la Bioquímica
Clínica (19,5 %), así como por las Ciencias Farmacéuticas (5,8 %), la Filogenética (4,2 %), las
Neurociencias (3,8 %), la Inmunología (3,2 %), la Estadística Médica (2,5 %), la Fisiología (2,5 %)
y la Oncología (2,3 %) (Perezleo Solórzano, Arencibia Jorge, Conill González, Achón Veloz, &
Araújo Ruiz, 2003).
3.1. Medicina Molecular, Genómica e Individual.
Para la medicina, la obtención del genoma humano, se reveló como una fuente de
conocimiento muy valiosa sobre las relaciones entre la estructura de los genes humanos y los
procesos fisiopatológicos. La consecución de la secuencia completa del genoma de nuestra
especie posibilitó, por un lado, conocer las causas moleculares de las enfermedades y por otro,
descubrir cómo las diferencias genéticas entre las personas causan o contribuyen al desarrollo de
enfermedades (Cañedo Andalia & Arencibia Jorge, 2004).
La convergencia entre la medicina y la genómica está dando lugar a la llamada medicina
molecular. Ella trata de explicar la vida y la enfermedad en el ser humano a partir de la
La Bioinformática como Nueva Área de Trabajo en México
Oscar Iván Saucedo Romero - Diciembre 2010 24 Instituto Tecnológico de Durango - Licenciatura en Informática
presencia y la regulación de las funciones biológicas que realizan de las diferentes entidades
moleculares en los organismos vivos. (Sánches F. y García V, citado en Cañedo Andalia &
Arencibia Jorge, 2004).
La medicina genómica, que se define como el uso rutinario de análisis genotípicos para
mejorar los cuidados de salud del individuo, tiene sus pilares en la capacidad de conocer los
polimorfismos de los nucleótidos de cada individuo y de modificar el medio ambiente en que se
desarrolla. El amplio espectro de la medicina genómica incluye un gran número de enfermedades,
atendidas por diversas disciplinas clínicas. El estudio de la función de los genes y sus
polimorfismos, asociados a enfermedades comunes, permitirán conocer mejor los mecanismos
moleculares que originan estas enfermedades, así como abrir nuevas oportunidades para su
prevención y tratamiento. (Doegemines.org, citado en Cañedo Andalia & Arencibia Jorge, 2004).
La medicina Individual, por su parte, consiste en la aplicación de la genómica para
identificar la predisposición individual de los seres humanos para desarrollar una enfermedad y
para diseñar terapias adaptadas a los perfiles genéticos de los pacientes y que, por tanto,
podrían prescribirse con garantías de seguridad y eficiencia (Cañedo Andalia & Arencibia Jorge,
2004).
3.2. Análisis de Mutaciones en el Cáncer
En el cáncer, los genomas de las células afectadas son reordenados en complejas y/o aún
impredecibles maneras. Se realizan esfuerzos masivos de secuenciación para identificar
sustituciones individuales de bases (o puntos de mutación de nucleótidos) todavía desconocidos en
una variedad de genes en el cáncer. Los bioinformáticos continúan produciendo sistemas
automatizados para gestionar el importante volumen de datos de secuencias obtenido, y crean
nuevos algoritmos y software para comparar los resultados de secuenciación con la creciente
colección de secuencias del genoma humano y de los polimorfismos de la línea germinal. Se están
utilizando nuevas tecnologías de detección física, como los microarrays de oligonucleótidos para
identificar pérdidas y ganancias cromosómicas (técnica denominada hibridación genómica
comparativa), y los arrays de polimorfismos de nucleótido simple para detectar puntos de
La Bioinformática como Nueva Área de Trabajo en México
Oscar Iván Saucedo Romero - Diciembre 2010 25 Instituto Tecnológico de Durango - Licenciatura en Informática
mutación conocidos. Estos métodos de detección miden simultáneamente bastantes cientos de miles
de posiciones a lo largo del genoma, y cuando se usan con una alta productividad para analizar
miles de muestras, generan terabytes de datos por experimento. De esta forma las masivas
cantidades y nuevos tipos de datos proporcionan nuevas oportunidades para los bioinformáticos.
A menudo se encuentra en los datos una considerable variabilidad, o ruido, por lo que métodos
como el de los modelos ocultos de Márkov y el análisis de puntos de cambio están siendo
desarrollados para inferir cambios reales en el número de copias de los genes (número de copias
de un gen particular en el genotipo de un individuo, cuya magnitud puede ser elevada en células
cancerígenas) (Bioinformática - Wikipedia, 2010).
3.3. Epidemiología
La epidemiología comprende el estudio de distribución de las enfermedades -según
persona, tiempo y lugar- y las determinantes de los eventos y estados de salud en poblaciones
específicas -grupos de personas con características identificables- y su uso en el control de los
problemas de salud. Los determinantes comprenden a aquellos factores -físicos, biológicos,
sociales, culturales y del comportamiento y pudieran añadirse, educacionales e informacionales-
que influyen en la aparición de las conductas, los estilos de vida, las enfermedades, la muerte,
etcétera. (Riiser J. y Risser W., citado en Cañedo Andalia & Arencibia Jorge, 2004).
La Epidemiología es la parte de la medicina que se dedica al estudio de la distribución,
frecuencia, determinantes, relación, predicción y control de los factores relacionados con la salud
y la enfermedad en poblaciones humanas específicas (Cañedo Andalia & Arencibia Jorge, 2004).
3.4. Biología Evolutiva Computacional
La Biología evolutiva es el estudio del origen ancestral de las especies, así como de su
cambio a través del tiempo. La informática ha apoyado a los biólogos evolutivos en diferentes
campos clave. Ha permitido a los investigadores (Bioinformática - Wikipedia, 2010):
La Bioinformática como Nueva Área de Trabajo en México
Oscar Iván Saucedo Romero - Diciembre 2010 26 Instituto Tecnológico de Durango - Licenciatura en Informática
Seguir la evolución de un alto número de organismos midiendo cambios en su ADN, en
lugar de hacerlo exclusivamente mediante su taxonomía física u observaciones fisiológicas.
Más recientemente, comparar genomas completos, lo que permite el estudio de eventos
evolutivos más complejos, tales como la duplicación de genes, la transferencia horizontal
de genes, o la predicción de factores significativos en la especiación bacteriana.
Construir modelos computacionales complejos de poblaciones para predecir el resultado
del sistema a través del tiempo.
Seguir y compartir información sobre un amplio y creciente número de especies y
organismos.
Los esfuerzos futuros se centrarán en reconstruir el cada vez más complejo árbol
filogenético de la vida (Bioinformática - Wikipedia, 2010)
3.5. La Minería de Datos
En los últimos años, la Minería de Datos (Data Mining) ha experimentado un auge como
soporte para las filosofías de la gestión de la información y el conocimiento, así como para el
descubrimiento del significado que poseen los datos almacenados en grandes bancos. Ésta
permite explorar y analizar las bases de datos disponibles para ayudar a la toma de decisiones;
además de facilitar la extracción de la información existente en los textos (Minería de Textos -
Text Mining-), así como crear sistemas inteligentes capaces de entenderlos (Febles Rodríguez &
González Pérez, 2002).
La minería de datos (Data Mining) es el proceso automatizado de descubrir información
desconocida u oculta, y de presentarla en una forma que se pueda comprender, a partir de
grandes volúmenes de datos, útil para toma de decisiones críticas. Así, los puntos críticos que
definen un sistema de minería de datos son (Joyanes Aguilar, cidato en Cañedo Andalia &
Arencibia Jorge, 2004):
Ser capaz de descubrir información oculta.
La información debe ser de gran utilidad para tomar decisiones importantes
La información se obtiene de grandes volúmenes de datos, donde existe mucha
información.
La Bioinformática como Nueva Área de Trabajo en México
Oscar Iván Saucedo Romero - Diciembre 2010 27 Instituto Tecnológico de Durango - Licenciatura en Informática
Ese conocimiento debe presentarse de una forma que se pueda entender sin un esfuerzo
excesivo.
La minería de datos, al contrario del análisis de datos estadístico tradicional, trabaja
sobre la totalidad de los datos y no con una muestra por lo que los resultados tienen una
fiabilidad muy superior, por lo que permite tomar decisiones con mucho menos riesgo de cometer
errores. (Cañedo Andalia & Arencibia Jorge, 2004)
Una vez construido el almacén de datos (Data Warehouse) se trata de descubrir el
conocimiento oculto en los datos y el aporte de información muy valiosa sobre las enfermedades
y su tratamiento. Es muy importante señalar que estos sistemas no utilizan la información reseñada
en la documentación científica, sino que aprenden de los datos que registra la comunidad
hospitalaria en su almacén de datos. De esta forma, no se está sujeto a estudios estadísticos
incompletos o realizados sobre poblaciones muy diferentes a las existentes en el entorno propio.
Así, los resultados obtenidos se pueden aplicar con una fiabilidad absoluta (Cañedo Andalia &
Arencibia Jorge, 2004).
Las componentes básicas de los métodos de la minería de datos son (Febles Rodríguez &
González Pérez, 2002):
Lenguaje de Representación del Modelo: comprende las suposiciones y restricciones
utilizadas en la representación empleada.
Evaluación del Modelo: incluye el uso de técnicas de validación cruzada para la
predictividad y aplicación de principios como el de máxima verosimilitud o el de
descripción mínima para evaluar la calidad descriptiva del modelo.
Método de Búsqueda: puede dividirse en búsqueda de parámetros y del modelo,
determinan los criterios que se siguen para encontrar los modelos.
Algunas de las técnicas más comunes usadas en la minería de datos son (Febles Rodríguez
& González Pérez, 2002):
Árboles de decisión y reglas de clasificación.
La Bioinformática como Nueva Área de Trabajo en México
Oscar Iván Saucedo Romero - Diciembre 2010 28 Instituto Tecnológico de Durango - Licenciatura en Informática
Métodos de clasificación y regresiones no-lineales.
Métodos basados en ejemplos prototípicos.
Modelos gráficos de dependencias probabilísticas.
Modelos relacionales.
Algunas aplicaciones de las soluciones que la Minería de Datos puede proporcionar a la
bioinformática son (Cañedo Andalia & Arencibia Jorge, 2004):
Descubrir distintos comportamientos de una misma patología.
Realizar pronósticos ajustados a cada paciente.
Predecir las patologías que pueden aparecer como complicación de una enfermedad
determinada.
Encontrar la predisposición a padecer determinadas enfermedades.
Descubrir asociaciones entre patologías.
Determinar el mejor tratamiento individual para cada paciente.
Sistema de apoyo al diagnóstico.
Descubrir nuevas características de una patología.
Comparación entre parámetros clínicos.
Así, por ejemplo, en el caso de descubrir comportamientos de una misma patología, los
sistemas de Minería de Datos pueden encontrar subgrupos, dentro de una determinada
patología, que tienen características comunes dentro del mismo subgrupo y diferentes entre los
diversos subgrupos. Estas clasificaciones puede encontrarlas el sistema de manera automática, es
decir, a partir de las relaciones que el sistema encuentra por sí mismo y que no tienen por qué
atenerse a las clasificaciones clásicas realizadas con interés académico, clínico o fisiopatológico
(Cañedo Andalia & Arencibia Jorge, 2004).
La Bioinformática como Nueva Área de Trabajo en México
Oscar Iván Saucedo Romero - Diciembre 2010 29 Instituto Tecnológico de Durango - Licenciatura en Informática
3.6. Modelado de Sistemas Biológicos
La biología de sistemas implica el uso de simulaciones por ordenador de subsistemas
celulares (tales como redes de metabolitos y enzimas que comprenden el metabolismo, caminos de
transducción de señales, y redes de regulación genética), tanto para analizar como para
visualizar las complejas conexiones de estos procesos celulares. La vida artificial o la evolución
virtual tratan de entender los procesos evolutivos por medio de la simulación por ordenador de
sencillas formas de vida artificial (Bioinformática - Wikipedia, 2010).
3.7. e-Salud
La capacidad de compartir información, productos y servicios a través de las nuevas redes
y vías de comunicación afecta cada vez a más actividades y áreas del conocimiento. El comercio
electrónico se define como la utilización de las tecnologías de la información para integrar todos
los aspectos de las actividades, procesos y comunicaciones entre empresas y consumidores. El
área de la salud no es ajena a esta corriente. Se habla de
e-Salud para referirse a la aplicación de los principios del comercio electrónico en la prestación
de servicios e información sobre salud. El fin último de estas aproximaciones radica en la
necesidad de ofrecer una respuesta, desde las organizaciones sanitarias, a las crecientes
exigencias de un nuevo tipo de consumidor que demanda una asistencia sanitaria más
personalizada, de mayor calidad y en la que el paciente forme parte del proceso de toma de
decisiones (Martín Sánchez, 2000).
3.8 Medición de la Biodiversidad
La biodiversidad de un ecosistema puede definirse como el conjunto genómico
completo de todas las especies presentes en un medio ambiente particular, sea este una
biopelícula en una mina abandonada, una gota de agua de mar, un puñado de tierra, o la
biosfera completa del planeta Tierra. Se utilizan bases de datos para recoger los nombres de las
La Bioinformática como Nueva Área de Trabajo en México
Oscar Iván Saucedo Romero - Diciembre 2010 30 Instituto Tecnológico de Durango - Licenciatura en Informática
especies, así como de sus descripciones, distribuciones, información genética, estado y tamaños de
las poblaciones, necesidades de su hábitat, y cómo cada organismo interactúa con otras especies.
Se usa software especializado para encontrar, visualizar y analizar la información; y, lo que es
más importante, para compartirla con otros interesados. La simulación computacional puede
modelar cosas tales como dinámica poblacional, o calcular la mejora del acervo genético de una
variedad (en agricultura), o la población amenazada (en biología de la conservación). Un
potencial muy excitante en este campo es la posibilidad de preservar las secuencias completas
del ADN, o genomas, de especies amenazadas de extinción, permitiendo registrar los resultados
de la experimentación genética de la Naturaleza in silico para su posible reutilización futura, aún
si tales especies fueran finalmente perdidas (Bioinformática - Wikipedia, 2010).
La Bioinformática como Nueva Área de Trabajo en México
Oscar Iván Saucedo Romero - Diciembre 2010 31 Instituto Tecnológico de Durango - Licenciatura en Informática
Capitulo 4. Resultados
La biología, una ciencia tradicionalmente de la observación y la descripción, se está
convirtiendo en una ciencia caracterizada por la generación de grandes cantidades de
información. La invención y el desarrollo de nuevas tecnologías son los responsables (Guigó Serra,
2000).
La Bioinformática es la aplicación de las tecnologías de la información y comunicación a la
gestión y análisis de datos biológicos. Esta disciplina nace en la década de los 50 del siglo
pasado, y desde aquel tiempo y hasta la actualidad ha avanzado notablemente, siendo hoy en
día una herramienta vital para la Biología y todas sus sub áreas.
En México, apenas se está empezando la exploración de este nuevo campo, por lo que no
se cuenta con mucha información al respecto. Afortunadamente son muchas las disciplinas en las
que se puede incorporar los investigadores y trabajadores relacionados con las áreas de las
tecnologías y la computación.
Conclusiones
Sin duda, la Bioinformática es un área que podría dar grandes oportunidad de desarrollo
a nuestro país, debido a la gran ayuda que proporciona la ciencia de la Biología y a todas las
disciplinas que se derivan de ellas.
Apenas se está empezando, y de forma discreta, este gran camino, pero si se le invierte el
suficiente apoyo económico y el esfuerzo de los investigadores, México podría ser un fuerte
desarrollador de herramientas y técnicas para el análisis de datos biológicos.
La Bioinformática como Nueva Área de Trabajo en México
Oscar Iván Saucedo Romero - Diciembre 2010 32 Instituto Tecnológico de Durango - Licenciatura en Informática
Referencias Bibliográficas
Acerca del Nodo Nacional de Bioinformática, 1.0. (2010). Recuperado el 8 de Diciembre
de 2010, de http://www.nnb.unam.mx/acercade
Barreto Hernández, E. (2008). Bioinformática: una oportunidad y un desafío. Revista
Colombiana Biotecnología , 10 (1), 132-138.
Bioinformática - Wikipedia. (2 de Diciembre de 2010). Recuperado el 10 de Diciembre de
2010, de http://es.wikipedia.org/wiki/Bioinform%C3%A1tica
Cañedo Andalia, R., & Arencibia Jorge, R. (2004). Bioinformática: en busca de los secretos
moleculares de la vida. Acimed .
Coltell i Simon, Ò. (2004). Integración de la Bioinformática en la Investigación Genómica
Cardiovascular: Aplicacionoes en el Framingham Hearth Studio. Tesis Doctoral, Universitat
Jaume I, Lenguajes y Sistemas Informáticos, Castellón.
Febles Rodríguez, J. P., & González Pérez, A. (2002). Aplicación de la Minería de Datos
en la Bioinformática. Acimed , 10 (2).
Guigó Serra, R. (2000). Bioinformática ¿una ciencia sin científicos? (J. Camí, Ed.) Quark
(18).
Hernández Valdelamar, E. J. (2002). Bioinformática: una nueva área de oportunidad.
Hulse, J. H. (2006). Biotecnologías: historia pasada, situación presente y perspectivas
futuras. Revista Colombiana de Ciencias Pecuarias , 19 (3), 317-340.
La Bioinformática como Nueva Área de Trabajo en México
Oscar Iván Saucedo Romero - Diciembre 2010 33 Instituto Tecnológico de Durango - Licenciatura en Informática
Martín Sánchez, F. (2000). Genoma, bioinformática y comercio electrónico (e-genética):
Impactos en salud. (J. Camí, Ed.) Quark (18).
Martínez Barnetchet, J. (2007). La Bioinformática como Herramienta para la Investigación
en Salud Humana. Salud Pública de México , 49 (Edición Especial), 64-66.
Perezleo Solórzano, L., Arencibia Jorge, R., Conill González, C., Achón Veloz, G., & Araújo
Ruiz, J. (2003). Impacto de la Bioinformática en las ciencias biomédicas. Acimed , 11 (4).