Arbol de desición Siestema Experto

7
UTILIZACIÓN DE SISTEMAS EXPERTOS PARA LA OPTIMIZACIÓN DE LA TOMA DE DESICIONES MULTICRITERIO JAIME ANDRÉS LARA BORRERO * Pontificia Universidad Javeriana Profesor Asistente y miembro de los grupos de investigación “Hidrociencias” e “Informática y Métodos Matemáticos Aplicados”, Pontificia Universidad Javeriana. Ingeniero Civil, Pontificia Universidad Javeriana (1996). Master en Ingeniería y Gestión Ambiental, Universidad Politécnica de Cataluña, España (1998). Doctor en Territorio y Medio Ambiente, Universidad Politécnica de Madrid (2003) JUAN CAMILO QUIJANO NIETO Pontificia Universidad Javeriana DANIEL RIVEROS Pontificia Universidad Javeriana ANDRÉS TORRES ABELLO Pontificia Universidad Javeriana MARIA CAMILA FORERO LUNAL Pontificia Universidad Javeriana Dirección postal del autor principal (*):Cra7 40-62 Ed. José Gabriel Maldonado S.J., Facultad de Ingeniería, Bogotá, Colombia. Telefono:(57)1 3208320 ext 5260 FAX:(57)1 3208320 ext 5255 e-mail: [email protected] RESUMEN En Colombia como en la mayoría de países de América, la selección de tecnologías de potabilización de aguas es un problema de gestión importante para las comunidades, sobretodo para las más pequeñas cuyos recursos en la mayoría de los casos son limitados y el recurso humano encargado de esta labor no siempre el más capacitado. Esta situación ha llevado en muchas ocasiones a la elección de tecnologías inadecuadas y en general al despilfarro de recursos, que como dije antes no abundan. En respuesta a esta situación, el Gobierno Colombiano a partir del año 2000, hizo obligatorio el uso de una herramienta de apoyo a la toma de decisiones llamada SELTEC. Mediante simulación de montecarlo se generó una tabla de 2000 patrones utilizando el Seltec para obtener las respectivas funciones objetivo, estos 2000 registros tienen 38 atributos, un número de etiquetas variable dependiendo del atributo entre 2 y 7 y un conjunto de 28 variables objetivo diferentes. Se empleo el software ARBÓN 1.0, desarrollado por los investigadores para árboles de decisión, el cual arrojo como resultado que el árbol hace uso de 26 de las 38 variables que emplea el Seltec, teniendo su rama más larga 8 nodos mientras que la más corta cuenta solo con 3. Es evidente el potencial de esta metodología, dado que la reducción de variables redunda directamente en la facilidad de utilización del modelo y a la larga en un ahorro de recursos en el proceso de selección de tecnologías de potabilización, así como en la confiabilidad de los resultados obtenidos. PALABRAS CLAVE: Sistemas Inteligentes, Tratamiento agua potable, Planificación ambiental. INTRODUCCIÓN Tanto en el ámbito Colombiano como en el latinoamericano encontramos muchos ejemplos de inversiones en infraestructura municipal que han sido equivocadas por falta de herramientas de apoyo a la toma de decisiones a la hora de escoger la tecnología más adecuada a implementar en un determinado lugar, lo que es especialmente grave si tenemos en cuanta que en muchas de estas ocasiones los recursos son limitados y muchas veces esta situación no permite corregir dichos errores. En el año 2000 entro en vigor en el territorio Colombiano la resolución No 1096 del hoy extinto Ministerio de Desarrollo económico, por la cual se adoptaba el Reglamento Técnico para el sector de

description

Sistema experto para la toma de desiciones

Transcript of Arbol de desición Siestema Experto

  • UTILIZACIN DE SISTEMAS EXPERTOS PARA LA OPTIMIZACIN DE LA TOMA DE DESICIONES MULTICRITERIO

    JAIME ANDRS LARA BORRERO * Pontificia Universidad Javeriana Profesor Asistente y miembro de los grupos de investigacin Hidrociencias e Informtica y Mtodos Matemticos Aplicados, Pontificia Universidad Javeriana. Ingeniero Civil, Pontificia Universidad Javeriana (1996). Master en Ingeniera y Gestin Ambiental, Universidad Politcnica de Catalua, Espaa (1998). Doctor en Territorio y Medio Ambiente, Universidad Politcnica de Madrid (2003) JUAN CAMILO QUIJANO NIETO Pontificia Universidad Javeriana DANIEL RIVEROS Pontificia Universidad Javeriana ANDRS TORRES ABELLO Pontificia Universidad Javeriana MARIA CAMILA FORERO LUNAL Pontificia Universidad Javeriana Direccin postal del autor principal (*):Cra7 40-62 Ed. Jos Gabriel Maldonado S.J., Facultad de Ingeniera, Bogot, Colombia. Telefono:(57)1 3208320 ext 5260 FAX:(57)1 3208320 ext 5255 e-mail: [email protected] RESUMEN En Colombia como en la mayora de pases de Amrica, la seleccin de tecnologas de potabilizacin de aguas es un problema de gestin importante para las comunidades, sobretodo para las ms pequeas cuyos recursos en la mayora de los casos son limitados y el recurso humano encargado de esta labor no siempre el ms capacitado. Esta situacin ha llevado en muchas ocasiones a la eleccin de tecnologas inadecuadas y en general al despilfarro de recursos, que como dije antes no abundan. En respuesta a esta situacin, el Gobierno Colombiano a partir del ao 2000, hizo obligatorio el uso de una herramienta de apoyo a la toma de decisiones llamada SELTEC. Mediante simulacin de montecarlo se gener una tabla de 2000 patrones utilizando el Seltec para obtener las respectivas funciones objetivo, estos 2000 registros tienen 38 atributos, un nmero de etiquetas variable dependiendo del atributo entre 2 y 7 y un conjunto de 28 variables objetivo diferentes. Se empleo el software ARBN 1.0, desarrollado por los investigadores para rboles de decisin, el cual arrojo como resultado que el rbol hace uso de 26 de las 38 variables que emplea el Seltec, teniendo su rama ms larga 8 nodos mientras que la ms corta cuenta solo con 3. Es evidente el potencial de esta metodologa, dado que la reduccin de variables redunda directamente en la facilidad de utilizacin del modelo y a la larga en un ahorro de recursos en el proceso de seleccin de tecnologas de potabilizacin, as como en la confiabilidad de los resultados obtenidos. PALABRAS CLAVE: Sistemas Inteligentes, Tratamiento agua potable, Planificacin ambiental. INTRODUCCIN Tanto en el mbito Colombiano como en el latinoamericano encontramos muchos ejemplos de inversiones en infraestructura municipal que han sido equivocadas por falta de herramientas de apoyo a la toma de decisiones a la hora de escoger la tecnologa ms adecuada a implementar en un determinado lugar, lo que es especialmente grave si tenemos en cuanta que en muchas de estas ocasiones los recursos son limitados y muchas veces esta situacin no permite corregir dichos errores. En el ao 2000 entro en vigor en el territorio Colombiano la resolucin No 1096 del hoy extinto Ministerio de Desarrollo econmico, por la cual se adoptaba el Reglamento Tcnico para el sector de

  • Agua Potable y Saneamiento Bsico RAS 2000. Dicho reglamento en su artculo 103, referente a los requisitos mnimos para el desarrollo de sistemas nuevos de potabilizacin reza Para la seleccin de las alternativas de tratamiento para sistemas de potabilizacin de poblaciones menores de 30.000 hab, debe usarse el Programa de Seleccin de Tecnologa y Anlisis de Costos en Sistemas de Potabilizacin (Seltec). El Modelo SELTEC, surge como solucin a la problemtica de planeacin ambiental relacionada con la seleccin de tecnologas de potabilizacin. Sin embargo en estudios realizados en municipios de la sabana de Bogot (Cadavid, et al,2002) se ha encontrado que si bien el modelo soluciona el problema de seleccin de las posibles alternativas, su implementacin no resulta ser los suficientemente eficiente y parsimoniosa para abordar la problemtica expuesta debido en ocasiones a la falta de alguna de la informacin que requiere el modelo o en otras a la calidad de dicha informacin, lo que aporta una gran incertidumbre sobre los resultados obtenidos. En este orden de ideas, los autores de la presente investigacin optaron por emplear herramientas de los denominados Sistemas Inteligentes (especificadamente rboles de decisin) con el fin de estudiar su viabilidad como herramienta de optimizacin del modelo SELTEC, de manera que se pueda contar con informacin sobre el peso de algunas variables en la decisin final y a la larga determinar si es posible eliminar algunas de ellas, en busca de un modelo parsimonioso y de ms fcil aplicacin para los gestores municipales. Para tal efecto, despus de algunas aclaraciones sobre el modelo conceptual original, el concepto de sistemas expertos, de entropa y de los rboles de decisin, se presenta la metodologa usada para la obtencin y organizacin de los patrones de entrada necesarios para el entrenamiento de rbol, se discuten los resultados parciales obtenidos y las ventajas de disponer de un sistema inteligente en este tipo de estudios. MARCO CONCEPTUAL Seltec La estructura general del modelo conceptual de seleccin de tecnologa se presenta en forma de Niveles (Figura 1). Un Nivel de seleccin opera como un filtro donde se descartan las tecnologas que no cumplen con las condiciones de sostenibilidad de acuerdo a los valores asignados a las variables (datos de entrada) para una aplicacin especfica.

    Alternativas Tecnolgicas

    Tecnologas institucionalizadas

    Jerarquizacin de soluciones sostenibles

    INSTITUCIONA- LIZACIN DE LA TECNOLOGIA.

    NIVEL SOCIO- CULTURAL DE LA LOCALIDAD.

    DISPONIBILIDAD DE RECURSOS Y MATERIALES.

    RIESGO SANITARIO Y EFICIENCIA DE LAS TECNOLOGIAS.

    ANALISIS DE COSTOS.

    CAPACIDAD Y DISPONIBILIDAD DE PAGO.

    Niveles 0 y 1 Nivel 2 Nivel 3 Nivel 4 Nivel 5 Nivel 6

    Figura 1. Esquema General del Modelo Conceptual para la Seleccin de Tecnologa. La estructura del modelo conceptual involucra unos datos de entrada para cada uno de los niveles con lo que se realizan selecciones parciales de tecnologas no sostenibles y sostenibles, estas ultimas a su ves son un dato de entrada al siguiente nivel, hasta obtener la seleccin final. Los niveles

  • cinco y seis ayudan en el anlisis de costos para poder levar a cabo la opcin escogida en los niveles previos. En la siguiente figura se puede ver una captura de pantalla del software para la aplicacin del modelo conceptual (Figura 2).

    Figura 2. Formulario de Tecnologas sostenibles - Seltec

    Sistemas Expertos No resulta fcil dar una definicin de sistema experto (SE), entre otras cosas, por el concepto de SE, ya que a medida que se va progresando, sus funciones se van ampliando y resulta un concepto cambiante (Castillo y Alvarez, 1989). Edward Feigenbaum, de la Universidad de Stanford, defini en el Congreso Mundial de Inteligencia Artificial (Davis y Buchanan, 1977) un SE como: un programa de computador inteligente que usa conocimiento y procedimientos de inferencia para resolver problemas que son los suficientemente difciles como para requerir la intervencin de un experto humano para su resolucin. Hoy con los avences conseguidos, resultara ms correcto definir un SE como: un sistema informtico que simula el proceso de aprendizaje, de memorizacin, de razonamiento, de comunicacin y de accin de un experto humano en una determinada rama de la ciencia, suministrando, de esta forma, un consultor que puede sustituirle con unas ciertas garantas de xito (Castillo y Alvarez, 1989). Ciertamente las anteriores definiciones contienen elementos claves fcilmente inidentificables en el problema que se estudia en este trabajo como es la seleccin de tecnologas. Por consiguiente, se desprenden otros valores agregados como por ejemplo: (i) mejorar la calidad del conocimiento de los expertos humanos; (ii) conseguir la supervivencia del conocimiento y que no muera con la muerte fsica del experto humano; (iii) multiplicar el nmero de expertos, y por tanto, hacer ms accesible el conocimiento existente; y (iv) disminuir el costo del conocimiento. De esta forma, lo que este trabajo pretende es sentar las bases de un SE para el diagnstico y evaluacin de puentes existentes. Entropa de Informacin El aprendizaje inductivo mencionado en la definicin del SE se implementa en este trabajo, mediante la concepcin de un rbol de decisin, el cual para su diseo parsimonioso requiere en la mayora de los casos de conocimiento de entropa de informacin. Aunque el concepto de entropa fue introducido por primera vez en 1865 por Rudolph J. Clausius, es solo en 1948 que nace formalmente la disciplina de la Teora de la Informacin, gracias a Claude Shannon. Las definiciones de entropa son varias dependiendo del la aproximacin fsica (medida del desorden) o matemtica de este concepto (grado de complejidad de la informacin, grado de pureza o impureza de la informacin). Aunque la teora de la informacin encontr inicialmente aplicacin en el diseo de sistemas de comunicacin, su uso, y por ende el empleo de la entropa como medida de informacin, se ha extendido a otras disciplinas, dentro de las cuales la Ingeniera Civil. En el marco de la Teora de la Informacin el logaritmo en base 2 del nmero de mensajes, todos equiprobables, nos da el nmero de bits necesarios para codificarlos. En el caso de que los mensajes no tengan la misma frecuencia, es decir diferentes probabilidades, se puede pensar de transmitir los ms frecuentes con un nmero inferior de bits y viceversa. En Teora de la Informacin esto se conoce como mxima compresin posible de la informacin, o compresin estadstica de la seal.

  • Arboles de Decisin Los rboles de decisin (Quinlan, 1986; Mitchell, 1997) son sistemas inteligentes basados en el conocimiento mediante reglas, que permiten clasificar una serie de ejemplos o salidas ordenando los atributos (variables) que contribuyen a la clasificacin en orden descendente en un rbol. El algoritmo utilizado en el presente trabajo es aplicable a variables discretas. Si las variables son continuas es necesario representarlas en intervalos discretos. Tenemos por lo tanto unas variables de entrada (atributos) que representan los nodos potenciales del rbol, los valores de las variables que representan las ramas, y las hojas que son las variables de decisin (Figura 3).

    ROOT NODE

    NODE NODE

    LEAF NODE

    LEAF NODE

    LEAF NODE

    LEAF NODE

    Variables Variables values

    Decision variables

    Figura 3. Topologa simplificada de un rbol de decisin (Fuente: Obregn et al., 2003)

    Una serie de patrones que incluya las variables de entrada y de decisin es necesaria para entrenar el rbol. En cada nodo se efecta un test estadstico gracias a la explotacin del concepto de Entropa y Ganancia de Informacin. Esta ltima se define la aptitud de un determinado atributo A para clasificar a solo los ejemplos, y matemticamente se expresa como (Mitchell, 1997)

    )()(),()(

    vAValuesv

    v CEntropyCC

    CEntropyACGain

    = ecuacin (1)

    donde Values(A) es la serie de todos los posibles valores para el atributo A, y Cv es la subserie de C para la cual el atributo A tiene valor v. Gain(C,A) es simplemente la informacin provista acerca de la variable de decisin, dado el valor de algn atributo A. Dicho de otra forma el valor de Gain(C,A) es el nmero de bits que uno se ahorra cuando codifica el valor de la variable de decisin de un miembro arbitrario de C, conociendo el valor del atributo A (Mitchell, 1997). Por lo tanto en cada nodo se selecciona el atributo que tiene ms ganancia de informacin. El procedimiento descrito es bsicamente el mismo seguido por el algoritmo ID3 (Quinlan, 1986) para entrenar rboles de decisin. METODOLOGA. Para el presente estudio se tomaron los niveles cero, uno, dos, tres y cuatro del Seltec, dado que se busca optimizacin de la seleccin de la tecnologa sin entrar en el anlisis de costos. En primer lugar se estudio el modelo conceptual, las variables de cada uno de los niveles y las posibles rutas que tomaba el software respondiendo a los diversos valores de entrada de ciertas variables. De esta forma se determin que el SELTEC tiene 3 puntos importantes dentro de los niveles estudiados, el primero en el Nivel 0, que corresponde al Tipo de Localidad que puede ser Zona Rural o Cabecera Municipal, dependiendo la opcin seleccionada se toman caminos distintos. El segundo punto de inters se presenta en el Nivel 1 cuando se pregunta la Poblacin Total que puede tomar valores por rangos entre 501 y 15.000 habitantes si se escogi previamente Zona Rural o un valor entre 501 y 30.000 habitantes si fue Cabecera Municipal. Dependiendo de la seleccin el camino a seguir por el modelo ser diferente. Hasta el momento se ha definido dos bifurcaciones dentro del modelo. Cada bifurcacin divide el modelo conceptual lo que origina un cambio en las preguntas y opciones que estn despus de la bifurcacin. De esta forma divide el problema inicial en diferentes dependiendo de la condicin

  • especfica. Hasta el momento se han definido dos bifurcaciones que han originado 5 problemas distintos que se muestran en la tabla 1

    TABLA 1 . Bifurcaciones 1 y 2. Problemas a partir de las bifurcaciones 1 y 2.

    PROBLEMA BIFURCACIN 1 TIPO LOCALIDAD

    BIFURCACIN 2 POBLACIN TOTAL

    PROBLEMA 1 RURAL 500 5.000 Habitantes PROBLEMA 2 RURAL 5.001 15.000 Habitantes PROBLEMA 3 CABECERA MUNICIPAL 500 5.000 Habitantes PROBLEMA 4 CABECERA MUNICIPAL 5.001 15.000 Habitantes PROBLEMA 5 CABECERA MUNICIPAL 15.001 30.000 Habitantes

    La tercera bifurcacin detectada se presenta en el Nivel 4, Tipo de Fuente, que puede tomar los valores: Agua de Mar, Fuente subterrnea o Fuente Superficial. Si la entrada es Agua de Mar el modelo no encuentra una posible solucin al problema, razn por la cual esta opcin no se tiene en cuenta; si es agua subterrnea debe especificar si es Salobre o No Salobre, si se opta por agua no salobre, el modelo no encuentra tecnologas sostenibles para el problema, por lo que tampoco se tiene en cuenta. Finalmente la opcin de fuente superficial da tres nuevas opciones, ro de ladera, ro de valle o por ultimo un lago o embalse. Al igual que en las dos primeras bifurcaciones se generan nuevos problemas, los resultantes hasta el nivel tres teniendo en cuenta las tres bifurcaciones se muestra en la tabla 2. TABLA 2. Bifurcaciones 1, 2 y 3. Problemas hata el nivel 4 con bifurcaciones 1, 2 y 3.

    PROBLEMA

    BIFURCACIN 1 TIPO LOCALIDAD

    BIFURCACIN 2 POBLACIN TOTAL

    (HAB)

    BIFURCACIN FUENTE DEL AGUA

    PROBLEMA 1 RURAL 500 5.000 SUBT. NO SALOB. PROBLEMA 2 RURAL 500 5.000 SUPERF. R. VALLE PROBLEMA 3 RURAL 500 5.000 SUPERF. R. LADER PROBLEMA 4 RURAL 500 5.000 SUPERF. LAG o EMB PROBLEMA 5 RURAL 5.001 15.000 SUBT. NO SALOB. PROBLEMA 6 RURAL 5.001 15.000 SUPERF. R. VALLE PROBLEMA 7 RURAL 5.001 15.000 SUPERF. R. LADER PROBLEMA 8 RURAL 5.001 15.000 SUPERF. LAG o EMB PROBLEMA 9 CABE. MUNICIPAL 500 5.000 SUBT. NO SALOB.

    PROBLEMA 10 CABE. MUNICIPAL 500 5.000 SUPERF. R. VALLE PROBLEMA 11 CABE. MUNICIPAL 500 5.000 SUPERF. R. LADER PROBLEMA 12 CABE. MUNICIPAL 500 5.000 SUPERF. LAG o EMB PROBLEMA 13 CABE. MUNICIPAL 5.001 15.000 SUBT. NO SALOB. PROBLEMA 14 CABE. MUNICIPAL 5.001 15.000 SUPERF. R. VALLE PROBLEMA 15 CABE. MUNICIPAL 5.001 15.000 SUPERF. R. LADER PROBLEMA 16 CABE. MUNICIPAL 5.001 15.000 SUPERF. LAG o EMB PROBLEMA 17 CABE. MUNICIPAL 15.001 30.000 SUBT. NO SALOB. PROBLEMA 18 CABE. MUNICIPAL 15.001 30.000 SUPERF. R. VALLE PROBLEMA 19 CABE. MUNICIPAL 15.001 30.000 SUPERF. R. LADER PROBLEMA 20 CABE. MUNICIPAL 15.001 30.000 SUPERF. LAG o EMB

    En cada uno de estos problemas el conjunto de variables que el modelo solicita para proponer una posible solucin es diferente. El nmero total de variables que el modelo requiere en todos los problemas es de 128. El tipo de variable vara dependiendo el tipo de solicitud. Bsicamente los tres tipos de variables que se reconocieron fueron valores reales, cadenas de texto y enteros. Una vez estudiado el modelo y obtenidos los problemas y las bifurcaciones y posteriormente habiendo encontrado y definido todas las posibles variables el siguiente paso es poder ejecutar el modelo muchas veces con el objeto de estudiar sus resultados. Se desarrollo un programa en VBA que permite automatizar el procedimiento de ejecucin del SELTEC, tomando las variables de entrada de una hoja de calculo, ejecutando SELTEC y guardando

  • los resultados en archivos de texto. Para poder hacer esto se generaron dichas variables mediante simulacin de Montecarlo. El modelo SELTEC analiza diferentes problemas (Tabla 2). Cada uno de los problemas se enfoca de una forma diferente debido a que el tipo de localidad y el tamao de la poblacin vara, por lo que se decidi abordar el estudio de cada problema por separado, analizando los resultados y definiendo as un rbol de decisin para cada uno de ellos. Sin embargo las variables resultantes para cada uno de los problemas de la Tabla 2 es superior a 60, lo que genera un posible conjunto de soluciones de 360 , teniendo en cuenta que en promedio cada variable puede tomar tres valores distintos. Como primera aproximacin al problema y con el fin de determinar la viabilidad de la metodologa se determino trabajar hasta el nivel 3, y analizar el problema 1 de la tabla 1, es decir para una zona rural con una poblacin entre 501 y 5000 habitantes. En dicho problema el modelo SELTEC analiza 38 variables. Mediante la simulacin de Montecarlo se obtuvo una tabla de 2000 patrones, complementada con las 2000 respuestas correspondientes que arroj el Seltec. Es evidente que la representatividad de estos datos frente a las 338 posibilidades existentes es baja, pero dado que lo que se busca es la determinar la viabilidad de la metodologa hacia la optimizacin de este modelo de apoyo a la toma de decisiones mediante el empleo de los rboles de decisin, consideramos que estos datos pueden darnos luces sobre la misma. A partir de aqu se procede a introducir esta tabla de patrones en el software de rboles de decisin ARBON 1.0, desarrollado por los investigadores, y cuyos resultados se discuten a continuacin. RESULTADOS Y DISCUSIN Para los 2000 patrones se obtuvieron 28 tipos de respuesta distintos. Cada respuesta es una solucin propuesta por el Modelo SELTEC dependiendo de las variables solicitadas. El conjunto de entrada que se debe analizar mediante la metodologa propuesta se compone de 2000 registros con 38 atributos y un nmero de etiquetas cambiante dependiendo del atributo. El atributo con mayor nmero de tiquetas tiene 7 y el que menos 2. La funcin objetivo (respuesta del Modelo SELTEC) tiene 28 etiquetas, tal como se coment anteriormente. El rbol resultante encuentra todas las posibles soluciones de la funcin objetivo haciendo uso de 26 variables, es decir, propone un nuevo modelo basado en el modelo SELTEC sin hacer uso de 12 de las variables empleadas por este. Sin embargo la ruta mas larga propuesta por el rbol para encontrar dicha solucin es solamente de 8 nodos. Es decir para esa situacin especfica el rbol requiere nicamente 8 variables para poder dar una solucin. De igual forma la ruta mas corta es de nicamente 3 nodos, lo que pretendera que a partir nicamente de 3 variables. Estos resultados nos permiten pensar que la metodologa empleada es viable y que con algunos pequeos ajustes permitir atacar el problema involucrando la totalidad de las variables y los cuatro niveles tcnicos involucrados en la decisin, para posteriormente desarrollar un aplicativo computacional que permita la aplicacin de este modelo simplificado y optimizado, con un muy buen ajuste al Seltec, pero, he aqu el mayor aporte, reduciendo la cantidad de informacin necesaria de manera importante, lo que redundar en una mayor facilidad de aplicacin del modelo y a la larga en menores costos para los municipios que pudieran llegar a utilizarlo. Aun es prematuro aventurar en que porcentaje se puede reducir el nmero de variables de entrada, pero los resultados preliminares son alentadores dado que como se comentaba anteriormente, la ruta mas larga encontrada tiene 8 nodos, esto quiere decir que de las 38 variables de entrada, para encontrar esta solucin solo se emplean 8, y las otras 30 pueden tomar cualquier valor porque siempre se va a llegar a la misma respuesta. Algo similar ocurre con la rama ms corta, en la que se emplean 3 variables, mientras que el Seltec usaba alrededor de 12 para obtener el mismo resultado. En la figura 4 se muestra un ejemplo de una ruta con 7 nodos.

  • Filtracin medios filtrantes Remosin Hierro y manganeso

    Solo Desinfeccin de Hipoclorito de Sodio y de hipoclorito de Calcio

    Aceptacin de qumicos = SI

    Origen del Servicio de Nerga = Sin Energa

    Crecimiento Poblacin Anual = 1-10 %

    Tipo de Transporte al centro urbano mas cercano. (Disponibilidad de Medios Filtrantes ) = Terrestre

    Horas de funcionamiento planta = 24 horas

    Estado de la Va. (Disponibilidad de Medios Filtrantes ) = Pavimentada

    Organizaciones Sociales= No Hay

    El nodo inicial del rbol fue el atributo nmero 5 correspondiente a Aceptacin de Qumicos por parte de la comunidad.

    Figura 4. Ejemplo Una rama del rbol con 7 nodos. REFERENCIAS BIBLIOGRAFICAS

    Cadavid C., Cortez S. (2002) Aplicacin critica del Modelo de Seleccin de tecnologas y Anlisis de costos en sistemas de potabilizacin de agua; Trabajo de grado Ingeniera Civil, Pontificia Universidad Javeriana.

    Castillo, E. & E. Alvarez (1989). Sistemas Expertos. Aprendizaje e Incertidumbre.. Paraninfo S.A.

    Madrid, Espaa. Davis, R. & B.G. Buchanan (1977). Meta level knowledge. Overview and applications In

    proceedings of the 5th International Joint Conference on Artificial Intelligence, 920-927. Cambridge Ma.

    Hopgood A. A. (2001). Intelligent Systems for Engineers and Scientists. CRC Press. Mitchell T. (1997). Machine Learning. (pp 52-80). McGraw Hill. Obregn N. & F. Fragal. (2002). Sistemas Inteligentes, Ingeniera e Hidroinformtica. Ciencias e

    Ingeniera Neogranadina. Vol. 13. Obregn N. & F. Fragal. (2003). Some Applications of Artificial Intelligent Systems in

    Hydroinformatics. Eighteeen International Joint Conference on Artificial Intelligence. EDSS03 Workshop. Acapulco, agosto 9-15.

    Obregn N., Fragal F. & O. Garca. (2003). Advances in Hydroinformatic Estimation of Aquifer

    Vulnerability. IAHR Congress. Grecia, agosto 24-29. (Aprobado) Quinlan, J. R. (1986). Induction of decision trees. Machine Learning, 1 (1), 81-106 CINARA (2001). Modelo conceptual para la seleccin de tecnologa en sistemas de potabilizacin

    de agua; Ministerio de Desarrollo Econmico.