Árboles - Coordinación de Ciencias Computacionales -...

Post on 15-Mar-2020

1 views 0 download

Transcript of Árboles - Coordinación de Ciencias Computacionales -...

Árboles

Cursos Propedéuticos 2015

Dr. René Cumplido M. en C. Luis Rodríguez Flores

Contenido de la sección

• Introducción • Árbol genérico

– Definición y representación

• Árboles binarios – Definición, implementación, aplicaciones y recorridos

• Árboles binarios de Búsqueda – Definición y principales operaciones (insertar,

eliminar, buscar)

Introducción

Hasta ahora, en todas las estructuras existen al menos dos operaciones:

• Insertar un elemento en el conjunto. • Buscar y/o descartar un elemento

¿Que limitaciones existen respecto a la

complejidad de sus operaciones básicas?

Introducción

Una lista no ordenada tiene: • Costo de inserción O(1). • Costos de búsqueda O(n).

En el segundo caso la repetición de n operaciones

sobre la estructura da origen a complejidad n2.

Introducción

Una lista ordenada en forma ascendente por prioridad, permite:

• Seleccionar el mínimo con costo O(1). • Insertar manteniendo el orden tiene costo

promedio O(n) en el peor caso.

Introducción

La estructura de un árbol binario garantiza que las operaciones de inserción y eliminación sean de complejidad O( log2 (n) )

¿Qué es un árbol?

Un árbol es un grafo A que tiene un único nodo llamado raíz que:

• Si tiene 0 relaciones se llama nodo hoja. • Si tiene un un número finito de relaciones donde cada una

de esas relaciones es un sub-árbol.

– Por tanto, un árbol es una estructura no secuencial.

Ejemplo de un árbol

A

B D

G H I

C

E F

Nomenclatura básica

• Todo nodo nj, exceptuando el raíz, está conectado exclusivamente a otro nodo nk donde: – nj es el padre de nk (e.g., B es el padre de E) – nk es uno de los hijos de nj (e.g., E es un hijo de B) – Nodos con el mismo padre son “hermanos” – Nodos sin hijos son llamados “hojas”

• Si existe una trayectoria del nodo nj al nodo nk entonces: – nj es antecesor de nk (e.g., A es antecesor de E) – nk es descendiente de nj (e.g., E es descendiente de E)

Ejemplo

Más nomenclatura

• La trayectoria del nodo n1 a nk se define como la secuencia de nodos n1,n2,…,nk, tal que ni es el padre de ni+1. Entonces: – La longitud de una trayectoria es el número de

ramas recorridas, es decir, K-1. – Nivel o profundidad del nodo ni es la longitud de la

trayectoria que va del nodo raíz a ni. • C tiene profundidad 1, mientras que I tiene profundidad 2.

– La altura del nodo ni es longitud de la trayectoria más larga de ni a una hoja.

• G tiene altura 0, B altura 1 y A (raíz) altura 2.

Implementación

typedef struct { TipoDato dato; struct NodoArbol *hijo1; struct NodoArbol *hijo2; : struct NodoArbol *hijoN; } NodoArbol; typedef struct { TipoDato dato; struct NodoArbol *hijo; struct NodoArbol *hermano; } NodoArbol;

• Dos formas de implementar: – Tener un apuntador a cada uno

de los hijos. Problema cuando NO sabemos el número de hijos.

– Mantener los hijos de un nodo en una lista ligada. No hay ninguna restricción sobre número de hijos.

• Así, un nodo del árbol consiste en un dato, un apuntador al primer hijo y un apuntador a la lista de hermanos.

Árboles binarios

• Un árbol binario es un árbol donde cada nodo puede tener como máximo dos hijos.

• Recursivamente un árbol binario puede definirse como: un árbol vacío, o un nodo raíz con un subárbol izquierdo y un subárbol derecho.

Raíz

Árbol izquierdo

Árbol derecho

Árboles binarios

Un árbol binario es una estructura de datos de tipo árbol en donde cada uno de los nodos del árbol puede tener 0, 1, ó 2 subárboles llamados de acuerdo a su caso como:

• Si el nodo raíz tiene 0 relaciones se llama hoja. • Si el nodo raíz tiene 1 relación a la izquierda, el segundo

elemento de la relación es el subárbol izquierdo. • Si el nodo raíz tiene 1 relación a la derecha, el segundo

elemento de la relación es el subárbol derecho.

* Si cada nodo que NO es una hoja tiene un subárbol izquierdo y un subárbol derecho, entonces se trata de un árbol binario completo.

Árboles binarios

Cuales de las siguientes figuras representa un árbol binario?

Árboles binarios

• En un primer caso se tiene que el número de nodos n es tres; un nivel (m elementos entre los nodos en una trayectoria desde la raíz a las hojas) y altura h igual dos.

Árboles binarios

Con dos niveles: n=7=23-1 m=2 h=3

Con tres niveles: n=15=24-1 m=3 h=4

En un caso general para árboles binarios completos: n = 2h -1, h = m +1 y h=log2 (n+1), despejando h de la primera relación.

Árboles binarios • La altura, es el concepto importante para la

complejidad, ya que define el número de nodos a revisar en una trayectoria desde la raíz hasta las hojas.

• Cual es la altura h del árbol anterior?: • Si conocemos h, cual es el valor de n?:

Árboles binarios

• Árboles binarios llenos: Cada nodo del árbol o es una hoja o un nodo interno con exáctamente dos hijos.

• Árbol binario completo: es aquel en el que todos los nodos tienen dos hijos y todas las hojas están en el mismo nivel. – cada nodo,excepto las hojas, tiene el máximo de

hijos que puede tener.

Árboles binarios

¿Son completos?

¿Son llenos?

(a) (b)

Implementación con arreglos

Posición 0 1 2 3 4 5 6 7 8 9 10 11

Padre -- 0 0 1 1 2 2 3 3 4 4 5

Hijo Izquierdo 1 3 5 7 9 11 -- -- -- -- -- --

Hijo Derecho 2 4 6 8 10 -- -- -- -- -- -- --

Hermano Izq -- -- 1 -- 3 -- 5 -- 7 -- 9 -- Hermano Der -- 2 -- 4 -- 6 -- 8 -- 10 -- --

Implementación con apuntadores

• Los nodos del árbol son estructuras que almacenan los datos, y apuntadores a los subárboles de ese nodo.

H

Y

S

A L

D

Árbol Representación

del Árbol

Estructura del nodo del árbol

Implementación

typedef struct NodoArbol *Arbol; struct NodoArbol { TipoDatol dato; struct NodoArbol *izq; struct NodoArbol *der; };

• Cada nodo del árbol consiste en: – Un dato (cualquier tipo) – Un apuntador al hijo izquierdo – Un apuntador al hijo derecho

• Inicialmente el nodo raíz apunta a NULL.

• En las hojas del árbol, los apuntadores hacia los hijos izquierdo y derecho son NULL.

Operaciones con árboles binarios

• Con los árboles binarios es posible definir algunas operaciones primitivas, estas operaciones permiten obtener información de un nodo y sirven para desplazarse en el árbol, hacia arriba o hacia abajo.

Operaciones con árboles binarios

• info(p) que devuelve el contenido del nodo apuntado por p. • left(p) devuelve un apuntador al hijo izquierdo del nodo

apuntado por p, o bien, devuelve NULL si el nodo apuntado por p es una hoja.

• right(p) devuelve un apuntador al hijo derecho del nodo apuntado por p, o bien, devuelve NULL si el nodo apuntado por p es una hoja.

• father(p) devuelve un apuntador al padre del nodo apuntado por p, o bien, devuelve NULL si el nodo apuntado por p es la raíz.

• brother(p) devuelve un apuntador al hermano del nodo apuntado por p, o bien, devuelve NULL si el nodo apuntado por p no tiene hermano.

Operaciones con árboles binarios

Estas otras operaciones son lógicas, tienen que ver con la identidad de cada nodo:

• isLeft(p) devuelve el valor true si el nodo actual es el hijo izquierdo del nodo apuntado por p, y false en caso contrario.

• isRight(p) devuelve el valor true si el nodo actual es el hijo derecho del nodo apuntado por p, y false en caso contrario.

• isBrother(p) devuelve el valor true si el nodo actual es el hermano del nodo apuntado por p, y false en caso contrario.

Operaciones con árboles binarios

• También son útiles las operaciones makeTree, setLeft y setRight.

• makeTree(x) crea un nuevo árbol binario que consta de

un único nodo con un campo de información x y devuelve un apuntador a ese nodo.

• setLeft(p,x) acepta un apuntador p a un nodo de árbol binario sin hijo izquierdo. Crea un nuevo hijo izquierdo de node(p) con el campo de información x.

• setRight(p,x) es similar, excepto que crea un hijo derecho.

Aplicaciones de árboles binarios

Un árbol binario es una estructura de datos útil cuando se trata de hacer modelos de procesos en donde se requiere tomar decisiones en uno de dos sentidos en cada parte del proceso.

Supongamos que tenemos un arreglo en donde queremos encontrar todos los duplicados. Esta situación es bastante útil en el manejo de las bases de datos, para evitar la redundancia.

Aplicaciones de árboles binarios

• El primer número del arreglo se coloca en la raíz del árbol con sus subárboles izquierdo y derecho vacíos.

• Luego, cada elemento del arreglo se compara son la

información del nodo raíz y se crean los nuevos hijos con el siguiente criterio:

– Si el elemento del arreglo es igual que la información del nodo raíz,

entonces notificar duplicidad. – Si el elemento del arreglo es menor que la información del nodo raíz,

entonces se crea un hijo izquierdo. – Si el elemento del arreglo es mayor que la información del nodo raíz,

entonces se crea un hijo derecho.

Aplicaciones de árboles binarios

• Una vez que ya está creado el árbol, se pueden buscar los elementos repetidos. Si x el elemento buscado, se debe recorrer el árbol del siguiente modo:

• Sea k la información del nodo actual p. Si x > k entonces cambiar el nodo actual a right(p), en caso contrario, en caso de que x = k informar una ocurrencia duplicada y en caso de que x ≥ k cambiar el nodo actual a left(p).

Aplicaciones de árboles binarios

Recorridos de un árbol

Para obtener el contenido de todos los nodos en un árbol es necesario recorrer el árbol. Esto es debido a que solo tenemos conocimiento del contenido de la dirección de un nodo a la vez.

• El proceso de visitar los nodos en algún orden

se denomina recorrido.

• Cualquier recorrido que lista cada nodo del árbol exáctamente una vez se denomina una enumeración de los nodos del árbol.

Recorridos de un árbol

• ¿cómo lo podemos recorrer?

Recorridos estándar

• Preorder: – Visitar nodo – Visitar árbol izquierdo – Visitar árbol derecho

• Inorder: – Visitar árbol izquierdo – Visitar nodo – Visitar árbol derecho

• Postorder: – Visitar árbol izquierdo – Visitar árbol derecho – Visitar nodo

void inorder(NodoArbol *nodo) { if (nodo != NULL) { inorder(nodo->izq); visitar(nodo); inorder(nodo->der); } } void postorder(NodoArbol *nodo) { if (nodo != NULL) { postorder(nodo->izq); postorder(nodo->der); visitar(nodo); } }

Ejemplo de recorridos

Preorden: A, B, D, E, C, F, G Inorden: D, B, E, A, F, C, G Postorden: D, E, B, F, G, C, A

A

B C

F G D E

Árbol binario de búsqueda

• Es un árbol: – Una colección de nodos que puede ser vacía, o que en su defecto consiste de

un nodo raíz R y un número finito de estructuras tipo árbol T1,…,Tk, llamados subárboles, los cuales son disjuntos y sus respectivos nodos raíz están conectados a R.

• Es binario: – Cada nodo puede tener como máximo dos hijos, en otras palabras, cada nodo

sólo puede tener dos subárboles.

• Es de búsqueda porque: – Los nodos están ordenados de manera conveniente para la búsqueda. – Todos los elementos almacenados en el subárbol izquierdo de un nodo con valor

K, tienen valores < K. – Todos los elementos almacenados en el sub-árbol derecho de un nodo con valor

K, tienen valores >= K.

Ejemplos

• ¿son todos árboles binarios de búsqueda?

6

2 8

3

1 4

6

2 8

3

1 4

7

2

7

1 8

6

5

4

Operación INSERTAR

void insertar(NodoArbol *nodo, int elem){ if (nodo == NULL) { nodo=(NodoArbol *)malloc(sizeof(NodoArbol)); nodo->dato = elem; nodo->izq = nodo->der = NULL; } else if (elem < nodo->dato) nodo-izq = insertar(nodo->izq, elem); else if (elem > nodo->dato) nodo->der = insertar(nodo->der, elem); return nodo; }

6

2 8

3

1 4

5

Insertando 5

Ejercicio

• Construya el árbol binario de búsqueda, al insertar secuencialmente los valores 5, 9, 3, 7, 8, 12, 6, 4.

Operación BUSCAR

boolean buscar(NodoArbol *nodo, int elem) { if (nodo == NULL) return FALSE; else if (nodo->dato < elem) return buscar(nodo->izq, elem); else if (nodo->dato > elem) return buscar(nodo->der, elem); else return TRUE; }

6

2 8

3

1 4

Buscando 4: VERDADERO Buscando 7: FALSO

Operación ELIMINAR (1)

• Existen cuatro distintos escenarios: 1. Intentar eliminar un nodo que no existe.

– No se hace nada, simplemente se regresa FALSE. 2. Eliminar un nodo hoja.

– Caso sencillo; se borra el nodo y se actualiza el apuntador del nodo padre a NULL.

3. Eliminar un nodo con un solo hijo. – Caso sencillo; el nodo padre del nodo a borrar se

convierte en el padre del único nodo hijo. 4. Eliminar un nodo con dos hijos.

– Caso complejo, es necesario mover más de un apuntador.

ELIMINAR (casos sencillos)

6

2 8

3

1 4

6

2 8

3

1 4

Eliminar nodo hoja Eliminar 3

Eliminar nodo con un hijo Eliminar 4

ELIMINAR (Caso complejo)

6

2 8

3

1 4

5

6

3 8

3

1 4

5

Eliminar nodo con dos hijos Eliminar 2

eliminar

copiar valor

• 1. Remplazar el dato del nodo que se desea eliminar con el dato del nodo más pequeño del subárbol derecho

2.Eliminar el nodo más pequeño del subárbol derecho (caso fácil)

Otro ejemplo (caso complejo)

6

2 8

3

1 4

5

3.5

Eliminar nodo con dos hijos Eliminar 2

6

3 8

3

1 4

5

3.5

1

2 Eliminar 3. Eliminación de un nodo con un hijo.

Ejercicio

• Dibujar el árbol resultante después de aplicar las siguientes eliminaciones de 20, 27, 14 y 22 al siguiente árbol.

Implementación ELIMINAR

void eliminar(NodoArbol *nodo, int elem) { NodoArbol *aux, * hijo; if (nodo == NULL) return; /* no existe nodo */ /* recorrer árbol hasta encontrar elem */ else if (elem < nodo->dato) nodo-izq = eliminar(nodo->izq, elem); else if (elem > nodo->dato) nodo->der = eliminar(nodo->der, elem);

else /* encontramos el elemento */ /* tiene dos hijos */ if (nodo->izq && nodo->derecho){ aux = enontrar_min(nodo->der); nodo->dato = aux->dato; nodo->der = eliminar(

nodo->der; nodo->dato); } /* un solo hijo */ else { aux = nodo; if (nodo->izq == NULL) hijo = nodo->der; if (nodo->der == NULL) hijo = nodo->izq; free(aux); return hijo; } } return nodo; }