Modelos clásicos presentación
-
Upload
hernanarteaga -
Category
Technology
-
view
1.815 -
download
1
description
Transcript of Modelos clásicos presentación
MODELOS CLÁSICOS
Stephanie Santa
Luz Ángela González
Rafael Prieto
Hernán Arteaga
MODELO BOOLEANO
Es uno de los modelos utilizados para la recuperación de la información en una base de datos.
Por medio de este sistema las consultas se dan en operadores lógicos (y, o, no); de esta manera el
motor de búsqueda regresa a aquellos documentos que cumplen con los aspectos lógicos de la
consulta que parecen relevantes para el usuario. Está compuesto por el sistema binario (0 y 1).
(Spark y Willett 1997).
Asimismo estos operadores permiten conectar términos y hacen que el documento esté o no
esté; lo cual quiere decir que no tiene en cuenta la semántica del documento. Lo que está bajo el
término lo recupera pero los que presentan alguna relación no lo recupera. Dentro de las
dificultades que presenta este modelo se encuentra que es muy sencillo y básico.
Cuando el sistema es tan simple el trabajo preliminar se sobredimensiona y presenta falencias de
semántica.
MODELO VECTORIAL(Indexación semántica latente, redes neuronales y algoritmos genéticos)
Es una mejora del sistema booleano que permite ubicar cualquier documento no sólo
por medio del sistema binario sino que además lo ubica dentro de un espacio vectorial
con un direccionamiento que considera el sistema es cercanos o equivalente al término
que necesita el usuario. Los términos adquieren un valor de pesos, están relacionados de
acuerdo a dos representaciones de consulta o búsqueda y un conjunto de términos que
representan el documento, cada término (los míos y los del documento) se equiparan, se
unen y complementan para recuperar los documentos más relevantes. Ejemplo: consultas
en Google: los resultados que aparecen, el algoritmo se muestra con un mayor peso o
relevancia (que en este caso sería el número de veces que aparece el término dentro del
documento).
MODELO PROBABILÍSTICO
es la evolución de los modelos anteriores agregándole o adicionándole es mucho
más complejo que el booleano. Estima que hay un conjunto de documentos que
responde a la necesidad del usuario, en el proceso de recuperación genera una
probabilidad proyectando la información recuperada. Además interactúa con el
usuario teniendo en cuenta que es más sencillo que un modelo neurálgico. Es un
modelo que está soportado tanto en el sistema como en el usuario; es decir que
existe una interacción constante y activa. La diferencia con el vectorial es que el
sistema responde a la búsqueda: usted desea estos o aquellos documentos, le da al
usuario la posibilidad de escoger. Se salva en cierta manera la semántica.
E J E M P L O P R O . C O R B I S . C O M : L E N G U A : Q U E Q U I E R E
R E C U P E R A R A N A T O M Í A ? O A L I M E N T O ?
H e r r a m i e n t a q u e p e r m i t e m o s t r a r l a s t r e s : s c o p u s e s u n a d e l a s
h e r r a m i e n t a s m á s i m p o r t a n t e s a l a h o r a d e r e c u p e r a r i n f o r m a c i ó n
c i e n t í f i c a . N o s p e r m i t e m i r a r c o n e c t o r e s y e s t á i n v o l u c r a d o e l
m é t o d o b o o l e a n o , v e c t o r i a l p o r q u e m u e s t r a r a n g o s ( p e s o s ) ,
p r o b a b i l í s t i c o e m p i e z o a t o m a r d e c i s i o n e s s o b r e e l s i s t e m a ,
p e r m i t e l i m i t a r y r e s t r i n g i r l a i n f o r m a c i ó n . ( L a e s t r a t e g i a d e
b ú s q u e d a a p a r e c e r e s a l t a d a e n c o l o r a g u a m a r i n a , v a l i o s a p o r q u e
t r a d u c e m i n e c e s i d a d a l i d i o m a d e l s i s t e m a , l o c u a l p e r m i t e l a
r e c u p e r a c i ó n )
D I S E M I N A C I Ó N S E L E C T I VA D E I N F O R M A C I Ó N
( A N T I G UA B I B L I O T E C O L O G Í A )
Ejemplo utópico del modelo probabilístico es la web 2.0 y la web semántica
¿ C U Á L E S S O N L A S D I F E R E N C I A S D E L O S
M O D E L O S C L Á S I C O S ?
Se deben entender como mejoras entre los modelos y en la medida que
la evolución de las tecnologías de los sistemas, cada modelo avanza frente
a su antecesor por lo que, el Booleano recupera la información porque los
términos están o no, el Vectorial además de recurar por el sistema binario
como el booleano, adiciona documentos relacionados y por último el
modelo probabilístico adiciona a lo anterior la interacción con el usuario y
lo que considera es relevante a la necesidad del usuario.
Los tres modelos clásicos de recuperación de información se
denominan booleano, vectorial y probabilístico. estos son modelos
teóricos, utilizados para recuperar un subconjunto de documentos
relevantes, en relación a una consulta específica, de entre todos los
que configuran la colección. Documentos y consultas que se
representan como un conjunto de términos del índice, son modelos
que se ajustan a lo teórico.
En el modelo vectorial los documentos y consultas se representan
por medio de vectores en un espacio tridimensional por lo tanto se
dice que el modelos algebraico.
Para el modelo probabilístico “Introducido en la década de los
setenta por Robertson y Sparck Jones, también es conocido como
modelo de recuperación de independencia binaria (BIR). (Juan
Antonio Martínez Comeche. Pg 10)
Bibliografía
Juan Antonio Martínez Comeche. Los modelos clásicos de
Recuperación de información
y su vigencia. RECURSO WEB Disponible en:
http://eprints.ucm.es/5979/1/Modelos_RI_preprint.pdf
consultado el 19/08/11
MUCHAS GRACIAS.