modelos clásicos presentación

Post on 04-Jul-2015

1.817 Views

Category:

Technology

1 Downloads

Preview:

Click to see full reader

DESCRIPTION

Es uno de los modelos utilizados para la recuperación de la información en una base de datos. Por medio de este sistema las consultas se dan en operadores lógicos (y, o, no); de esta manera el motor de búsqueda regresa a aquellos documentos que cumplen con los aspectos lógicos de la consulta que parecen relevantes para el usuario. Está compuesto por el sistema binario (0 y 1). (Spark y Willett 1997).

TRANSCRIPT

MODELOS CLÁSICOS

Stephanie Santa

Luz Ángela González

Rafael Prieto

Hernán Arteaga

MODELO BOOLEANO

Es uno de los modelos utilizados para la recuperación de la información en una base de datos.

Por medio de este sistema las consultas se dan en operadores lógicos (y, o, no); de esta manera el

motor de búsqueda regresa a aquellos documentos que cumplen con los aspectos lógicos de la

consulta que parecen relevantes para el usuario. Está compuesto por el sistema binario (0 y 1).

(Spark y Willett 1997).

Asimismo estos operadores permiten conectar términos y hacen que el documento esté o no

esté; lo cual quiere decir que no tiene en cuenta la semántica del documento. Lo que está bajo el

término lo recupera pero los que presentan alguna relación no lo recupera. Dentro de las

dificultades que presenta este modelo se encuentra que es muy sencillo y básico.

Cuando el sistema es tan simple el trabajo preliminar se sobredimensiona y presenta falencias de

semántica.

MODELO VECTORIAL(Indexación semántica latente, redes neuronales y algoritmos genéticos)

Es una mejora del sistema booleano que permite ubicar cualquier documento no sólo

por medio del sistema binario sino que además lo ubica dentro de un espacio vectorial

con un direccionamiento que considera el sistema es cercanos o equivalente al término

que necesita el usuario. Los términos adquieren un valor de pesos, están relacionados de

acuerdo a dos representaciones de consulta o búsqueda y un conjunto de términos que

representan el documento, cada término (los míos y los del documento) se equiparan, se

unen y complementan para recuperar los documentos más relevantes. Ejemplo: consultas

en Google: los resultados que aparecen, el algoritmo se muestra con un mayor peso o

relevancia (que en este caso sería el número de veces que aparece el término dentro del

documento).

MODELO PROBABILÍSTICO

es la evolución de los modelos anteriores agregándole o adicionándole es mucho

más complejo que el booleano. Estima que hay un conjunto de documentos que

responde a la necesidad del usuario, en el proceso de recuperación genera una

probabilidad proyectando la información recuperada. Además interactúa con el

usuario teniendo en cuenta que es más sencillo que un modelo neurálgico. Es un

modelo que está soportado tanto en el sistema como en el usuario; es decir que

existe una interacción constante y activa. La diferencia con el vectorial es que el

sistema responde a la búsqueda: usted desea estos o aquellos documentos, le da al

usuario la posibilidad de escoger. Se salva en cierta manera la semántica.

E J E M P L O P R O . C O R B I S . C O M : L E N G U A : Q U E Q U I E R E

R E C U P E R A R A N A T O M Í A ? O A L I M E N T O ?

H e r r a m i e n t a q u e p e r m i t e m o s t r a r l a s t r e s : s c o p u s e s u n a d e l a s

h e r r a m i e n t a s m á s i m p o r t a n t e s a l a h o r a d e r e c u p e r a r i n f o r m a c i ó n

c i e n t í f i c a . N o s p e r m i t e m i r a r c o n e c t o r e s y e s t á i n v o l u c r a d o e l

m é t o d o b o o l e a n o , v e c t o r i a l p o r q u e m u e s t r a r a n g o s ( p e s o s ) ,

p r o b a b i l í s t i c o e m p i e z o a t o m a r d e c i s i o n e s s o b r e e l s i s t e m a ,

p e r m i t e l i m i t a r y r e s t r i n g i r l a i n f o r m a c i ó n . ( L a e s t r a t e g i a d e

b ú s q u e d a a p a r e c e r e s a l t a d a e n c o l o r a g u a m a r i n a , v a l i o s a p o r q u e

t r a d u c e m i n e c e s i d a d a l i d i o m a d e l s i s t e m a , l o c u a l p e r m i t e l a

r e c u p e r a c i ó n )

D I S E M I N A C I Ó N S E L E C T I VA D E I N F O R M A C I Ó N

( A N T I G UA B I B L I O T E C O L O G Í A )

Ejemplo utópico del modelo probabilístico es la web 2.0 y la web semántica

¿ C U Á L E S S O N L A S D I F E R E N C I A S D E L O S

M O D E L O S C L Á S I C O S ?

Se deben entender como mejoras entre los modelos y en la medida que

la evolución de las tecnologías de los sistemas, cada modelo avanza frente

a su antecesor por lo que, el Booleano recupera la información porque los

términos están o no, el Vectorial además de recurar por el sistema binario

como el booleano, adiciona documentos relacionados y por último el

modelo probabilístico adiciona a lo anterior la interacción con el usuario y

lo que considera es relevante a la necesidad del usuario.

Los tres modelos clásicos de recuperación de información se

denominan booleano, vectorial y probabilístico. estos son modelos

teóricos, utilizados para recuperar un subconjunto de documentos

relevantes, en relación a una consulta específica, de entre todos los

que configuran la colección. Documentos y consultas que se

representan como un conjunto de términos del índice, son modelos

que se ajustan a lo teórico.

En el modelo vectorial los documentos y consultas se representan

por medio de vectores en un espacio tridimensional por lo tanto se

dice que el modelos algebraico.

Para el modelo probabilístico “Introducido en la década de los

setenta por Robertson y Sparck Jones, también es conocido como

modelo de recuperación de independencia binaria (BIR). (Juan

Antonio Martínez Comeche. Pg 10)

Bibliografía

Juan Antonio Martínez Comeche. Los modelos clásicos de

Recuperación de información

y su vigencia. RECURSO WEB Disponible en:

http://eprints.ucm.es/5979/1/Modelos_RI_preprint.pdf

consultado el 19/08/11

MUCHAS GRACIAS.

top related