curso - taller sobre estrategias de recuperación de información en la web autor: jhon gonzalez...

26
Curso - taller sobre Estrategias de Recuperación de Información en la Web Autor: Jhon Gonzalez Sitio Web: http://www.infoesfera.com e-mail: [email protected]

Upload: juan-carlos-valverde-ruiz

Post on 25-Jan-2016

213 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Curso - taller sobre Estrategias de Recuperación de Información en la Web Autor: Jhon Gonzalez Sitio Web:  e-mail: gonzalez@infoesfera.com

Curso - taller sobre Estrategias de Recuperación de Información

en la WebAutor: Jhon Gonzalez

Sitio Web: http://www.infoesfera.com e-mail: [email protected]

Page 2: Curso - taller sobre Estrategias de Recuperación de Información en la Web Autor: Jhon Gonzalez Sitio Web:  e-mail: gonzalez@infoesfera.com

© Unisalle 2006 Slide 2

El Objetivo

Objetivo:

Explorar adecuada mente los recursos disponibles en la web, mejorar los

procesos de búsqueda y aumentar la eficiencia ante las necesidades de

información de sus usuarios.

Page 3: Curso - taller sobre Estrategias de Recuperación de Información en la Web Autor: Jhon Gonzalez Sitio Web:  e-mail: gonzalez@infoesfera.com

© Unisalle 2006 Slide 3

Hoja de Ruta

Presentación curso

Referencias Bibliograficas

Fuentes de información

Recuperación Información.Internet

Internet Redes Sociales

DerechosAutor

60 % 40 %

Page 4: Curso - taller sobre Estrategias de Recuperación de Información en la Web Autor: Jhon Gonzalez Sitio Web:  e-mail: gonzalez@infoesfera.com

© Unisalle 2006 Slide 4

Cambios en el acceso y distribución del conocimiento

Sociedad industrial Sociedad de la Información Sociedad del conocimiento

• Conocimiento centralizado

• Apabullante y diversa cantidad de datos

• Conocimiento distribuido

• Conocimiento transmitido oralmente

• Nuevos instrumentos de información

• El conocimiento se transmite por múltiples vías

• Conocimiento no accesible • Distancia ilimitada • Conocimiento directamente accesible

•Transmisión de generación en generación

• Comunicación instantánea • Nuevas generaciones poseen conocimientos que no tienen las viejas generaciones

Lectura Complementaria: TREJO Delarbre, Raúl. Vivir en la Sociedad de la Información. En: Revista Iberoamericana de Ciencia, Tecnología, Sociedad e Innovación. No.1 (Sep - Dic, 2001) Disponible en: http://tinyurl.com/lln85

Page 5: Curso - taller sobre Estrategias de Recuperación de Información en la Web Autor: Jhon Gonzalez Sitio Web:  e-mail: gonzalez@infoesfera.com

© Unisalle 2006 Slide 5

Configuración de redes de creación de conocimiento

Herramientas de comunicación mediada

1. El correo electrónico 2. Las listas de correo/foros 3. Los Mensajeros instantáneos/El chat

Programas orientados a la gestión de trabajo grupal

4. Los Groupware 5. Weblogs, Blogs o Bitácoras 6. Wiki´s 7. Portales de noticias

Herramientas colaborativas de gestión de contenidos

8. Los sistemas de manejo de contenidos (CMS)

Page 6: Curso - taller sobre Estrategias de Recuperación de Información en la Web Autor: Jhon Gonzalez Sitio Web:  e-mail: gonzalez@infoesfera.com

© Unisalle 2006 Slide 6

Qué es dato, información y conocimiento?

de presentar sus

Dato Información Conocimiento

• Es un conjunto discreto• Un dato no dice nada • Por sí mismo tiene poca o ninguna relevancia o propósito. • Las organizaciones necesitan datos

“No proporcionan juicios de valor o interpretaciones ”

• Se describe como un mensaje:• Un documento • Comunicación Audible/VisIble• Impacta sobre sus juicios de valor y comportamiento del receptor• Redes formales (cables, buzones de correo electrónico, direcciones, ) • Redes informales Se hacen a medida. ( T.Q.M, OK )

• Mas rico que los datos y la información • Mezcla de experiencia, valores, información y “saber hacer” • Se origina y aplica en la mente ( complejidad impredecibilidad )

Comparación. Consecuencias. Conexiones. Conversación.

Page 7: Curso - taller sobre Estrategias de Recuperación de Información en la Web Autor: Jhon Gonzalez Sitio Web:  e-mail: gonzalez@infoesfera.com

© Unisalle 2006 Slide 7

Clasificación del Conocimiento

Tácito

Descripción Ejemplo

• En la mente de las personas (know-how) • Producto de sus experiencias

"Las sillas de esta iglesia no son confortables."

"Yo sé cómo diseñar un buen sofá para ver la Tele."

"La altura adecuada de un asiento para un adulto británico es de 44 cm."

Explicito

• Se puede obtener • Se puede codificar y trasmitir• Puede encontrarse en distintas clases de documentos

Manual completo de la Madera, la Carpintería y la Ebanistería

Page 8: Curso - taller sobre Estrategias de Recuperación de Información en la Web Autor: Jhon Gonzalez Sitio Web:  e-mail: gonzalez@infoesfera.com

© Unisalle 2006 Slide 8

Tipos de colecciones

Colección GeneralLibros de interés general • Consulta en la sala de estudio • Préstamo por ocho (8) días.

Colección de Referencia

Diccionarios, enciclopedias, directorios, guías, anuarios, repertorios bibliográficos, atlas.

• Acceso rápido a información• Un área específica o general • Consultar en la sala • Prestan únicamente para fotocopia

Colección de Publicaciones

Periódicas

Revistas, periódicos, boletines • Mensual, trimestral, semestral, anualmente• Consulta en la sala • Prestan únicamente para fotocopia

Page 9: Curso - taller sobre Estrategias de Recuperación de Información en la Web Autor: Jhon Gonzalez Sitio Web:  e-mail: gonzalez@infoesfera.com

© Unisalle 2006 Slide 9

Tipos de colecciones

Colección de Tesis de Grado

Tesis de Grado Estudiantes • Consulta en la sala de estudio • Préstamo por ocho (8) días

Colección de Reserva

Libros con la mayor consulta y préstamo • Consulta en la sala de estudio • Préstamo por horas

Colección Archivo Vertical

Recortes de periódicos sobre temas relevantes• Organizados por carpetas • Consulta en la sala de estudio• Prestamo únicamente para fotocopia

Colección Videoteca

Videos, CD ROM, DVD, entre otros.• Préstamo únicamente para fotocopia • Préstamo un día para otro

Page 10: Curso - taller sobre Estrategias de Recuperación de Información en la Web Autor: Jhon Gonzalez Sitio Web:  e-mail: gonzalez@infoesfera.com

© Unisalle 2006 Slide 10

Mapa fuentes información

Productores Formales

Informales( Conversaciones )

Libros

TesisInéditas

Publicadas

Bibliotecas

Internet

Usuario

FuentesPrimarias

FuentesSecundarias

BaseDatos

Catálogos

Bibliografía

Page 11: Curso - taller sobre Estrategias de Recuperación de Información en la Web Autor: Jhon Gonzalez Sitio Web:  e-mail: gonzalez@infoesfera.com

© Unisalle 2006 Slide 11

Concepto

Se consideran fuentes de información: Materiales o productos

Originales o elaborados

Aportan noticias o testimonios

Se accede al conocimiento

Page 12: Curso - taller sobre Estrategias de Recuperación de Información en la Web Autor: Jhon Gonzalez Sitio Web:  e-mail: gonzalez@infoesfera.com

© Unisalle 2006 Slide 12

Fuentes información según origen información

de presentar sus

PERSONALES • Grupos o personas que se relacionan profesionalmente• Transmisión oral ( Difícil Acceso )• Colegios invisibles / Asociaciones profesionales

INSTITUCIONALES

• Información sobre la institución • Funciones y actividades de interés publico

p.e. guias centros de información, catálogos.. Etc..

DOCUMENTALES

• Información sobre o a partir de un documento • Documento

• Contiene información • transmite información

Page 13: Curso - taller sobre Estrategias de Recuperación de Información en la Web Autor: Jhon Gonzalez Sitio Web:  e-mail: gonzalez@infoesfera.com

© Unisalle 2006 Slide 13

Fuentes primarias (Nivel Informativo) 1/2

de presentar susPRIMARIASInformación nueva u original

• No sometida a la interpretación o la condensación• Libros

• Materiales impresos• Tema particular / especifico• Información no actual

• Revistas• Difusión de conocimiento (Profesional, académico, científico ) • Temas breves, actualidad y novedad• Naturaleza especializada

• Periódicos (diarios y semanarios)• Publicaciones seriadas • Contenido de carácter informativo

• Revistas científicas (serial, periodical, journal)• Fascículos y numeración secuencial • Periodos de tiempo determinados• Frecuencia y regularidad de publicación

• Literatura gris • Canales no convencionales • Traducciones no publicadas, Artículos de sociedades

Page 14: Curso - taller sobre Estrategias de Recuperación de Información en la Web Autor: Jhon Gonzalez Sitio Web:  e-mail: gonzalez@infoesfera.com

© Unisalle 2006 Slide 14

Fuentes primarias (Nivel Informativo) 2/2

de presentar sus

PRIMARIASInformación nueva u original

• Informes investigación • Resultados parcial o totales • Instituciones o empresas

• Actas congresos• Actas de congresos y conferencistas• Primicias y resultados finales

• Tesis doctorales• Repertorios de tesis doctorales • http://www.mcu.es/TESEO/teseo.html (España)

• Patentes • Autoría e Invención • Información científico-técnica

• Normas • Organismos competentes ISO, ICONTEC • Requisitos productos y procesos

Page 15: Curso - taller sobre Estrategias de Recuperación de Información en la Web Autor: Jhon Gonzalez Sitio Web:  e-mail: gonzalez@infoesfera.com

© Unisalle 2006 Slide 15

Fuentes secundarias (Nivel Informativo)

de presentar sus

SECUNDARIAS Material conocido

pero organizado

• Obras de referencia a documentos primarios • Resultado: extracción, análisis y condensación p.e Revistas de resúmenes o índices

• Directorios http://www.paginasamarillas.com • Listas alfabéticas • Información básica y de localización

• Anuarios y Manuales • información actual y concisa ( eventos, fechas, personas)

• Diccionarios http://www.diccionarios.com/ • Generales: tratado general del conociendo• Especializados: Áreas especificas (Ingles, derecho)

• Enciclopedias http://www.britannica.com/ • Revisión sistemática de temas• Representación panorámica

• Fuentes geográficas http://maps.google.com/ • Atlas y guías de viajes

• Índices - JANIUM - • Bibliográficos, de contenido, revistas de resumenes • Servicios de Alerta

Page 16: Curso - taller sobre Estrategias de Recuperación de Información en la Web Autor: Jhon Gonzalez Sitio Web:  e-mail: gonzalez@infoesfera.com

© Unisalle 2006 Slide 16

Fuentes terciarias (Nivel Informativo)

de presentar sus

TERCIARAS Repertorio de Fuentes

primarias y secundarias

• Contienen información original estructurada • Bibliografías de Bibliografías• Guías de obras de referencia • http://www.legis.com.co

Page 17: Curso - taller sobre Estrategias de Recuperación de Información en la Web Autor: Jhon Gonzalez Sitio Web:  e-mail: gonzalez@infoesfera.com

© Unisalle 2006 Slide 17

Fuentes y su presentación

de presentar sus

Revistas, libros, patentes, enciclopedias

• Impresos• Edición electrónica:

• Cd –rom • Cintas magenticas • Disquetes

• Internet• Listas de correo• Boletines electrónicos• Revistas electrónicas• Bases de datos• Paginas Web

Page 18: Curso - taller sobre Estrategias de Recuperación de Información en la Web Autor: Jhon Gonzalez Sitio Web:  e-mail: gonzalez@infoesfera.com

© Unisalle 2006 Slide 18

Mapa fuentes información

Productores Formales

Informales( Conversaciones )

Libros

TesisInéditas

Publicadas

Bibliotecas

Internet

Usuario

FuentesPrimarias

FuentesSecundarias

BaseDatos

Catálogos

Bibliografía

Page 19: Curso - taller sobre Estrategias de Recuperación de Información en la Web Autor: Jhon Gonzalez Sitio Web:  e-mail: gonzalez@infoesfera.com

© Unisalle 2006 Slide 19

Las siete edades de la Recuperación de la Información

Las siete edades de la Recuperación de la Información.

1995, Michael Lesk. IFLA

Page 20: Curso - taller sobre Estrategias de Recuperación de Información en la Web Autor: Jhon Gonzalez Sitio Web:  e-mail: gonzalez@infoesfera.com

© Unisalle 2006 Slide 20

El niño de guardería (1945-1955)

El niño nace con los planteamientos teóricos de Vannevar Bush (1945) -muchos de los cuales

se han alcanzado posteriormente con la evolución de la tecnología-

Interoperabiliad: “interfaces gráficos donde se van a ejecutar las distintas aplicaciones”.

Los índices KWIC propuestos por Hans Peter Luhn, el precursor de la Indización Automática (Rijsbergen, 1999).

Page 21: Curso - taller sobre Estrategias de Recuperación de Información en la Web Autor: Jhon Gonzalez Sitio Web:  e-mail: gonzalez@infoesfera.com

© Unisalle 2006 Slide 21

El niño del colegio (1960s)

es la época donde algunos de los hoy principales sistemas de recuperación de información (Dialog y BRS)

las primeras bases de datos de repertorios bibliográficos (Chemical Abstracts o ERIC)

Los experimentos de Cyril Cleverdon en el Instituto Cranfield (Sparck Jones, 1981),. Metodologias evaluacion en los sistemas de indización y en los lenguajes documentales (catálogo alfabético, clasificación CDU, clasificación por facetas,

índice coordinado de unitérminos )

Page 22: Curso - taller sobre Estrategias de Recuperación de Información en la Web Autor: Jhon Gonzalez Sitio Web:  e-mail: gonzalez@infoesfera.com

© Unisalle 2006 Slide 22

El adulto (1970s):

Desarrollo de los periféricos de entrada de textos (teclados) y construccion grandes colecciones de textos

Sstemas de proceso de datos en tiempo real.

Nace OCLC el mayor recolector de información bibliográfica a nivel mundial y se desarrolla el formato MARC

Inteligencia Artificial: El modelo probabilístico de recuperación de información & Clustering introducidos por ‘Keith’ Rijsbergen (1999).

Page 23: Curso - taller sobre Estrategias de Recuperación de Información en la Web Autor: Jhon Gonzalez Sitio Web:  e-mail: gonzalez@infoesfera.com

© Unisalle 2006 Slide 23

El maduro (1980s):

Aumentan las facilidades para produccion información disminuye el coste de los dispositivos de almacenamiento

Expansión del CD-ROMPrimeros módulos de consulta de catálogos en

línea (OPAC)Aplicación del modelo del espacio vectorial de

Gerard Salton ( estrucutura de datos y que el alineamiento suele realizarse en función del parecido (o similitud) de la pregunta con los documentos almacenados.)

Page 24: Curso - taller sobre Estrategias de Recuperación de Información en la Web Autor: Jhon Gonzalez Sitio Web:  e-mail: gonzalez@infoesfera.com

© Unisalle 2006 Slide 24

La crisis de los cuarenta (1990s):

Crean la World Wide Web (Tim Berners-Lee y Paul F. Kunz)

En 1999, nace Google Surgió WAIS (Wide Area Information

Server ---servidor de información de área extendida).

El protocolo Z39.50 se consolida como la base para el desarrollo de las OPAC

Nace, se consolida y finalmente desaparece Hytelnet, plataforma integradora para la consulta de catálogos en línea de multitud de bibliotecas de todo el mundo

Page 25: Curso - taller sobre Estrategias de Recuperación de Información en la Web Autor: Jhon Gonzalez Sitio Web:  e-mail: gonzalez@infoesfera.com

© Unisalle 2006 Slide 25

El deber cumplido (2000s):

Avances en el proceso y la recuperación de la información textual

Se presentan muchos problemas en la Indización Automática

Los algoritmos y sistemas desarrollados en los años 80s y 90s pueden hacer frente a las grandes colecciones de documentos.

El computador hacia la red (Redes Sociales)

Page 26: Curso - taller sobre Estrategias de Recuperación de Información en la Web Autor: Jhon Gonzalez Sitio Web:  e-mail: gonzalez@infoesfera.com

© Unisalle 2006 Slide 26

El retiro:

Michael Lesk fija (1995) de manera muy optimista para el año 2010.Plantea que:

Todos los países del mundo posean un similar nivel en cuanto al desarrollo de los servicios y productos de la Sociedad de la Información.

EPIC -Evolving Personalized Information Construct [Transcripción Español ]