categorización y recuperación de información médica en la web

25
Categorización y Recuperación de Categorización y Recuperación de Información Médica en la Web Información Médica en la Web Alberto H. F. Laender Departamento de Ciência da Computação Universidade Federal de Minas Gerais Belo Horizonte - Brasil [email protected] [email protected] Taller de Telemedicina e Informática Médica Mérida, Venezuela 27 de Abril de 2001

Upload: kaia

Post on 11-Jan-2016

32 views

Category:

Documents


5 download

DESCRIPTION

Categorización y Recuperación de Información Médica en la Web. Alberto H. F. Laender Departamento de Ciência da Computação Universidade Federal de Minas Gerais Belo Horizonte - Brasil [email protected] [email protected]. Taller de Telemedicina e Informática Médica Mérida, Venezuela - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Categorización y Recuperación de Información Médica en la Web

Categorización y Recuperación de Categorización y Recuperación de Información Médica en la WebInformación Médica en la Web

Alberto H. F. LaenderDepartamento de Ciência da Computação

Universidade Federal de Minas Gerais

Belo Horizonte - Brasil

[email protected]

[email protected]

Taller de Telemedicina e Informática MédicaMérida, Venezuela27 de Abril de 2001

Page 2: Categorización y Recuperación de Información Médica en la Web

2

Tópicos

• Introducción

• Búsqueda de Información Médica

• Categorización de Información Médica

• Sistemas de Recuperación de Información

• medScopio: Un Nuevo Paradigma para Búsqueda de Información Médica

• Conclusiones

• Referencias Bibliográficas

Page 3: Categorización y Recuperación de Información Médica en la Web

Introducción

• Con la expansión de la Internet es cada vez mayor el volumén de información médica disponible en la Web:

– Sítios médicos (ej., Medscape, WebMD, Salutia, etc.);

– Sítios de asociaciones de profesionales médicos (ej., WMA, AMA, AMB, etc.);

– Sítios de organizaciones médicas gubernamentales (ej., OPAS, OMS, etc.)

– Sítios de hospitales y instituciones de investigación médica (Johns Hopkins Hospital, UCLA Medical Center, etc.);

– Bibliotecas médicas digitales (ej., MEDLINE, BIREME, etc.).

Page 4: Categorización y Recuperación de Información Médica en la Web

Introducción

• Herramientas disponibles non son apropiadas para búsqueda de información médica.

• Herramientas genéricas (máquinas de búsqueda y directórios):– Domínio de búsqueda muy amplio;

– Baja precisión de las respuestas;

– Búsqueda limitada a documentos disponibles en la Web;

– Categorización muy genérica (ej., Yahoo!).

• Herramientas especializadas:– Limitan la búsqueda a una base de datos (ej., PubMed) o

utilizam técnicas de meta-búsqueda para acceso a múltiples fuentes (ej., MWSearch, MedNets).

Page 5: Categorización y Recuperación de Información Médica en la Web

Búsqueda de Información MédicaHerramientas Disponibles

• Máquinas de búsqueda genéricas:– Google, TodoBR, AltaVista, TodoCL, Inktomi

• Directórios:– Yahoo!, C@dê?

• Bibliotecas digitales:– MEDLINE (PubMed), BIREME (BVS)

• Sítios de meta-búsqueda:– MWSearch, MedNets, MedMiner

Page 6: Categorización y Recuperación de Información Médica en la Web

Búsqueda de Información MédicaMáquinas de Búsqueda Genéricas

Page 7: Categorización y Recuperación de Información Médica en la Web

Búsqueda de Información MédicaDirectórios: Yahoo!

Page 8: Categorización y Recuperación de Información Médica en la Web

Búsqueda de Información Médica Directórios: Yahoo!

Page 9: Categorización y Recuperación de Información Médica en la Web

Búsqueda de Información Médica Bibliotecas Digitales: PubMed (MEDLINE)

Page 10: Categorización y Recuperación de Información Médica en la Web

Búsquedade Información Médica Sítios de Meta-Búsqueda

Page 11: Categorización y Recuperación de Información Médica en la Web

Búsqueda de Información Médica Sítios de Meta-Búsqueda

Page 12: Categorización y Recuperación de Información Médica en la Web

Búsqueda de Información MédicaRequisitos Deseados

• Acceso integrado a múltiples fuentes de información médica (sítios médicos y bibliotecas médicas).

• Búsqueda por especialidad médica.

• Documentos categorizados y indexados por tópicos (preferencialmente basados en algun vocabulário médico controlado).

• Ambiente de consulta multilingüe y amigable.

• Respuestas ordenadas por critérios de relevancia.

Page 13: Categorización y Recuperación de Información Médica en la Web

Categorización de Información Médica

• Proceso de clasificación de información que utiliza códigos, conceptos y categorias del ambiente médico estandarizados a través de vocabulários controlados.

• Ejemplos de vocabulários controlados: – Medical Subject Headings (MeSH)

– Systematized Nomenclature of Medicine (SNOMED)

– Unified Medical Language System (UMLS)

– International Classification of Diseases (ICD)

– Medical Dictionary for Regulatory Activities (MedDRA)

Page 14: Categorización y Recuperación de Información Médica en la Web

Categorización de Información Médica Modelo HiMeD

• Utilizado para categorización automática de información médica textual de acuerdo con vocabulários controlados como ICD y MeSH.

• Componentes principales:– Vocabulários: Términos Especializados (Ve), Términos Non-

Especializados (Vn) y Categorias (C);

– Diccionários: Sinónimos (S), Siglas (Sg), Términos de Descarte (D) y Variaciones Morfológicas (Mt);

– Grafo de Asignación de Categorias (G);

– Consulta Especializada (Ce);

– Asignación de Categorias (A).

Page 15: Categorización y Recuperación de Información Médica en la Web

Categorización de Información Médica Modelo HiMeD

• Ejemplos de componentes del modelo HiMeD:

– Ve = {“Algida”, “Asiatica”, “Antimonial”, ..., “Cholerae”,

“Cólera”, ..., “Maligna”, “Morbus”, “Petilencial”, ”Vibrio”};

– C = {001, 001.0, 001.1, 001.9, 985, 985.4};

– S = {(“Distúrbio Convulsivo”, “Convulsão”),

(“Sialismo”, “Sialectasia”), ...};

– Sg = {(“ARJ”, “Artrite Reumatóide Juvenil”);

(“AVC”, “Acidente Cerebrovascular”), ...};

– D = {artículos y preposiciones de la lengua portuguesa};

– Mt = {(ção, ções, Sufixo), (fão, fã, Sufixo), ...}.

Page 16: Categorización y Recuperación de Información Médica en la Web

Categorización de Información Médica Modelo HiMeD - Algoritmo de Asinalamiento

Substuir Siglas, Siônimos e Variações Morfológicas

Início caminhar sobre o texto do documento médico Para cada termo lido Faça montar uma janela de tamanho ao redor do termo; Encontrar um caminho completo no índice CID com os termos dentro da janela de tamanho ; Se caminho encontrado, assinalar códigos indicados; Fim Para; Fim.

DocumentoMédico

"O paciente apresentaevidências laboratoriais debexiga neurogênica e de ITUcrônica ... "

"O paciente apresentaevidência laboratorial debexiga neurogênica e deinfecção do trato urináriocrônica ... "

Eliminar Termos deDescartes

"paciente apresenta evidêncialaboratorial bexiganeurogênica infecção do tratourinário crônica ... "

" paciente apresenta evidência laboratorial

bexiga neurogênica

infecção trato urinária crônica ... "

Lista de CódigosAssinaladosordenados

1. 599.02. 344.6

Page 17: Categorización y Recuperación de Información Médica en la Web

Sistemas de Recuperación de InformaciónComponentes Básicos

Page 18: Categorización y Recuperación de Información Médica en la Web

medScopio: Un Nuevo Paradigma para Búsqueda de Información Médica

• Disponible en:

– www.medscopio.com.br

• Características principales:– Acceso integrado a los principales sítios y bibliotecas

médicas disponibles en la Web;

– Más de 11 milliones de documentos categorizados y indexados de acuerdo con términos de la ICD;

– Ambiente de consulta bilingüe;

– Respuestas ordenadas de acuerdo con las más modernas técnicas de recuperación de información.

Page 19: Categorización y Recuperación de Información Médica en la Web

medScopioPágina de Consulta

Page 20: Categorización y Recuperación de Información Médica en la Web

medScopioPágina de Respuesta

Page 21: Categorización y Recuperación de Información Médica en la Web

medScopioRefinamiento de una Consulta

Page 22: Categorización y Recuperación de Información Médica en la Web

medScopio Refinamiento de una Consulta (cont.)

Page 23: Categorización y Recuperación de Información Médica en la Web

Conclusiones

• El volumén de información médica disponible en la Web es cada vez mayor.

• Herramientas de búsqueda disponibles non son apropiadas.

• Necesidad de herramientas que soporten adecuadamente el proceso de búsqueda de información médica.

• medScopio:– acceso integrado a múltiples fuentes de información;

– documentos categorizados de acuerdo con tópicos de la ICD;

– ambiente de consulta biligüe;

– documentos de respuestas ordenados por relevancia.

Page 24: Categorización y Recuperación de Información Médica en la Web

Referencias Bibliograficas

Baeza-Yates, R. and Ribeiro-Neto, B. Modern Information Retrieval. Addison Wesley, Harlow, England, 1999.

Cimino, J.J. Vocabulary and Health Care Information Technology: State of the Art. Journal of American Society for Information Science 46, 10 (1995), 777-782.

Hersh, W.R. Information Retrieval: A Health Care Perspective, Computers and Medicine. Springer-Verlag, New York, 1995.

Lima, L. R. S., Laender, A.H.F. and Ribeiro-Neto, B. A Hierarchical Approach to the Automatic Categorization of Medical Documents. Proceedings of the Seventh ACM International Conference on Information and Knowledge Management, Bethesda, Maryland, 1998, pp. 132-139.

Ribeiro-Neto, B., Laender, A.H.F. and Lima, L.R.S. An Experimental Study in Automatically Categorizing Medical Documents. Journal of the American Sociaty for Information Science and Technology 52, 5 (2001), 391-401.

Page 25: Categorización y Recuperación de Información Médica en la Web

Agradecimientos

• Agradesco la contribución de los demás miembros del equipo de desarrollo del medScopio:– Berthier Ribeiro-Neto

– Luciano Lima

– Hermes de Freitas Junior

– Rodrigo Vale