tecnimap 2010 encuentro buscadores
DESCRIPTION
Encuentro sobre buscadores, geolocalización y contenidos de vídeo en web públicas.A continuación podrá visualizar la presentación que se expuso durante el Encuentro sobre buscadores, geolocalización y contenidos de vídeo en web públicas, que se celebró en la pasada edición Tecnimap 2010. En este encuentro Eptisa Tecnologías de la Información junto con el Ministerio de la Presidencia mostraron el nuevo Buscador de la Administració General del Estado. Otro de los proyectos que se mostró fue Geocultura, realizado por Eptisa TI para el Ministerio de Cultura.TRANSCRIPT
![Page 1: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/1.jpg)
1
Encuentro sobre buscadores, geolocalización y contenidos de
vídeo en webs públicas
Ponentes
MPR, UCIII, MCU, Eptisa
![Page 2: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/2.jpg)
Índice
• Presentación
• Buscadores– Buscadores y GSA
– Elementos a gestionar para una mejor visibilidad (UCIII)– Buscador Federado de la AGE (MPR)– Arquitectura del buscador Federado– Plataforma del Conocimiento– Complementos del Buscador (Widgets y Gadgets)– Novedades GSA 6.X– Aplicaciones OneBox
• Geolocalización– Google Maps
– GeoCultura (MCU)– Integración con otros sistemas GIS
• Contenido de videos en web Públicas– YouTube
– Canal MCU (MCU)– Como crear tu propio canal en YouTube
• Dudas y Preguntas
2
![Page 3: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/3.jpg)
Presentación
3
• Bonifacio Martín Galán
– Vicedecano de la Facultad de Humanidades, Comunicación y Documentación
– Universidad Carlos III de Madrid
• Eduardo Martín Muñoz
– Jefe del Servicio de Difusión Electrónica y Publicaciones
– Subdirección General de Innovación y Programas de Atención al Ciudadano, Ministerio de la Presidencia
• Guillermo Manteca
– Jefe de Área de Información y Documentación
– Sub. Gral. de Publicaciones, Información y Documentación, Ministerio de Cultura
• Alberto García Barrio
– Gerente de Cuenta
– Área de Soluciones Colaborativas Eptisa TI
![Page 4: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/4.jpg)
Presentación Eptisa
4
Fundada en 1956
Más de 50 años de experiencia
100% capital español
Más de 2000 empleados
Más de 200 Millones de euros en 2008
Internacional
Interdisciplinar
Datos Globales
Especializada: GIS Soluciones Colaborativas
Uno de los 5 primeros partners de Google en Europa
Premio al Mejor Partner europeo del 2007
Partner con mas referencias de GSA en España
Datos Unidad de Negocio
![Page 5: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/5.jpg)
5
Encuentro sobre buscadores, geolocalización y contenidos de
vídeo en webs públicas
Buscadores
Ponentes
MPR, UCIII, Eptisa
![Page 6: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/6.jpg)
Buscadores
• Internet
• Empresa:
• Mi Equipo
6
• Búsqueda Universal
Google desktop
![Page 7: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/7.jpg)
Búsqueda según Google
7
Acceso a toda la información
Rendimiento
Relevancia
Presentación
![Page 8: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/8.jpg)
Google Search Appliance
• Google Search Appliance (GSA) es un dispositivo que incluye el hardware y software necesarios para indexar información y permitir realizar búsquedas de forma segura, eficiente y fiable sobre la misma. La información puede provenir de distintas fuentes entre las que se incluyen: Portales, Sistemas de ficheros, Sistemas de gestión documental y Bases de datos.
• Los resultados de búsqueda se encuentran con los mismos criterios de relevancia que han hecho a Google el mejor buscador en Internet
8
![Page 9: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/9.jpg)
Como funciona un buscador
9
Usuario
1: Petición de búsqueda2: GSA busca los resultados más relevantes
en el índice
3: GSA comprueba la
autorización de cada posible resultado, si es
necesario
XML
4: GSA Genera un documento XML con
los resultados
5: Dependiendo de los parámetros de búsqueda, GSA devuelve un documento XML o un documento HTML, mediante la aplicación de una hoja de estilo XSLT
Contenidos
0:Indexación
![Page 10: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/10.jpg)
Elementos para mejorar visibilidad
10
Bonifacio Martín Galán
– Vicedecano de la Facultad de Humanidades, Comunicación y Documentación
– Universidad Carlos III de Madrid
![Page 11: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/11.jpg)
11
Elementos a mejorar para una mejor visibilidad:
Uso de robots.txt y sitemap.xml
Encuentro sobre Buscadores
Bonifacio Martín, Tony Hernández, David Rodríguez, Daniel Peña
Universidad Carlos III de MadridDpto. Biblioteconomía y Documentación
![Page 12: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/12.jpg)
Contexto de la investigación
TECNODOC [ http://tecnodoc.uc3m.es/ ]
• Grupo de investigación de la Universidad Carlos III de Madrid (Dpto. de Biblioteconomía y Documentación) que aborda temas relacionados con las tecnologías web en aspectos tales como la accesibilidad, la usabilidad, los metadatos, la arquitectura de la información, estrategias de posicionamiento, la recuperación de la información y los repositorios de acceso abierto.
• Investigación iniciada a principios del año 2009, hasta la redacción de los resultados obtenidos en verano de ese mismo año.
• El Profesional de la Información, v. 18, n. 6, nov.-dic. 2009, p. 625-630.
12
![Page 13: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/13.jpg)
Ideas iniciales
• Estudiar las relaciones tecnológicas que se establecen entre los motores de búsqueda en Internet y las sedes web de la administración pública a la hora de mejorar el funcionamiento de los primeros y una mayor visibilidad de las segundas.
• Esas relaciones, en el caso que ha ocupado a esta investigación, se establecen a través de la información contenida tanto en los tradicionales ficheros robots.txt y, actualmente, en los ficheros sitemap.xml de las sedes web.
• Los crawlers de los principales motores de búsqueda interaccionan con estos dos ficheros para determinar qué espacios del sitio web pueden o no pueden rastrear y, por tanto, indexar los documentos en sus bases de datos. Visibilidad de los sitios web.
13
![Page 14: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/14.jpg)
El fichero robots.txt
• La forma más básica de pasarle información a un crawler es a través de las etiquetas META de HTML.
• Sin embargo, una opción más genérica, al alcance sólo de los administradores de sitios web, es el uso de este fichero. Definido mediante un estándar de facto desde 1994, The Robots Exclusion Protocol (REP) [ http://www.robotstxt.org/ ].
• Consiste en un fichero de texto plano, ubicado en el directorio raíz de cada sitio web y de estructura muy sencilla:
– Una o más líneas con la palabra User-agent seguido de dos puntos y un valor: un asterisco (si se aplica a todos los crawlers) o el nombre del crawler.
– Una o más líneas con la palabra Disallow seguido de dos puntos y el nombre de los directorios y ficheros a los que no quiere que el crawler acceda.
• REP extendido: otras directivas como Allow, Visit-time, Crawl-delay, etc.
14
![Page 15: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/15.jpg)
El fichero robots.txt
• Algunos ejemplos:
15
Ejemplo 1 Ejemplo 2 Ejemplo 2
User-agent: *Disallow: /cgi-bin/Disallow: /tmp/
User-agent: *Disallow: /cgi-bin/User-agent: googlebotDisallow: /videos/
User-agent: yahooseekerUser-agent: slurpDisallow: /links.html
![Page 16: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/16.jpg)
El fichero sitemap.xml
• En febrero de 2008, Google, Yahoo y Microsoft deciden adoptar un protocolo común: XML Sitemaps Protocol o, simplemente, Sitemaps, para indicar con más detalles qué contenidos de un sitio deben ser rastreados por un crawler.
• De acuerdo con Sitemaps.org [ http://www.sitemaps.org/ ], “un sitemap, en su forma más sencilla, es un archivo XML que enumera las URL de un sitio junto con metadatos adicionales acerca de cada una de ellas: la última actualización, frecuencia de modificación e importancia en relación con las demás URL del sitio.”
• Un fichero sitemap puede contener los datos concretos de las páginas de un sitio, o bien, ser un índice a distintos ficheros sitemap (sitemap index).
16
![Page 17: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/17.jpg)
El fichero sitemap.xml
• Sitemap básico: Índice de sitemaps:
17
Ejemplo 1
<?xml version="1.0" encoding="UTF-8"?><urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>http://www.example.com/</loc> <lastmod>2005-01-01</lastmod> <changefreq>monthly</changefreq> <priority>0.8</priority> </url> <url> <loc>http://www.example.com/catalog?item=12&desc=vacation_hawaii</loc> <changefreq>weekly</changefreq> </url> <url> <loc>http://www.example.com/catalog?item=73&desc=vacation_new_zealand</loc> <lastmod>2004-12-23</lastmod> <changefreq>weekly</changefreq> </url> <url></url></urlset>
Ejemplo 2
<?xml version="1.0" encoding="UTF-8"?><sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <sitemap> <loc>http://www.example.com/sitemap1.xml.gz</loc> <lastmod>2004-10-01T18:23:17+00:00</lastmod> </sitemap> <sitemap> <loc>http://www.example.com/sitemap2.xml.gz</loc> <lastmod>2005-01-01</lastmod> </sitemap></sitemapindex>
![Page 18: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/18.jpg)
La investigación: obtención de datos
• Objetivo principal: observar el uso que hacen los principales sitios webs de la administración española de los ficheros robots.txt y de los sitemap para optimizar el acceso de los crawler de los mismos y analizar los resultados obtenidos.
• Partiendo del sitio web 060.es [ http://www.060.es/ ] se localizaron los principales sitios webs de la administración española: 4108 sitios web distintos. Un programa propio se encargaba de descargar los ficheros robots.txt y los ficheros sitemap.xml (y derivados) del directorio raíz de cada sitio.
• Los ficheros robots.txt fueron sometidos a un análisis sintáctico a través de una aplicación en línea [ http://www.sxw.org.uk/computing/robots/check.html ].
• los ficheros sitemap.xml fueron igualmente tratados por un validador XML en línea [ http://schneegans.de/sv/ ].
18
![Page 19: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/19.jpg)
La investigación: resultados obtenidos
• De los 4108 sitios web analizados, tan solo 715 sitios (17,40%) incluyen un fichero robots.txt válido, y apenas 130 sitios distintos (3,16%) ofrecieron una respuesta válida a la solicitud de sitemaps.
19
![Page 20: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/20.jpg)
La investigación: resultados obtenidos
• Sobre los ficheros robots.txt:
– Los campos incluidos y su frecuencia de aparición:
20
![Page 21: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/21.jpg)
La investigación: resultados obtenidos
• Sobre los ficheros robots.txt:
– De los 715 ficheros, el analizador sintáctico devolvió un total de 1.995 irregularidades: 705 errores y 1276 advertencias:
• Los principales errores se encontraban en la no definición de ningún agente de usuario, nombres de campos en mayúsculas, líneas no reconocidas e inclusión de espacios en blanco.
• Las principales advertencias devueltas hacían referencia a la no inclusión de rutas absolutas, espacios en blanco en dichas rutas, nombres de campos no reconocidos, asteriscos en campos distintos al “User-agent “ o uso de la directiva “Allow” (no soportada por todos los crawlers).
– En el caso del campo User-agent el valor más repetido es una única aparición por fichero. Sin embargo, encontramos cifras sorprendentes que superan la centena de definiciones por fichero (caso de la Diputación de Teruel - http://www.dpteruel.es/robots.txt - ):
• Como era de esperar, el valor más repetido para el campo User-agent es el asterisco (casi en un 90%).
• La lista de crawlers referenciados es muy extensa: encontramos referencias a 344 robots distintos (Googlebot -2%-, Googlebot-Image -1%- y psbot – 0,8%-).
21
![Page 22: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/22.jpg)
La investigación: resultados obtenidos
• Sobre los ficheros sitemap.xml:
– De los 4.108 sitios analizados, 657 sitios distintos ofrecieron una respuesta a la solicitud de alguna de las versiones de fichero en los que se podría encontrar un sitemap o un sitemap_index, con un total de 3.145 ficheros descargados (sitemap.xml, sitemap.gz, sitemap.xml.gz, sitemap_index.xml, sitemap_index.gz y sitemap_index.xml.gz).
– Sin embargo, muchos eran “falsos positivos” pues en realidad sólo 130 eran ficheros con marcado XML (bien directamente como .xml, bien en formato comprimido .gz; bien sitemap o bien sitemap_index), encontrándose repartidos en 104 sitios distintos.
– En la gran mayoría de los casos, los sitemaps encontrados son ficheros básicos, en los que se referencian el contenido de los sitios a ser indexado por los motores de búsqueda, siendo escaso el uso de archivos de índice de sitemaps (14,6%).
– En general, escaso nivel de detalle. Destacable, sin embargo, otros, como el Web del Ayuntamiento de San Sebastián [ http://www.donostia.org/sitemap.xml ]
22
![Page 23: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/23.jpg)
La investigación: conclusiones
• Escasa atención por parte de las administraciones públicas de nuestro país a estos temas tan importantes: de los más de 4.000 mil sitios web analizados tan sólo un 17% de ellos incluían un fichero robots.txt válido (frente a un uso, por ejemplo, de más del 44% en Estados Unidos en el sector gubernamental) y apenas un 3% del total incluían el fichero sitemap.xml.
• El 98’60% de los sitios declara directivas para excluir de la indexación ciertos directorios a todos los motores (*). Se aplican directivas concretas a algunos crawler (mucha variedad), siendo los más citados Googlebot (112 veces) y Googlebot-Image (54 veces).
• Resulta sorprendente también el alto número de sitios (421, un 58’88%) que utilizan como criterio de exclusión (Disallow) el directorio raíz de un sitio ( / ), es decir, que el crawler no indexe nada y, por tanto, que sus contenidos no sean accesibles a través del motor de búsqueda.
• El uso de sitemaps es indicador del grado de actualización tecnológica de los sitios web. También aquí, los sitios web de la administración española que contienen sitemaps, un 3’16% del total, se encuentran por debajo de la media internacional, un 6’3%.
23
![Page 24: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/24.jpg)
robots.txt y sitemap.xml
¡GRACIAS POR SU ATENCIÓN!
Bonifacio Martín, Tony Hernández, David Rodríguez, Daniel Peña
Universidad Carlos III de Madrid – Dpto. Biblioteconomía y Documentación
24
![Page 25: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/25.jpg)
Buscador Federado AGE
25
• Eduardo Martín Muñoz
– Jefe del Servicio de Difusión Electrónica y Publicaciones
– Subdirección General de Innovación y Programas de Atención al Ciudadano
– Dirección General para el impulso de la administración electrónica
– Ministerio de la Presidencia
![Page 26: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/26.jpg)
Buscador Federado AGE
• Acuerdo para impulsar el desarrollo de un nuevo modelo para las relaciones entre los ciudadanos y la Administración Pública.
• Red 060. Resolución 19-07-05 de la Secretaría General para la Administración Pública, Acuerdo del Consejo de Ministros del 15-07-05, de implantación de la Red de Oficinas Integradas de Atención al Ciudadano. (BOE 3 agosto 2005)
• Principios:
– El uso intensivo de la información para posibilitar instrumentos compartidos de servicio al ciudadano.
– Asegurar una oferta creciente de servicios normalizados de atención e información en la que participen la totalidad de ministerios y organismos.
26
![Page 27: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/27.jpg)
Buscador Federado AGE
• Objetivos Buscador– Buscador federado de localización de información en la
Red 060 y otros Organismos Afiliados
– Espíritu de universalidad: convertirse en el buscador de referencia de información sobre Administración Pública en España
– Federación: Completa personalización e integración para los Organismos Afiliados
27
![Page 28: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/28.jpg)
Buscador Federado AGE
• Como conseguir los objetivos– Un potente motor de búsqueda:
• Con capacidad de indexar toda la información de los portales de las AAPP
• Con un interfaz sencillo y familiar
• Con excelente calidad de resultados
– Una plataforma de conocimiento que permita saber qué buscan los ciudadanos, para adaptar la respuesta a sus necesidades
– Un modelo de federación flexible y adaptable a las necesidades de los diferentes organismos afiliados
28
![Page 29: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/29.jpg)
Buscador Federado AGE
• Calidad y ranking
• Resúmenes dinámicos de página
• Agrupación de resultados
• Corrector ortográfico automático
• Páginas almacenadas en caché
• Términos de consulta resaltados
• Visualizar como HTML
• Ordenar por fecha
• Búsqueda booleana avanzada
29
Toda la potencia de búsqueda de Google a disposición del portal 060 y los Organismos Afiliados, completamente personalizable
• Motor de Búsqueda (Google Search Appliance)
![Page 30: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/30.jpg)
Buscador Federado AGE
Modelo de Afiliación con las AA.PP• “El buscador de todos, y el de cada uno”
– Posibilidad de utilizar como buscador Principal sobre Contenidos Propios de otras AA.PP.:
• Personalizable
• Completamente integrado
• Con posibilidad de ofrecer resultados de otras AA.PP.
– Autonomía de decisión para enlaces patrocinados, definición de sinónimos, y demás funciones de presentación
– Mínimo esfuerzo de integración y administración para los Organismos Afiliados (personal técnico de Eptisa TI de apoyo durante todo el contrato)
30
![Page 31: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/31.jpg)
Buscador Federado AGE
• 173 portales y sedes electrónicas indexadas• Organismos Afiliados:
– Ministerio de la Presidencia
– Ministerio de Política Territorial
– Ministerio de Trabajo e Inmigración
– Ministerio de Sanidad y Política Social
– Ministerio de Igualdad
– Ministerio de Defensa
– Ministerio del Interior
– Ministerio de Industria, Turismo y Comercio
– Observatorio de la Administración electrónica
31
![Page 32: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/32.jpg)
Buscador Federado AGE
• Dos formas de acceder al Buscador de la AGE:– www.060.es
– Buscador.gob.es
32
![Page 33: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/33.jpg)
Buscador Federado AGE
• Mantenimiento Evolutivo 2010– Mantenimiento sistema
– Afiliación de 10 nuevos organismos
– Consultor SEO para mejorar la relevancia de los contenidos tanto en el buscador de la AGE como en Internet
33
![Page 34: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/34.jpg)
Buscador Federado AGE - Arquitectura
34
Clúster GSA
Clúster Servidor Aplicaciones
Servidor Aplicaciones
OOAA 1
Servidor Web OOAA 2
Servidor Aplicaciones
OOAA N
![Page 35: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/35.jpg)
Arquitectura - Integración
• Dos formas de integración con Organismos Afiliados– Proxy Inverso
35
2: buscador.060.es/search?q=TERMINO
4:
1:www.060.es/buscador?q=TERMINO
3: HTML
Servidor Web OO.AA.Proxy inverso
![Page 36: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/36.jpg)
Arquitectura - Integración
36
• Dos formas de integración con Organismos Afiliados– Servidor de Aplicaciones
24
1
3: XML
ASPASP.NETJSPSTRUTSPHP…
Servidor Aplicaciones OO.AA.
![Page 37: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/37.jpg)
Plataforma del conocimiento
• Aplicación web que permite a los responsables del AGE y de cada ministerio consultar el cuadro de mando y los informes de las búsquedas realizadas por los usuarios
37
• Herramienta para conocer las necesidades y demandas de los usuarios
• Permite suscripción para recibir los informes directamente por correo
• Herramienta imprescindible para mejorar cualquier sistema de búsquedas
![Page 38: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/38.jpg)
Plataforma del conocimiento
• Búsquedas más frecuentes• Búsquedas sin resultado• Búsquedas sin clicks• Click por posición• Documentos más visitados y consulta
realizada• Búsquedas por Idioma• Búsquedas por Categorías• Búsquedas por Día• Búsquedas por Hora• Datos generales:
– Total consultas– Total clicks– Visitas a cache– Porcentaje de búsqueda con paginación– Porcentaje de búsquedas avanzadas
38
![Page 39: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/39.jpg)
Complementos del Buscador
• Widgets y Gadgets que permiten integrar el buscador AGE en:
39
– Combo Búsqueda del Navegador (IE, Firefox)
– Google Toolbar
– Pagina de inicio de Google
– Google Desktop
– Barra lateral del Windows Vista
– Barra lateral Yahoo
![Page 40: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/40.jpg)
Mejoras GSA 6.0
40
Simply scale to billions of docs• Dynamic scalability• GSA-to-GSA Unification• Introducing GB-9009, 30M docs in 5U form• GB-7007 platform from 500k to 10M docs
Powerful customization• Introducing early-binding security• Batch authorization on SAML API• Collection and Node biasing• Results ranking framework• Search box for Google Sites and SharePoint• Administrative API
Highest quality search results• Google suggest for Enterprise• User added results & language bundles
GSA 6.0 – El mayor lanzamiento desde la original
JUNIO 2009
12 Nuevas Mejoras
![Page 41: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/41.jpg)
Mejoras GSA 6.2
14 Nuevas Mejoras
41
Rigid Access Control for Complex Deploymentso Universal Login for Heterogeneous Security Systemso Support for multiple cookie domainso Support for multiple identities in SAML SPI
Search Relevance Improves Automaticallyo Self-learning Scorero Composite Collectionso Advanced Language Phrase Segmenting
Expanded Connectivityo Native Integration with SharePointo Expanded File Share support (Labs)o Expanded Database support (Labs)o Lotus Notes (Labs)
Improved Performance and Redundancyo 10x indexing performance improvement for SharePointo 3-5x indexing performance improvement for other ECMso GSA Mirroring for performance or high availabilityo Real-time Diagnostics
![Page 42: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/42.jpg)
Mejoras GSA 6.X
• Auto aprendizaje en la relevancia (Self-Learning Scorer )
42
Mecanismo de aprendizaje para mejorar automáticamente los resultados de búsqueda, sin necesidad de intervención de los administradores
![Page 43: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/43.jpg)
Mejoras GSA 6.X
• API de Administración– Permite automatizar las tareas comunes para que los
usuarios puedan auto gestionar dichas tareas.– XML-based Gdata APIs para todas las funcionalidades
administrativas– Posibilidad de gestionar una GSA o una red de GSAs
unificadas
43
![Page 44: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/44.jpg)
Mejoras GSA 6.X
• Sugerencias de Búsqueda– Basadas en las búsquedas de los usuarios y el contenido empresarial
44
![Page 45: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/45.jpg)
Mejoras GSA 6.X
• GSA Mirroring: replicación del índice en tiempo real
45
Real-time
WebDatabases
People
![Page 46: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/46.jpg)
Aplicaciones One-Box
• La búsqueda como punto de acceso único
• Permite enlazar con cualquier otra aplicación en tiempo real
46
Acceso a la información de negocio en tiempo real
![Page 47: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/47.jpg)
Aplicaciones OneBox
47
• Ejemplos:
![Page 48: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/48.jpg)
48
Encuentro sobre buscadores, geolocalización y contenidos de
vídeo en webs públicas
Geolocalización
Ponentes
Ministerio de Cultura, Eptisa
![Page 49: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/49.jpg)
Google Maps
• Servicio web de Google que ofrece un mapa cartográfico, más un conjunto de APIs y servicios para crear aplicaciones GIS
49
![Page 50: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/50.jpg)
Google Maps – Street View
• Vista panorámica de 360º y 290º a pie de calle
50
• España es el segundo país con mas cobertura 80%
![Page 51: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/51.jpg)
Google Maps – Calculo de rutas
• Calculo de rutas en coche y pie (cartografía TeleAtlas)• Integrado con StreetView
51
![Page 52: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/52.jpg)
Google Maps – Otras APIs y servicios
• API de geocodificación de direcciones: permite obtener las coordenadas geográficas de nuestras oficinas o recursos sobre el mapa en base a su dirección
• API especial para dispositivos móviles: permite obtener tu posición actual (vía GPS, IP o Redes Wi-Fi)
• API local Search: permite localizar negocios o servicios situados cerca de la posición geográfica que se le indique
• Elevation Web Services: servicio que nos devuelve la elevación de un punto
52
![Page 53: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/53.jpg)
Google Maps – Local Business Center
• ¿ Cómo agrego los datos de mi empresa o servicios en Google Maps ?
• Utilice Local Business Center para crear tu propio directorio de empresas y sedes.
• Servicio gratuito
• Permite añadir tus datos (dirección, horario, teléfono, web, foto, video,…)
• www.google.es/localbusinesscenter
53
![Page 54: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/54.jpg)
Geocultura
54
Guillermo Manteca González
– Jefe de Área de Información y Documentación
– Sub. Gral. de Publicaciones, Información y Documentación
– Ministerio de Cultura
![Page 55: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/55.jpg)
55
El Proyecto Geocultura del Ministerio de Cultura
Encuentro sobre buscadores, geolocalización y contenidos de
vídeo en webs públicas
Guillermo Manteca González
Ministerio de Cultura
![Page 56: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/56.jpg)
ÍNDICE
• El contexto• Respondiendo a una necesidad• Datos Fundamentales• Conclusión
56
![Page 57: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/57.jpg)
Geocultura: el contexto
• Cultura: una competencia descentralizada.• Dispersión geográfica de las Sedes Culturales
– Museos– Archivos– Bibliotecas Públicas– Bienes declarados Patrimonio Mundial por la UNESCO– Centros artísticos del INAEM – Salas de exposiciones, – etc…
…necesidad de ofrecer al ciudadano información sobre Sedes y sus localizaciones.
57
![Page 58: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/58.jpg)
Geocultura: respondiendo a una necesidad
• Proyecto del Ministerio de Cultura – Objetivo: Ofrecer a los usuarios información de sedes culturales,
mostrando su situación sobre un mapa (Google Maps)– www.geocultura.es
58
![Page 59: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/59.jpg)
59
Selección tipos de elementos a
mostrar
Pop-up al pinchar sobre un
elemento
Localización por dirección o denominación
Nombre del Elemento al
pasar el cursor sobre el punto
Resultados de las
localizaciones
Geocultura: respondiendo a una necesidad
![Page 60: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/60.jpg)
60
Geocultura: respondiendo a una necesidad
Agrupación de elementos por escalas
Zonas
Municipios
En Detalle
![Page 61: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/61.jpg)
Versión accesiblepermite localizar las sedes y obtener información de las mismas sin mapa
61
Geocultura: respondiendo a una necesidad
![Page 62: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/62.jpg)
Geocultura: datos fundamentales
• Lanzamiento en 2008• Proporciona información sobre:
– 22 Museos estatales y 1.400 Museos en toda España– 453 Archivos– 5.000 Bibliotecas Públicas– 41 bienes españoles declarados Patrimonio Mundial por la
UNESCO
62
![Page 63: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/63.jpg)
Conclusiones
• Aprovechamiento de la popularidad de Google Maps como adelanto en la “curva de aprendizaje”.
• Añade atractivo a la página web del MCU.• Acogida favorable por parte de usuarios e instituciones.• Importancia de la mejora continua:
– Incorporación Street View
– “Cómo llegar”
– Integración con la Agenda Cultural
– …
63
![Page 64: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/64.jpg)
Geocultura
• http://www.geocultura.es
64
![Page 65: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/65.jpg)
Google Maps - Posibilidades
• Infinitas posibilidades, algunos ejemplos:– Mapas de situación de sedes, oficinas, recursos turísticos…
– Comunicar eventos o incidencias georeferenciadas
– Seguimiento de móviles (flotas de vehículos, trenes, aviones, equipos de trabajo)
– Seguridad ciudadana: seguimiento de transporte de mercancías peligrosas, localización de accidentes y recursos disponibles
– Recogida de notificaciones geoposicionadas, donde los usuarios puedan dar de alta sobre el mapa incidencias, quejas, sugerencias, pudiendo incluir fotos o videos . Integración perfecta con dispositivos con GPS, cámara de fotos y video ( iPod, Android, …)
– Realidad aumentada: la combinación de dispositivos móviles con GPS abren la puerta a servicios que añaden información en función de nuestra posición y lo que estamos viendo (orientación)
65
![Page 66: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/66.jpg)
Integración con otros sistemas GIS
• Como consumidor de datos de otros sistemas o servicios GIS
– Google maps permite cargar directamente datos en los siguientes formatos
• KML o KMZ
• GeoRSS
• Servicios WMS
• Como capa base que es consumida por otros sistemas GIS
– Librerías o Clientes Web (API de ArcGIS Server, OpenLayers, Adobe Flash, etc…)
– Prácticamente todos los clientes Desktop pueden cargar la capa de GoogleMaps (ArcGIS Desktop,…)
66
![Page 67: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/67.jpg)
67
Encuentro sobre buscadores, geolocalización y contenidos de
vídeo en webs públicas
Video en Webs públicas
Ponentes
Ministerio de Cultura, Eptisa
![Page 68: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/68.jpg)
YouTube
• Medio que permite a personas y organizaciones compartir y publicar videos
• Primer sitio de entretenimiento en Internet
• Cuarto sitio mas visitado en España
• 300 M usuarios en el último mes
• Muy intuitivo y usable
• Permite interactuar con los usuario (valoraciones y comentarios)
68
![Page 69: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/69.jpg)
YouTube - Beneficios
• Beneficios para la empresa:– Reproducción de horas de video a coste cero– Almacenaje de videos a coste cero– Videos pueden ser embebidos en la pagina web de la empresa– Capacidad de llegar a + 300M de usuarios– Segmentación muy amplia (genero, edad, clase social y
habitad)– Desarrollo de campañas de publicidad– Distribución y sindicación a través del móvil, la web y la TV– Permite (si se desea) el feelback de los usuarios– Herramienta de análisis (youTube Insighy) para conocer y
adaptarse a las demandas de los usuarios
![Page 70: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/70.jpg)
Canal MCU
70
Guillermo Manteca González
– Jefe de Área de Información y Documentación
– Sub. Gral. de Publicaciones, Información y Documentación
– Ministerio de Cultura
![Page 71: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/71.jpg)
71
El canal corporativo en Youtube “CanalMCU” del Ministerio de
Cultura
Encuentro sobre buscadores, geolocalización y contenidos de
vídeo en webs públicas
Guillermo Manteca González
Ministerio de Cultura
![Page 72: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/72.jpg)
CanalMCU: el contexto
72
• MCU: custodia una ingente información audiovisual.– Exposiciones– Obras escénicas– Congresos– Comunicación institucional– (…)
• Inviabilidad de la publicación en la Web MCU…
… necesidad de un canal adecuado para su difusión
![Page 73: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/73.jpg)
CanalMCU: respondiendo a una necesidad.
• Canal corporativo en Youtube con las funcionalidades habituales en esta plataforma:– Comentarios
– Listas de reproducción
– Suscripciones
– (…)
• Objetivos:– Divulgar la actividad del Ministerio
– Atraer visitantes a la web
– Presencia en un canal que crece exponencialmente
73
![Page 74: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/74.jpg)
Canal MCU: Datos fundamentales
74
Suscriptores y vídeos subidos del canal (enero-abril 2010)
40
18
79
26
99
33
128
42
0
20
40
60
80
100
120
140
enero febrero marzo abril
Suscriptores Vídeos subidos
![Page 75: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/75.jpg)
Conclusiones
• Como en el caso de Google Maps, la popularidad de la plataforma Youtube motiva un adelanto en la “curva de aprendizaje”.
• Se posiciona al Ministerio de Cultura en un sector de crecimiento exponencial en la web.
• Importancia de las suscripciones: CanalMCU como “banderín de enganche”.
• Paso adelante en la implantación de soluciones “2.0.”
75
![Page 76: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/76.jpg)
Canal MCU
• http://www.youtube.es/canalmcu
76
![Page 77: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/77.jpg)
YouTube- Tipo de Canales
• Canal de Usuarios – No permite personalización, ni identidad corporativa– Incluye publicidad de terceros
• Canal Patrocinado (Branded channel)– Permite personalizar el look & feel, incluido un banner
de encabezamiento con link a tu web– Sin publicidad de terceros– Dispones de un “Branding box” para mostrar tu propio
mensaje publicitario bajo el video destacado– Paginas de visionado de videos personalizadas con tu
banner
![Page 78: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/78.jpg)
YouTube – Canales Patrocinados
• Ejércitowww.youtube.com/todosoldados
• Universidad Politécnica de Madridwww.youtube.com/upm
• Tecnimap 2010www.youtube.com/user/tecnimap2010
![Page 79: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/79.jpg)
YouTube - Canal Patrocinado
• Un Canal Patrocinado no tiene ningún coste adicional, sólo se ha de realizar una inversión mínima de 25.000€ en Google Display Ads con el fin de promocionar el canal durante 3 meses
• Esos 25.000€ son destinados a mejorar la visibilidad y atraer tráfico al canal para crear una comunidad entorno a la marca, a través de publicidad en YouTube (en cualquiera de sus formatos)
![Page 80: Tecnimap 2010 Encuentro Buscadores](https://reader034.vdocuments.co/reader034/viewer/2022052506/5571f42149795947648f0e82/html5/thumbnails/80.jpg)
YouTube - Como crear tu propio canal
www.youtube.com/advertise
80