yahoo | búsquedas: su uso para diseñar un mejor sitio
DESCRIPTION
TRANSCRIPT
![Page 1: Yahoo | Búsquedas: su uso para diseñar un mejor sitio](https://reader034.vdocuments.co/reader034/viewer/2022051817/548254dcb479590f0d8b4717/html5/thumbnails/1.jpg)
2
Cómo saber qué quieren las personas a través de las búsquedas y
su impacto en el diseño de sitios Web
Ricardo Baeza Yates
VP, Yahoo! Research
Barcelona, España & Santiago, Chile
3
Agenda
�Introducción
�Conceptos de Diseño de Sitios Web
�Plataforma SearchMonkey de Yahoo!
�Diseño dirigido por el Usuario
�Minería Web�Optimizando un Sitio�Minería de Consultas
![Page 2: Yahoo | Búsquedas: su uso para diseñar un mejor sitio](https://reader034.vdocuments.co/reader034/viewer/2022051817/548254dcb479590f0d8b4717/html5/thumbnails/2.jpg)
Desafíos en la Web
11
Entendiendo la Web
• El repositorio público de datos más grande que existe
(¿más de 12 mil millones de páginas estáticas?)
• Hoy hay más de 176 millones de servidores Web
(49% Apache, 36% Microsoft)
• Red altamente conectada con distribución de Zipf en los
enlaces y en muchas otras medidas
Log
Log
x –�
Auto-similar &
Auto-organizada
![Page 3: Yahoo | Búsquedas: su uso para diseñar un mejor sitio](https://reader034.vdocuments.co/reader034/viewer/2022051817/548254dcb479590f0d8b4717/html5/thumbnails/3.jpg)
12
Tendencias
• Web 2.0, redes sociales
– Fragmentación de la propiedad del contenido– Fragmentación del acceso (visitas, tema)– Fragmentación del permiso de acceso
• Incremento de la Web semántica
– RDF, microformatos, metadatos en general
• Aumento de la publicidad en Internet asociada a búsquedas
Web 2.0 en Yahoo!
• Yahoo! Groups 8 millones,, 1 de cada 10 usuarios
• Del.icio.us 2 millones de usuarios
• Flickr 1 million de fotos al día
• Yahoo! Respuestas 100M usuarios únicos,, 250M respuestas
• Messenger 85M usuarios únicos
Sitios sociales tuvieron 115M visitantes únicos, 56M “menores de 35”.
(datos del 2007)
![Page 4: Yahoo | Búsquedas: su uso para diseñar un mejor sitio](https://reader034.vdocuments.co/reader034/viewer/2022051817/548254dcb479590f0d8b4717/html5/thumbnails/4.jpg)
Publicidad
2011
2007
2012
2011
15
Las Diferentes Facetas de la Web
![Page 5: Yahoo | Búsquedas: su uso para diseñar un mejor sitio](https://reader034.vdocuments.co/reader034/viewer/2022051817/548254dcb479590f0d8b4717/html5/thumbnails/5.jpg)
16
La Estructura de la Web
17
La Persona tras la Consulta
![Page 6: Yahoo | Búsquedas: su uso para diseñar un mejor sitio](https://reader034.vdocuments.co/reader034/viewer/2022051817/548254dcb479590f0d8b4717/html5/thumbnails/6.jpg)
18
Consultas en la Web
�Diversidad cultural, educacional y geográfica
�Consultas cortas, interacción impaciente
� pocas consultas & pocas respuestas vistas
�Vocabulario diferente y menos extenso
�Diferentes objetivos (Broder, 2000):
�Necesidad informacional
�Necesidad navigacional
�Necesidad transaccional
�Refinada por Rose & Levinson, WWW 2004
19
Necesidades de las Personas
• Necesidad (Broder 2002)
– Informacional – queremos aprender acerca de algo (~40% / 65%)
– Navegacional – queremos ir a un sitio (~25% / 15%)
– Transaccional – queremos hacer algo (web-mediated) (~35% / 20%)
• Acceder a un servicio
• Descargar
• Comprar
– Ambiguedades
• Encontrar una lista de páginas
• Búsqueda exploratoria
hemoglobina baja
El País
Clima Barcelona
Imágenes de la luna
Canon S410
alquiler coches Chile
![Page 7: Yahoo | Búsquedas: su uso para diseñar un mejor sitio](https://reader034.vdocuments.co/reader034/viewer/2022051817/548254dcb479590f0d8b4717/html5/thumbnails/7.jpg)
Objetivos de un Sitio Web
• Generar visitas y fidelidad
• Estar en la Web
• Diseñar para las personas y los buscadores
• Explotar publicidad dirigida y eficiente
– Diferentes modelos: CPM, CPC
– Diferentes lugares: búsqueda, contexto
Dos Puntos de Vista
• La Persona
– Diseñador
– Usuario
• El Computador
– Buscador
– Agente de software
– Herramienta de usosintaxis
semántica
persona
software
contenido
software
persona
![Page 8: Yahoo | Búsquedas: su uso para diseñar un mejor sitio](https://reader034.vdocuments.co/reader034/viewer/2022051817/548254dcb479590f0d8b4717/html5/thumbnails/8.jpg)
Un Modelo Causal
Buscador
Persona
Usando el Sentido Común
Los cinco pasos causales en un sitio Web:
• Buscabilidad
• Visibilidad y accesibilidad
• Contenido
• Estética
• Fidelidad
Encuéntrame, descárgame y úsame.
Déjate luego seducir y vuelve a mí una y otra vez.
Yo por mi parte usaré mucho, mucho sentido común
y trataré de sorprenderte cada día.
Ubicuidad
UsabilidadArquitectura
![Page 9: Yahoo | Búsquedas: su uso para diseñar un mejor sitio](https://reader034.vdocuments.co/reader034/viewer/2022051817/548254dcb479590f0d8b4717/html5/thumbnails/9.jpg)
Arquitectura: Ser
Ubicuidad: Estar
Usabilidad: Servir
Buscabilidad
Visibilidad
Contenido
Estética
Fidelidad
(crear hábito)
Ubicuidad (Buscadores)
Un gran porcentaje de las visitas a un sitio
proviene de buscadores, entonces:
• ¿Encontrará mi sitio un buscador?
– No, si no ha registrado su sitio o si no posee
un enlace desde un sitio conocido
• ¿Pongo trabas a los buscadores?
– Si, si uso mal Flash, Javascript u otras
herramientas que no permiten extraer los
enlaces hacia páginas internas
![Page 10: Yahoo | Búsquedas: su uso para diseñar un mejor sitio](https://reader034.vdocuments.co/reader034/viewer/2022051817/548254dcb479590f0d8b4717/html5/thumbnails/10.jpg)
Sitios Impenetrables
Se puede esgrimir la excusa de la ignorancia,
pero hay casos en que esto es imperdonable:
• Las empresas de TI no pueden apelar a la
excusa de ser ignorantes
• Sitios de gobierno
• Las empresas donde la información es uno de sus valores fundamentales.
• España: 30% de 300 mil sitios (2005)
¡Y sin mencionar las empresas de
información que no tienen sitio Web!
Buscabilidad (Personas)
• ¿Tengo el texto correcto en mi página
principal? ¿Puedo encontrar mi sitio
imaginando que palabras usarán mis clientes?
• ¿Queda mi sitio bien ubicado en una
búsqueda?
– Si la respuesta es no, consiga enlaces desde
otros sitios y mejore sus metadatos (para
cuando se usen)
– Busque los enlaces a que tiene su sitio
![Page 11: Yahoo | Búsquedas: su uso para diseñar un mejor sitio](https://reader034.vdocuments.co/reader034/viewer/2022051817/548254dcb479590f0d8b4717/html5/thumbnails/11.jpg)
37
Visibilidad (Personas)
• ¿Es su diseño compatible con todos los
navegadores o usted supone que todo el
mundo usa Explorer y Windows?
• ¿Es su sitio liviano?
• ¿Es su HTML complicado o usa
herramientas de diseño sofisticadas?
download + rendering time
![Page 12: Yahoo | Búsquedas: su uso para diseñar un mejor sitio](https://reader034.vdocuments.co/reader034/viewer/2022051817/548254dcb479590f0d8b4717/html5/thumbnails/12.jpg)
Accesibilidad
• ¿Considera su sitio alternativas para
personas con discapacidades visuales o le
da lo mismo?
• Existen normativas, fáciles de seguir, que
permiten la creación de páginas web
accesibles para todos
• WAI, Web Accessibility Initiative,
http://w3c.org/WAI/
• Recuerde que los crawlers son ciegos!
Contenido
• Su sitio debe tener algún interés si la
persona ha llegado hasta aquí
– elementos legibles y comprensibles
– coherencia de la navegación y
– de la funcionalidad en todas las páginas.
• La semántica del contenido debe responder
a la pregunta ¿cuál es mi audiencia
objetivo?
![Page 13: Yahoo | Búsquedas: su uso para diseñar un mejor sitio](https://reader034.vdocuments.co/reader034/viewer/2022051817/548254dcb479590f0d8b4717/html5/thumbnails/13.jpg)
• ¿Es su prosa asequible a todo el mundo?
• ¿Es el idioma usado una barrera para sus
clientes?
• ¿Tenemos las palabras con que nos buscarán?
• Sea humilde: nadie sabe que quieren sus
clientes (además cambia en el tiempo)
Contenido
Estética
• Su diseño gráfico debe ser bonito pero sin
sacrificar los puntos anteriores
– Esto significa cosas obvias como no usar
fondos que afecten la legibilidad o recargar
la página con elementos distractivos
• El diseño gráfico debe ser elegante y
simple, pero también puede ser feo y
funcional
![Page 14: Yahoo | Búsquedas: su uso para diseñar un mejor sitio](https://reader034.vdocuments.co/reader034/viewer/2022051817/548254dcb479590f0d8b4717/html5/thumbnails/14.jpg)
Fidelidad
• Su sitio ha sido usado, ¿pero volverá esta
persona a él?
– contenido o servicio que se necesite en
forma periódica
– que sea adictivo en el buen sentido de la
palabra
– que genere una comunidad virtual de
personas con intereses comunes
• Es el desafío más difícil:
el de la seducción permanente
Mejorar el Acceso a los Contenidos
• Search Monkey (Yahoo!)
– Motivar a los proveedores de contenido a
mejorar sus resultados en los buscadores y
por ende la satisfacción de los usuarios
– Proveer herramientas para mejorar el uso de
anotaciones semánticas y desarrollar
aplicaciones
– Todos ganan
![Page 15: Yahoo | Búsquedas: su uso para diseñar un mejor sitio](https://reader034.vdocuments.co/reader034/viewer/2022051817/548254dcb479590f0d8b4717/html5/thumbnails/15.jpg)
Before After
Una plataform a abierta para usar datos
estructurados que perm iten generar resultados
m ás útiles y relevantes en Yahoo!
¿Qué es SearchMonkey?
im agen
Enlaces
internos
Resum en
atributos/
valores
Resultado Mejorado
![Page 16: Yahoo | Búsquedas: su uso para diseñar un mejor sitio](https://reader034.vdocuments.co/reader034/viewer/2022051817/548254dcb479590f0d8b4717/html5/thumbnails/16.jpg)
Diseño Dirigido por el Usuario
• User-driven design
– Ejemplo: Yahoo!
Las personas que usan su sitio deciden su
contenido, estructura y funcionalidad
![Page 17: Yahoo | Búsquedas: su uso para diseñar un mejor sitio](https://reader034.vdocuments.co/reader034/viewer/2022051817/548254dcb479590f0d8b4717/html5/thumbnails/17.jpg)
53
Minería Web
• Contenido: texto & multimedia
• Estructura: análisis de enlaces,
minería de redes (grafos)
• Uso: análisis de logs (bitácoras), consultas
• Correlacionar lo anterior
–Depende de la aplicación
54
Ventajas de la Minería Web
�Contenido y estructura
�Verificar la calidad de un sitio
�Problema principal: las personas
�Uso: información semántica implícita
�Es gratis y en general es mucha
�No tiene sesgo
�Complementaria a estudios de usuarios
�Valor comercial invaluable
![Page 18: Yahoo | Búsquedas: su uso para diseñar un mejor sitio](https://reader034.vdocuments.co/reader034/viewer/2022051817/548254dcb479590f0d8b4717/html5/thumbnails/18.jpg)
55
Recolección de Datos
• Contenido y Estructura: Crawling
• Uso: Logs (Bitácoras)
– Logs del servidor Web (e.g. Apache)
• Usar el referer
–Logs de aplicaciones específicas
56
Limpieza de los Datos
• Depende del problema
• Contenido: eliminar duplicados
• Enlaces: rotos, inconsistentes
• Logs: detección de spam Web
–Robots vs. personas
![Page 19: Yahoo | Búsquedas: su uso para diseñar un mejor sitio](https://reader034.vdocuments.co/reader034/viewer/2022051817/548254dcb479590f0d8b4717/html5/thumbnails/19.jpg)
57
Almacenamiento
• Organización: contenido, enlaces, logs
–XML, BD convencional, etc.
• Datos de uso:
–Anonimizar si es necesario
–Definir sesiones
Minería de Contenido y Estructura
• Verificar conectividad
• Verificar consistencia y estilo
– Navegación consistente
• Verificar organización
– Páginas similares deben estar enlazadas
– Páginas distintas no deberían enlazarse
![Page 20: Yahoo | Búsquedas: su uso para diseñar un mejor sitio](https://reader034.vdocuments.co/reader034/viewer/2022051817/548254dcb479590f0d8b4717/html5/thumbnails/20.jpg)
Minería de Navegación:
Reorganización del Sitio
Hot links
Modelo de Usuario
![Page 21: Yahoo | Búsquedas: su uso para diseñar un mejor sitio](https://reader034.vdocuments.co/reader034/viewer/2022051817/548254dcb479590f0d8b4717/html5/thumbnails/21.jpg)
61
Minería de Consultas
�Mejorar los buscadores: ranking, índice
�Esencia de la Información
–El sitio Web que la gente quiere
–El sitio Web que debemos tener
–Mejorar contenido y estructura
62
Distribución de las Consultas
Ley de Zipf: pocas consultas populares,
muchas consultas únicas
![Page 22: Yahoo | Búsquedas: su uso para diseñar un mejor sitio](https://reader034.vdocuments.co/reader034/viewer/2022051817/548254dcb479590f0d8b4717/html5/thumbnails/22.jpg)
64
Consultas vs. Texto
65
¿Cuán lejos se va en los resultados?
(Fuente: iprospect.com WhitePaper_2006_SearchEngineUserBehavior.pdf)
![Page 23: Yahoo | Búsquedas: su uso para diseñar un mejor sitio](https://reader034.vdocuments.co/reader034/viewer/2022051817/548254dcb479590f0d8b4717/html5/thumbnails/23.jpg)
67
Home page
Hub page
Página con
interacción
Rose & Levinson 2004
68
Datos en Consultas
�Sesión: ( (t, q), (URL, dt)* )+
�Persona, lugar, tiempo: IP, cookie
�Tarea: interacción anterior
�Dispositivo: sistema operativo, browser, ...
�Referer: de donde viene
![Page 24: Yahoo | Búsquedas: su uso para diseñar un mejor sitio](https://reader034.vdocuments.co/reader034/viewer/2022051817/548254dcb479590f0d8b4717/html5/thumbnails/24.jpg)
Minería de Búsqueda:
Esencia de la Información
InternasExternas
70
Resultados
�Mejor texto para los enlaces
�Análisis de los casos negativos
–Respuestas que no gustan
–Consultas sin respuestas
–Páginas que sólo se visitan vía una búsqueda
� Nuevos contenidos
![Page 25: Yahoo | Búsquedas: su uso para diseñar un mejor sitio](https://reader034.vdocuments.co/reader034/viewer/2022051817/548254dcb479590f0d8b4717/html5/thumbnails/25.jpg)
Para Recordar...
• Su sitio web siempre será probado
minuciosamente .....
.... cada vez que llegue un usuario
.... sólo si lo encuentra y lo entiende
Bibliografía – General
• Modern Information Retrieval R.
Baeza-Yates & B. Ribeiro-Neto, Addison-Wesley, 1999.
Segunda edición por aparecer..
• Mining the Web: Analysis of Hypertext and Semi Structured Data
Soumen Chakrabarti. Morgan Kaufmann; 2002.• Click: What Millions of People Are Doing Online and
Why it Matters, Bill Tancer.
• Ambient Findibility, Peter Morville, O`Reilly 2006.
• Search Analytics, Lou Rosenfeld
Sitio Web personal (libro por aparecer)
• Estudio de la Web Española R. Baeza-Yates, C. Castillo y V. López (Cybermetrics, 2006)
-
http://www.catedratelefonica.upf.es/.
• Websites:
– http://www.searchenginewatch.com/
– http://www.searchengineshowdown.com/