fundamentos de la recolección de datos online

28
Aprende las bases de la recolección de datos online Fundamentos de la recolección de datos online © netquest 2017

Upload: others

Post on 02-Aug-2022

5 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Fundamentos de la recolección de datos online

Aprende las bases de la recolección de datos online

Fundamentos de la recolección de datos online

© netquest 2017

Page 2: Fundamentos de la recolección de datos online

Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

Internet ha cambiado la investigación de mercados . . . . 4

Fuentes para obtener muestras online . . . . . . . . . . . . . . . . 6

Métodos de muestreo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

El muestreo por cuotas online efectivo . . . . . . . . . . . . . . . 14

Planificar la recolección de datos online . . . . . . . . . . . . . . 17

Encuestas eficaces para el trabajo de campo online . . . . 19

Datos de calidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

Privacidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

Reporting y visualización . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

Tabla de contenidos

Page 3: Fundamentos de la recolección de datos online

Fundamentos de la recolección de datos online 3

La recolección de datos es la actividad que empieza una vez se han definido el objetivo y el diseño

de la investigación, y acaba cuando se dispone de los datos recogidos para proceder a su análisis .

En este contexto, «efectivo» significa encontrar el equilibrio entre costes, tiempo y calidad .

Este Ebook te puede interesar si te identificas con alguno de los siguientes perfiles:

1. Eres un profesional con experiencia en la investigación de mercados y llevas años trabajando con metodologías convencionales para la recolección de datos, como las entrevistas personales y las entrevistas por teléfono . Te ves obligado a investigar y aplicar nuevas tecnologías para satisfacer las peticiones de tus clientes o ser más eficiente . Aunque tengas experiencia en la recolección de datos online, este libro te ayudará a entender las diferencias principales entre los distintos métodos y te permitirá decidir mejor a la hora de elegir qué métodos aplicas y cuándo .

2. Eres joven y te dedicas profesionalmente a la investigación de mercados. La investigación de mercados online ha sido tu elección natural desde que empezaste tu andadura profesional, pero crees que hay una gran diferencia entre lo que te enseñaron en clase y la vida real . Te preguntas cómo poner en práctica los conocimientos aprendidos sobre muestreo probabilístico, los marcos muestrales y las cuotas en proyectos reales . O quizás te apetece conocer las novedades que se han producido desde que acabaste tus estudios .

3. Actualmente, estudias técnicas de investigación de mercados. Crees que el marco teórico que estás aprendiendo dista enormemente de la recolección de datos real . Quieres entender cómo emplear mejor los conceptos clásicos que aprendes en un mundo cada vez más dominado por la tecnología, la flexibilidad y la velocidad .

4. No te dedicas profesionalmente a la investigación de mercados, pero en tu trabajo tienes que recolectar datos online y quieres saber cómo hacerlo de forma rápida y eficaz .

Con este libro quiero tender un puente importante entre la teoría y la práctica de forma sencilla,

breve y directa . Este libro es tan solo una guía; en él no se tratan todos los temas con gran

profundidad, pero te ayudará a descubrir aquellas incógnitas que todavía no conoces . Encontrarás

más información en nuestro blog en www .netquest .com .

Por último, permíteme una observación final acerca del objetivo de este libro: las

recomendaciones del libro son aplicables a prácticamente todas las metodologías de recolección

de datos online cualitativas y cuantitativas, pero nos centraremos en las encuestas por tratarse de

la metodología de investigación de mercados más habitual .

IntroducciónEste Ebook pretende ser una guía para implementar una recolección de datos online eficaz para la investigación de mercados .

Page 4: Fundamentos de la recolección de datos online

Fundamentos de la recolección de datos online 4

Las nuevas tecnologías han creado un nuevo comportamiento del consumidor y la necesidad

de estudiar este nuevo comportamiento en su contexto . Paralelamente, las nuevas tecnologías

han dado lugar a nuevas formas de recolectar información sobre el comportamiento de los

consumidores . Desde el auge de Internet a mediados de los 90, la investigación de mercados se ha

volcado en la recolección de datos online .

Cada día son más las investigaciones que se realizan a través de dispositivos con conexión a

Internet . Además, los nuevos dispositivos nos permiten recolectar nuevos tipos de datos . ¿Qué

razones nos empujan a recolectar datos a través de Internet? ¿Qué ventajas nos aportan? ¿Hay

límites?

Internet ha cambiado la investigación de mercados

Page 5: Fundamentos de la recolección de datos online

Fundamentos de la recolección de datos online 5

Internet ha cambiado la investigación de mercados

La siguiente tabla recoge las ventajas y los inconvenientes de la recolección de datos online en

comparación con los métodos tradicionales .

Ventajas Inconvenientes

CostesMenos costes debido a la ausencia del entrevistador .

Parte de los costes ahorrados en el entrevistador deben destinarse a recompensar a los participantes .

Velocidad

Más rápida que los métodos offline . Recolección de datos automatizada y un grupo más grande de encuestados potenciales .

L os proyectos más complejos seguirán requiriendo más tiempo de lo que cabría esperar si, por ejemplo, el tamaño de la muestra es muy grande, si es difícil acceder a la población objetivo o si aplicamos un muestreo por cuotas complejo (véase más adelante) .

Representatividad

En función del país, mejor acceso a determinados grupos sociodemográficos, como la gente joven o las personas con estudios superiores .

En muchos países, la población online no representa la totalidad de algunos grupos sociodemográficos, como la gente mayor o las clases más bajas .

Estímulos

En la recolección de datos online se pueden utilizar todos los estímulos imaginables: imágenes, vídeos, audios, mapas interactivos, simuladores de compra y cuestionarios conjuntos .

Este aspecto no presenta inconvenientes . La modalidad online es claramente mejor a nivel de variedad de herramientas que se pueden utilizar para recolectar la información .

Calidad

Debido a la ausencia del entrevistador, menos riesgo de respuestas fraudulentas o sesgos inducidos .

La calidad depende de los entrevistados . Algunos riesgos son la duplicación de participantes, participantes fraudulentos o la falta de atención .

Procesamiento de

datos

Se recoge, procesa y, dado el caso, visualiza en tiempo real y simultáneamente la información procedente de varios encuestados . Es fácil y rápido .

Algunos métodos de recolección de datos offline requieren consolidar y procesar los datos antes de pasar al reporting y la visualización . En estos casos, no es posible aprovechar al máximo la velocidad que caracteriza la recolección de datos online .

VENTAJAS E INCONVENIENTES DE LA RECOLECCIÓN DE DATOS ONLINE

Page 6: Fundamentos de la recolección de datos online

Fundamentos de la recolección de datos online 6

Todos los procesos de recolección de datos empiezan por el muestreo, que es el método empleado para elegir un subgrupo de individuos de un universo estadístico con el fin de estimar las características de todo el universo .Existen varios métodos de muestreo: algunos son más prácticos que otros, en función de los

objetivos que persigamos con nuestra investigación y el universo objetivo . Pero, antes de aplicar

cualquiera de estos métodos, pregúntate: ¿Dónde puedo encontrar participantes online para una

encuesta online?

Gran parte de los métodos de muestreo que te han enseñado no son aplicables a la mayoría de

proyectos de investigación, independientemente de si recoges datos online u offline: ¿Cuántas

veces en la vida podrás utilizar un muestreo probabilístico puro? Esto es especialmente importante

cuando utilizamos Internet .

Mi primer consejo: olvídate de cómo te gustaría alcanzar tu muestra, piensa en cómo puedes

alcanzarla y alinea tu enfoque con la realidad . El muestreo online presenta ciertos retos: la

población en Internet no está censada y no puedes interceptar a personas al azar para pedirles

que participen, como a pie de calle . Intenta entender cómo funciona Internet y encuentra la

solución que mejor se adapte a tu proyecto de recolección de datos online; no lo hagas al revés .

Este libro te ayudará a conseguirlo .

Actualmente, los investigadores profesionales emplean cuatro fuentes distintas para conseguir

participantes .

1. Paneles de acceso online

Los paneles de acceso online son comunidades online formadas por personas predispuestas a

participar en proyectos de investigación de mercados (encuestas, en su mayoría) a cambio de una

recompensa, como dinero, obsequios, donaciones o sorteos .

Los paneles de acceso online reclutan a sus miembros por distintas vías . Algunos son paneles

abiertos en los que los participantes se registran simplemente entrando en su página web . Se

capta la atención de los visitantes a través de campañas de publicidad públicas y se convierten en

nuevos miembros .

Otros paneles son cerrados y solo se puede acceder a ellos con una invitación personal enviada a

los miembros registrados en páginas web asociadas . Pueden parecerse a los paneles abiertos, pero

Fuentes para obtener muestras online

Page 7: Fundamentos de la recolección de datos online

Fundamentos de la recolección de datos online 7

Fuentes para obtener muestras online

no lo son, ya que no es posible acceder a un panel cerrado sin invitación .

Actualmente, los paneles de acceso online conforman la fuente principal de participantes en la

investigación de mercado profesional .

2. River sampling

El river sampling (muestreo en río) es un método inspirado en el funcionamiento de las encuestas

cara a cara, esto es, interceptando a personas en la calle . El river sampling intenta interceptar a las

personas online cuando navegan por Internet . ¿Cómo? Con anuncios en páginas web con mucho

tráfico como Google o Facebook . Sin embargo, en lugar de pedir a la gente que acceda a un panel

para participar en futuras encuestas, como sucede en un panel online, se les pide que participen

directamente en una sola encuesta online . A cambio, reciben una recompensa para premiar su

participación .

3. Paneles online probabilísticos

Es difícil crear un panel que sea totalmente representativo de la población reclutando a personas

online . En realidad, es imposible, principalmente por 2 razones: (1) en muchos países, una parte de

la población no utiliza Internet y (2) no hay un directorio que recoja todos los usuarios de Internet

a partir del cual se puedan elegir personas al azar . Tal y como veremos más adelante, estos límites

nos impiden utilizar el muestreo aleatorio .

Los paneles probabilísticos intentan superar estas dificultades reclutando a personas offline y

ofreciendo un dispositivo con conexión a Internet a aquellas que no utilizan Internet . De este

modo, es posible utilizar el método de muestreo probabilístico clásico para crear el panel online .

Una vez tenemos el panel, las muestras aleatorias que se extraen deberían ser muestras aleatorias

de todo el universo . Así, nos aseguramos de tener un panel representativo .

Por norma general, los paneles online probabilísticos son más pequeños y resultan más caros

que los paneles de acceso online y se suelen utilizar, fundamentalmente, para la investigación

académica .

4. Bases de datos de propiedad

Si disponemos de una base de datos con correos electrónicos o cualquier otra forma de

contactar a la gente por Internet cuando nos convenga, tenemos una buena oportunidad para la

recolección de datos online . En función del objetivo de la investigación, es probable que no sea

necesario representar a toda la población, sino únicamente a nuestro grupo objetivo, por ejemplo,

nuestros clientes o visitantes . La representatividad no siempre es un problema .

La tabla a continuación muestra las ventajas y los inconvenientes principales de las distintas

fuentes de datos .

Page 8: Fundamentos de la recolección de datos online

Fundamentos de la recolección de datos online 8

Fuentes para obtener muestras online

Ventajas Inconvenientes

Online Access Panel

•Flexibilidad: apto para todo tipo de proyectos de recolección de datos .

•Estabilidad: permite predecir y planificar con precisión el número de participantes .

•Apto para estudios de seguimiento en los que se debe llegar a la misma población objetivo periódicamente .

•Coste moderado, incluso para los targets difíciles de acceder (siempre y cuando el panel se haya perfilado correctamente) .

•Permite implementar medidas de calidad comparando la participación de los individuos a lo largo del tiempo .

•Los paneles no siempre están disponibles en las zonas menos pobladas .

•Representatividad limitada . El muestreo por cuotas debe aplicarse correctamente para superar esta dificultad

River sampling

•Bajo coste .

•Apto para países con poca población cuando no disponemos de un panel de acceso online .

•Buena fuente de públicos online frecuentes, como los adolescentes .

•Problemas de calidad: no es fácil monitorizar a los participantes para evitar identidades fraudulentas o malas conductas durante la participación .

•No apto para estudios de seguimiento: los resultados de la muestra son inestables en el tiempo .

•Riesgo de obtener resultados sesgados cuando se invita a todos los participantes desde la misma página web .

VENTAJAS E INCONVENIENTES DE LAS FUENTES ONLINE DE PARTICIPANTES

Page 9: Fundamentos de la recolección de datos online

Fundamentos de la recolección de datos online 9

Fuentes para obtener muestras online

Paneles online probabilísticos

•Buena representatividad . El muestreo por cuotas no es tan crítico como en los paneles de acceso online .

•Alta estabilidad, se pueden predecir los resultados de las muestras .

•Tamaño limitado .

•Costes elevados .

•No disponible en la mayoría de países .

Bases de datos de propiedad

•El menor coste posible porque ya poseemos la fuente de participantes .

•Dependiendo de cómo definamos la población objetivo y perfilemos a los participantes en nuestra base de datos se puede implementar el muestreo probabilístico .

•Los resultados se pueden complementar con la información ya disponible (es decir, los resultados de las encuestas a clientes se pueden comparar con los ingresos o la segmentación de clientes)

•No siempre disponemos de bases de datos de propiedad para solucionar nuestros problemas .

•Apto para recolectar información de nuestros clientes, pero no de los clientes de nuestros competidores .

Page 10: Fundamentos de la recolección de datos online

Fundamentos de la recolección de datos online 10

Una vez tenemos una visión clara de las fuentes principales de participantes para nuestra encuesta, la decisión acerca del método de muestreo es bastante clara: el método de muestreo que aplicaremos depende enormemente del número de participantes disponibles .Los métodos de muestreo existentes se pueden dividir en 2 categorías: los métodos de muestreo

probabilístico y no probabilístico .

Métodos de muestreo probabilístico

Una muestra probabilística es una muestra en la que cada unidad del universo tiene una

probabilidad (superior a cero) de ser elegido en la muestra y dicha probabilidad se puede

determinar con precisión . Estas características permiten producir estimaciones no sesgadas de los

totales de población . El muestreo probabilístico requiere siempre un marco muestral, es decir, una

lista de todos los individuos de un universo que se pueden incluir en la muestra .

El muestreo aleatorio simple (M.A.S.) es la técnica de muestreo probabilística más habitual, ya

que se considera un estándar de oro: todos los métodos se pueden comparar con él . En el M .A .S .,

los individuos del universo tienen las mismas probabilidades de ser seleccionados . Esta condición

minimiza los sesgos y simplifica el análisis .

Otros métodos de muestreo probabilístico son:

Muestreo estratificado: si el universo presenta distintas categorías o estratos distintos, cada

estrato se puede investigar como subgrupo independiente . Este método (1) permite sacar

conclusiones sobre cada subgrupo y (2) nos ofrece unas estimaciones estadísticas más eficientes

que son, al menos, tan buenas como con el muestreo aleatorio simple y, con frecuencia, incluso

mejores . El muestreo estratificado funciona mejor si la varianza entre estratos es baja dentro de

cada estrato pero elevada entre estratos distintos, de modo que el tamaño de la muestra se pueda

adaptar a cada estrato .

Muestro por conglomerados: cuando la población se puede dividir en grupos o conglomerados

y cada conglomerado es parecido a los demás, podemos realizar el muestreo a partir de uno de

los conglomerados para representar a toda la población . Este planteamiento es práctico si un

menor número de conglomerados reduce los costes de la recolección de datos (por ejemplo, si

cada manzana en una ciudad conforma un conglomerado, podemos reducir costes enviando

entrevistadores a tan solo unas cuantas manzanas) . También simplifica el marco muestral: en el

ejemplo anterior, necesitaremos un mapa de las manzanas en la ciudad en lugar de una lista de

Métodos de muestreo

Page 11: Fundamentos de la recolección de datos online

Fundamentos de la recolección de datos online 11

Métodos de muestreo

los individuos en la ciudad . El muestreo por conglomerados puede aumentar la varianza entre las

estimaciones muestrales, en especial, si los conglomerados no son homogéneos .

Muestreo sistemático: este método selecciona los individuos en períodos regulares a partir de

una lista ordenada de la población . Por ejemplo, elegimos a 1 visitante entre 50 en una tienda

para entrevistarle . Este método puede igualar o incluso mejorar los resultados obtenidos con el

muestreo aleatorio simple, pero si hay una correlación entre la lista ordenada de candidatos, las

estimaciones resultantes pueden ser sesgadas .

Métodos de muestreo no probabilístico

En pocas palabras, el muestreo no probabilístico es cualquier método de muestreo que no

cumpla los requisitos del muestreo probabilístico, ya sea porque, a veces, no se puede llegar a

algunos individuos de la población objetivo, ya sea porque desconocemos la probabilidad de

inclusión . Aunque muchos lo hacen, no se debe hacer una estimación de errores con los métodos

de muestreo no probabilístico . Las encuestas telefónicas por marcado aleatorio y las entrevistas

personales en zonas urbanas con una amplia concentración de pisada son algunos ejemplos de

métodos de muestreo no probabilísticos .

Lo cierto es que en la investigación de mercados, el 99 % de la recolección de datos utiliza

muestreos no probabilísticos . Por lo tanto, si has valorado una estimación de errores junto con el

resultado de la encuesta (el llamado margen de error y nivel de confianza), has hecho un mal uso

disfrazado del método de muestreo .

Por suerte, esto no significa que el muestreo no probabilístico no sirva para nada . No es perfecto,

no contempla la estimación de errores de medición y puede ser un método ligeramente o incluso

bastante sesgado, pero la información siempre es valiosa en tanto que sepamos cómo se ha

recogido y que, a pesar de sus limitaciones, nos sirve para alcanzar nuestros objetivos .

El muestreo por cuotas es el método de muestreo no probabilístico más habitual . En el muestreo

por cuotas, la población se divide en grupos mutuamente excluyentes conforme a variables de

segmentación como la edad, el sexo o la región . Definimos la distribución de la muestra objetivo

por segmentos de modo que se corresponda con la población objetivo . Así, por ejemplo, si la

población objetivo es un 50 % de hombres y un 50 % de mujeres, una muestra de 1 .000 individuos

debe ser equivalente a este reparto: 500 hombres y 500 mujeres .

Una vez definido el tamaño de cada segmento o cuota, elegimos una muestra no aleatoria y

entrevistamos a los individuos hasta alcanzar el objetivo de cada cuota . Esto significa que una

vez he alcanzado los 500 varones, si el siguiente individuo en la muestra es un hombre, tenemos

que descartarlo . Los individuos descartados se denominan «quota fulls» . En este sentido, el

muestreo por cuotas se parece al muestreo estratificado, pero en lugar de incluir a los individuos

aleatoriamente en cada segmento, de la muestra no aleatoria cabe esperar que sea lo más

representativa posible llenando las cuotas objetivo por segmento .

Page 12: Fundamentos de la recolección de datos online

Fundamentos de la recolección de datos online 12

Métodos de muestreo

Otros métodos de muestreo no probabilístico son:

Muestreo por bola de nieve: este método empieza identificando un pequeño grupo de

encuestados iniciales dentro de la población objetivo . Los encuestados iniciales se utilizan para

reclutar a más encuestados dentro de la población objetivo . Es un buen método para las muestras

de difícil acceso .

Muestreo por conveniencia: este nombre se utiliza habitualmente para describir cualquier otro

método que persiga obtener fácilmente una muestra no probabilística . Los individuos se registran

voluntariamente en un formulario web . Los seguidores de Facebook son un ejemplo de este tipo

de muestras . No podemos calcular hasta qué punto las muestras representan a nuestro universo

pero son una muestra y, por lo tanto, pueden servirnos para recolectar datos .

Métodos de muestreo aptos para la recolección de datos online.

Tal y como hemos explicado anteriormente, los métodos de muestreo más adecuados para la

recolección de datos dependen de la fuente de participantes que utilicemos .

Si extraemos muestras a partir de un panel de acceso online, la única opción realista es el

muestreo por cuotas . Los paneles de acceso online no son representativos de toda la población,

pero si están bien diseñados, deberían proporcionarnos todo tipo de encuestados . Para

asegurarnos de que extraemos una muestra representativa del panel, debemos fijar las cuotas

correctas . El siguiente capítulo aprenderemos a fijar las cuotas para la recolección de datos online .

Esto también es aplicable al river sampling . En este caso, las cuotas son aún más importantes

debido a la varianza limitada de los participantes .

Pero las cosas son distintas cuando trabajamos con un panel online basado en la probabilidad,

porque se supone que este tipo de paneles conforman una muestra aleatoria/representativa

del universo . En teoría podríamos confiar en esto para extraer muestras aleatorias del panel . Sin

embargo, debemos recordar que un panel online probabilístico sigue siendo una comunidad de

personas encuestadas periódicamente a cambio de algo . Algunos miembros del panel pueden

responder más activamente que otros a las invitaciones . El nivel de actividad puede variar en

función de la edad, el sexo u otros factores sociodemográficos, de manera que, al final, la muestra

del panel puede ser sesgada . El muestreo por cuotas es nuestro mejor aliado para evitar estos

retos .

Page 13: Fundamentos de la recolección de datos online

Fundamentos de la recolección de datos online 13

Métodos de muestreo

Por último, si tenemos acceso a una base de datos de propiedad, podremos utilizar varios

métodos de muestreo . Por ejemplo, pensemos en una lista exhaustiva de clientes de una empresa:

si queremos investigar este target específico, la lista es un marco muestral, de modo que podemos

aplicar métodos de muestreo probabilístico como el muestreo aleatorio simple o el muestreo

sistemático . Obviamente, también podemos recurrir al muestreo no probabilístico .

A veces, la base de datos de propiedad puede conformar un marco muestral o no, dependiendo

de cómo definamos nuestra población objetivo . Por ejemplo, supongamos que tenemos una

lista de clientes y clientes potenciales suscritos al boletín de noticias de una empresa . ¿Es este el

marco muestral? Si definimos nuestra población objetivo como «personas interesadas en recibir

información periódica de mi empresa», entonces sí . Si nuestra población objetivo es «cualquier

cliente real y potencial», entonces no . En el segundo caso, el muestreo por cuotas es siempre una

opción, pero cuando trabajamos con bases de datos internas, a veces es mejor aplicar el muestreo

aleatorio a toda la base de datos y analizar los resultados por segmentos, ya que no hay un coste

creciente por respuesta .

Page 14: Fundamentos de la recolección de datos online

Fundamentos de la recolección de datos online 14

El muestreo por cuotas es el método de muestreo por defecto para recolectar datos online . Cuando encargamos un proyecto de recolección de datos online a un panel online, nos

preguntarán cómo queremos utilizar las cuotas . A continuación encontrarás las mejores prácticas

y recomendaciones para fijar cuotas y asegurarte así de realizar una recolección de datos online

efectiva .

1. Fija cuotas para variables que (1) sean imprescindibles para tu proyecto y/o (2) cuya distribución difiera claramente de tu población objetivo y la población de Internet.

Las cuotas pretenden subsanar la posible falta de representatividad debido a las divergencias

entre nuestra fuente de datos y la población objetivo . Si hemos utiliza el muestreo por cuotas para

recolectar datos offline, deberíamos plantearnos si nos conviene reutilizar las mismas cuotas con

las mismas variables sociodemográficas . Aunque normalmente fijemos las cuotas por sexo, edad y

región, es probable que para la recolección de datos online no nos sirvan .

Veamos algunos ejemplos sobre cómo enfocar las cuotas para el muestreo online:

• En general, la edad es un factor clave en prácticamente todos los países. Los jóvenes son más propicios a utilizar Internet que las personas mayores, salvo en los países más desarrollados, como Noruega o Suecia, que registran una penetración de Internet del 95 % aproximadamente .

• A pesar de que en la mayoría de países el uso de Internet no difiere demasiado entre hombres y mujeres, cuando extraemos muestras de paneles de acceso online tenemos que utilizar cuotas por sexo . Esto se debe a que los paneles tienen que ser lo suficientemente grandes para satisfacer las necesidades de los compradores investigados y se suele investigar más a las mujeres que a los hombres porque se asume que las mujeres toman más decisiones de compra relacionadas con el hogar . Si no fijamos cuotas por sexo, es probable que recibamos más respuestas de mujeres .

• En países menos desarrollados en América Latina, Asia y África, la clase social es un factor decisivo. El uso de Internet varía enormemente entre clases sociales . Además, las clases sociales más bajas tienen un comportamiento totalmente distinto al de las clases medias y altas . En países desarrollados, esto no suele ser tan importante, así que podemos ahorrarnos este control de cuotas .

El muestreo por cuotas online efectivo

Page 15: Fundamentos de la recolección de datos online

Fundamentos de la recolección de datos online 15

El muestreo por cuotas online efectivo

2. Menos es más: utilizar el número mínimo de cuotas.

Las cuotas hacen que el proceso de recolección de datos sea más complejo, afectan al timing del

proyecto e inciden en los costes de la recolección de datos . Se trata de un problema inherente al

muestreo por cuotas, pero que cobra importancia cuando recogemos información online .

Pensemos en las grandes diferencias entre la recolección de datos online y offline . Si hemos

definido una cuota por sexo en una encuesta presencial, una vez hemos alcanzado nuestro

objetivo de varones dejamos de interceptar a hombres en la calle . Y es fácil, ¡porque sabemos

diferenciar entre hombres y mujeres a simple vista!

En cambio, el proceso online es totalmente distinto: enviamos una serie de invitaciones por correo

electrónico a los candidatos y esperamos a que la gente reciba los correos, los abran, accedan

a la encuesta online y completen su participación . Cuando alcanzamos un target de hombres,

no podemos impedir que más candidatos varones accedan a la encuesta porque no podemos

eliminar las invitaciones enviadas por correo electrónico una vez recibidas . Tendremos que

descartar las participaciones que exceden nuestra cuota, ya que carecen de valor para nosotros y,

además, suponen un coste para el panel de acceso online .

Cuanto más complejas sean las cuotas, más costes y tiempo necesitaremos para llevar a cabo la

recolección de datos online . El gráfico siguiente muestra el número aproximado de personas que

tenemos que añadir al tamaño de la muestra debido al exceso de cuota para una muestra con

un tamaño de 1 .000 y cuotas uniformes . Según este gráfico, fijar una cuota con un tamaño=2

(dividiendo el tamaño objetivo de 1 .000 en dos grupos objetivo de 500 individuos) implica

tener un 2,5 % de encuestados más . Para una cuota con un tamaño=8 (8 grupos objetivo de 125

individuos), la muestra tiene que ser un 13,1 % más grande . Por último, si dividimos el tamaño

objetivo en 100 cuotas, tendremos que doblar el tamaño de la muestra (+96,6 %) .

Page 16: Fundamentos de la recolección de datos online

Fundamentos de la recolección de datos online 16

El muestreo por cuotas online efectivo

3. Decide si quieres o no que las cuotas sean convergentes o divergentes.

Hablamos de cuotas divergentes cuando los objetivos de cada cuota se definen de forma

independiente . Por ejemplo, para una muestra con un tamaño de 1 .000 encuestados,

necesitaremos 500 (50 %) hombres y 500 (50 %) mujeres, y 500 (50 %) jóvenes y 500 (50 %)

personas mayores . De este modo, asumes el riesgo de que acabes con 500 jóvenes varones y 500

mujeres mayores . Este resultado es perfectamente compatible con tu definición de cuota, ¿pero te

gusta realmente esta distribución?

Para evitar este efecto, utilizaremos cuotas convergentes . Esto significa definir un tamaño objetivo

para cada combinación de variables: 250 (50 % x 50 %) hombres jóvenes, 250 (50 % x 50 %)

mujeres jóvenes, 250 (50 % x 50 %) hombres mayores y 250 (50 % x 50 %) mujeres mayores .

¿Utilizamos cuotas convergentes o divergentes para recolectar datos online? Pues depende de

nuestras prioridades . En teoría, las cuotas divergentes deberían simplificar la recolección de datos .

La definición de una cuota convergente siempre se corresponde a la definición equivalente de

cuota divergente, pero no al revés . Podemos comprobar este hecho fácilmente con el ejemplo

anterior .

En definitiva: las cuotas divergentes son, en principio, más económicas y rápidas, pero no

siempre es así . Siguiendo con el ejemplo anterior, si el panel de acceso online está claramente

distorsionado en favor de los jóvenes y los hombres, es probable que cuando tengamos 500

encuestas, la mayoría de ellas sean de hombres jóvenes . Esto significa que las 500 encuestas

restantes tendrán que proceder de nuestro target de difícil acceso: mujeres mayores . A veces es

mejor tener cuotas convergentes porque nos ofrecen un progreso equilibrado simultáneamente

en todos los targets .

¿Qué podemos hacer para superar este reto? Nuestro consejo es que (1) apuestes por cuotas

divergentes solo si el panel de acceso online presenta una distribución equilibrada entre los

targets (por ejemplo, en lugar de tener una distribución por sexo de 50 %-50 %, tiene un 45 %-55

% pero no 30 %-70 %) y (2) utiliza siempre cuotas convergentes si quieres analizar subtargets en

profundidad (por ejemplo, si quieres analizar las diferencias entre hombres mayores y mujeres

mayores) .

Page 17: Fundamentos de la recolección de datos online

Fundamentos de la recolección de datos online 17

La velocidad es una ventaja clara de la recolección de datos online . Es mucho más rápido enviar miles de invitaciones por correo electrónico y permitir que los

participantes realicen las encuestas de forma simultánea que llamar a la gente desde un call center

o interceptar al público en la calle para hacer encuestas .

Los campos de trabajo online suelen tardar entre 2 y 5 días, en función del tamaño de la muestra,

la población objetivo y, desde luego, el panel de acceso online que utilicemos . En principio, la

recolección de datos online se puede hacer en menos de dos días . Para ello, tendremos que invitar

a más candidatos para que participen en el mismo período de tiempo . Sin embargo, quizás no sea

buena idea para nuestros datos .

¿Quién tiene más probabilidades de participar en encuestas online si hay un período de tiempo

limitado para ello? La respuesta es usuarios asiduos de Internet, adictos a los smartphones o

empleados de oficina . Con frecuencia, la representatividad de las fuentes de participantes es un

tema que preocupa seriamente a los investigadores . Sin embargo, se infravaloran los efectos de un

proceso de recolección de datos inadecuado .

El gráfico siguiente, elaborado con datos de los 6 paneles Netquest más grandes, nos ayuda a

entender los efectos de limitar el tiempo de participación .

Planificar la recolección de datos online

Page 18: Fundamentos de la recolección de datos online

Fundamentos de la recolección de datos online 18

Planificar la recolección de datos online

La participación en encuestas online se reduce con el tiempo . El 11 % de las participaciones se

producen en la primera hora y el 22 %, en un plazo de 3 horas . Pero si cerramos nuestro trabajo

de campo a las 3 horas, perderemos el 78 % de las participaciones, por lo que nuestra muestra

resultará más cara . Y lo que es aún peor: no sabremos si los participantes que no han podido

participar son distintos a los que sí han participado, distorsionando así la muestra .

En conclusión, la recolección de datos online es más rápida que la recolección de datos offline,

y puede ser todavía más rápida, pero a expensas del sesgo de la muestra y de incurrir en unos

costes mayores .

Page 19: Fundamentos de la recolección de datos online

Fundamentos de la recolección de datos online 19

Si tienes experiencia en la investigación de mercados cuantitativa, probablemente ya conozcas los fundamentos del diseño de cuestionarios . Los aspectos básicos que hay que tener en mente son los mismos para la recolección de

datos online y offline . El diseño de encuestas es un tema demasiado amplio para verlo aquí

en profundidad, pero a modo de recordatorio, los pasos para hacer un buen trabajo son los

siguientes:

1. Establece el objetivo del cuestionario: ¿Cuál es la finalidad de la investigación?

2. Fija las preguntas que se van a hacer .

3. Elige el tipo de pregunta más adecuado entre las distintas opciones (preguntas abiertas o cerradas, respuesta única o múltiple, preguntas de clasificación, preguntas de puntuación, etc .) .

4. Especifica los términos más adecuados para cada pregunta según la población objetivo .

5. Crea la secuencia de preguntas y el diseño del cuestionario de forma lógica para el participante .

Las mejores prácticas para diseñar cuestionarios offline efectivos también son aplicables online:

• Sé conciso, breve y claro . Evita las frases complejas .

• Evita preguntar dos cosas distintas en una misma pregunta .

• Evita las preguntas negativas que puedan confundir a los participantes .

• Pide respuestas precisas .

• Si utilizas preguntas cerradas, asegúrate de dar todas las respuestas posibles (plantéate incluir la opción «Otros») .

• Evita las preguntas tendenciosas .

Sin embargo, hay una serie de recomendaciones para las encuestas online .

1. Utiliza páginas múltiples en lugar de desplazamientos infinitos .

2. Pregunta una sola cosa cada vez y limita el cuestionario a una pregunta por página . No permitas que el encuestado navegue por la página y decida en qué orden responde a cada pregunta .

3. La entrevista debe tener una longitud moderada . La regla de oro son 20 minutos como máximo y 5 minutos si los encuestados utilizan dispositivos móviles .

Encuestas eficaces para el trabajo de campo online

Page 20: Fundamentos de la recolección de datos online

Fundamentos de la recolección de datos online 20

Encuestas eficaces para el trabajo de campo online

4. Utiliza encuestas online responsivas que se adapten correctamente a los distintos tamaños de pantallas (ordenador, tableta, móvil) .

5. Emplea un lenguaje específico . Los participantes online leen en diagonal para buscar palabras y mensajes clave .

6. Incluye imágenes e iconos cuando puedas, ya que mejorarás la experiencia de usuario de los participantes .

7. Insertar vídeos en una encuesta es una funcionalidad específica de las encuestas online y que marca la diferencia respecto a las encuestas offline . Aprovéchala (por ejemplo, pruebas creativas o comerciales), pero ten en cuenta que la participación se verá reducida por varios factores: la compatibilidad de los vídeos con navegadores no actualizados, ancho de banda limitado en los teléfonos móviles y, en algunos casos, las personas que no quieren subir el volumen de los dispositivos (por ejemplo, si están en el transporte público) .

8. Cumple los estándares de Internet y olvídate de reinventar la rueda . La gente espera que, al pulsar un botón de radio, los demás botones de radio cercanos aparezcan como no seleccionados . Todos los elementos de una página web (casillas de verificación, cuadros de inserción de texto, botones para enviar, texto subrayado . . .) deben actuar tal y como la gente espera .

9. Evita las baterías de preguntas . De hecho, la investigación ha puesto de manifiesto que las ventajas potenciales de agrupar preguntas en una escala de respuestas compartida (menor tiempo de respuesta y más correlación entre elementos) no compensa los inconvenientes (una peor experiencia del participante, una mayor tasa de abandono y menos diferenciación entre respuestas)(*) .

10. Aprovecha las oportunidades que te ofrece la tecnología: simuladores de compra, cuestionarios online conjuntos, entradas de voz, reconocimiento facial, rastreo ocular, etc . Actualmente, disponemos de un amplio abanico de opciones nuevas y prometedores para recolectar datos online .

(*)Melanie Revilla, Carlos Ochoa . Telematics and Informatics, abril 2016 . “An experiment comparinggrids and item-by-item formats in web surveys completed through PCs and smartphones”

Page 21: Fundamentos de la recolección de datos online

Fundamentos de la recolección de datos online 21

Si estás pensando en utilizar la recolección de datos online por primera vez, o incluso si la has empleado varias veces, debes plantearte la pregunta siguiente: ¿Hasta qué punto se puede comparar la calidad de los datos online y los datos offline?Hay argumentos en contra de la calidad de los datos recogidos online, pero, al mismo tiempo,

hay muchos otros en favor . De hecho, existen múltiples formas de controlar la calidad de los

datos recogidos online que nos permiten superar los principales inconvenientes y aprovechar las

virtudes de esta metodología al mismo tiempo .

Datos de calidad

Ventajas Inconvenientes

•Ausencia de sesgos del entrevistador: las respuestas no se ven distorsionadas por las diferencias del estilo social y la personalidad de los entrevistadores o la forma de presentar determinadas preguntas .

•Mayor fiabilidad ante preguntas sensibles (preferencias políticas, estado de salud, religión . . .) debido al anonimato del encuestado (**)

•Ausencia de errores de transcripción . Los participantes envían sus preguntas de forma digital y directa en el cuestionario .

•Fácil recolección de metadatos para evaluar la calidad, permitiéndonos así aplicar medidas de corrección . Casi todos los softwares de encuestas profesionales recogen datos como el tiempo de participación, el tiempo por pregunta o el número de interrupciones del cuestionario .

•Es difícil controlar estrictamente quién participa (por ejemplo, en encuestas prfundamentos observamos visualmente la edad aproximada y el sexo de los participantes, pero en Internet no es posible) .

•Mayor riesgo de querer satisfacer debido a la ausencia del entrevistador y el uso de recompensas . La voluntad de satisfacer es una estrategia a la que recurren los encuestados para responder a preguntas con el mínimo esfuerzo . (***)

•La comparabilidad se puede ver afectada por la gran diversidad de dispositivos que utilizan los participantes: navegadores distintos, versiones de los navegadores, dispositivos, tamaño de las pantallas . . .

•Cuando se recompensa la participación, el comportamiento del participante se puede ver afectado . Por ejemplo, un panel que ofrece solo un tipo de recompensa a cambio de la participación puede sobrerepresentar una población objetivo en concreto, o si el panel solo recompensa a los participantes que forman parte de la población objetivo (esto es, los que pasan las preguntas de filtro), la gente se puede ver tentada a mentir .

VENTAJAS E INCONVENIENTES DE LA RECOLECCIÓN DE DATOS EN TÉRMINOS DE CALIDAD

(**) http://web .comhem .se/u22779327/16/k16docs081211 .pdf(***) http://www .businessdictionary .com/definition/satisficing .html

Page 22: Fundamentos de la recolección de datos online

Fundamentos de la recolección de datos online 22

Datos de calidad

Si nos fijamos en el resumen anterior, es obvio que la recolección de datos online tiene ventajas

e inconvenientes . En este sentido, es parecida a cualquier otra metodología . Sin embargo, la

recolección de datos online tiene una ventaja esencial respecto a otras opciones: la mayoría de

inconvenientes se pueden minimizar (o incluso eliminar) seleccionando una fuente de datos fiable

y aplicando los controles de calidad adecuados en el cuestionario online .

7 estrategias comunes para mejorar la calidad son:

1. Compara los datos de la encuesta con los datos del panel para detectar identidades fraudulentas . Por ejemplo, cuando se pregunta la edad y el sexo, es fácil validar la respuesta del panelista si esta persona se ha unido al panel .

2. Pon a prueba la atención que los panelistas prestan a la encuesta comparando las respuestas dentro de la encuesta para evaluarlas . Puedes hacer la misma pregunta dos veces (de forma ligeramente distinta) y en un momento distinto en el mismo cuestionario .

3. Aplica una Comprobación de manipulación de las instrucciones (IMC, por sus siglas en inglés) si la duración de la encuesta es larga (>15 minutos) . Las IMCs son preguntas cuyo objetivo es verificar que el participante haya prestado atención al cuestionario, del tipo «Si estás leyendo esta pregunta, selecciona la tercera opción» .

4. Recompensa a las personas por participar y no a cambio de corresponderse con los requisitos de la población objetivo que quieres encuestar . Si solo pagamos a los que responden «sí» a la pregunta de filtro (por ejemplo, «¿Utilizas este producto?» «¿Conoces esta marca?») estaremos incitando a la gente a mentir en la próxima encuesta que les enviemos .

5. Fija un tiempo mínimo necesario para realizar la encuesta y descarta a los participantes que acaben antes . Se trata de una forma fácil de detectar a participantes que responden sin prestar atención .

6. Comprueba las respuestas a preguntas abiertas para identificar respuestas inválidas (como «---», «aaaaa») y elimina la participación integral de estos participantes, no solo la respuesta . Si alguien responde así a una pregunta abierta, es probable que esta persona haya respondido inadecuadamente a toda la encuesta .

7. Recoge tantos metadatos (datos relacionados con cómo y cuándo se recoge la información) como puedas; te ayudará a identificar problemas . En las encuestas online es muy sencillo . Por ejemplo, algunos encuestados pueden haber tenido problemas para ver una pregunta en un navegador concreto . Si recopilamos estos metadatos tendrás más probabilidades de entender el problema .

Si te estás planteando utilizar un panel de acceso online, merece la pena entender la información

siguiente para asegurarte de que eliges al adecuado para tu proyecto:

1. ¿Cómo se captan los nuevos miembros del panel? ¿Es un panel abierto o cerrado? ¿Dónde se capta? ¿Recompensan el registro de los panelistas para eliminar la autoselección?

Page 23: Fundamentos de la recolección de datos online

Fundamentos de la recolección de datos online 23

Datos de calidad

2. ¿Cómo recompensa el panel la participación? ¿Recompensan todas las participaciones o solo las que acaban en una encuesta válida? Los paneles que solo pagan las encuestas válidas tienen más probabilidades de recibir respuestas fraudulentas cuando se investigan poblaciones objetivo de difícil acceso .

3. ¿Cuántas encuestas realizan los panelistas al mes? Algunos paneles envían entre una y dos encuestas al día a los panelistas y los profesionalizan .

4. ¿Cuál es el tamaño real basándonos en el número máximo de resultados del panel? Este número es fundamental porque nos da mucha información del panel . Salvo que el panel se encuentre en fase de creación, cuando una empresa de paneles genera un volumen importante de actividad con un panel pequeño probablemente estaremos ante una empresa de river sampling y no un panel de verdad . Para asegurarte, pregunta cuál es el número máximo de resultados, esto es, el tamaño máximo de la muestra que nos puede ofrecer el panel en una encuesta de una toma . Esta respuesta nos aporta una información más valiosa que preguntar por el tamaño del panel porque muchas empresas cuentan como panelistas a personas que se han registrado hace mucho tiempo pero que no participan activamente .

5. ¿El panel cuenta con una certificación con una norma de calidad como ISO26362? Las normas ISO nos dan la seguridad de que el panel ha sido auditado y que quiere compartir la información anterior con transparencia .

Page 24: Fundamentos de la recolección de datos online

Fundamentos de la recolección de datos online 24

La privacidad se está convirtiendo en una de las principales preocupaciones de los usuarios de Internet . La investigación de mercados online se ve directamente afectada por este fenómeno porque, al

fin y al cabo, los investigadores recopilan información de las personas, y los participantes pueden

considerar algunos de los datos recopilados como altamente sensibles .

Como investigadores, esta es una cuestión importante . Los investigadores están obligados a

trabajar conforme al código de conducta del sector (las pautas ESOMAR) y deben cumplir todas

las obligaciones legales aplicables en el lugar donde recopilamos la información .

Deberíamos seguir la recomendación anterior por dos razones, fundamentalmente:

• Es nuestro deber como profesionales de la investigación de mercados . Tenemos que tender una relación de confianza con la población si queremos preservar nuestra profesión .

• Nuestros datos se pueden ver seriamente perjudicados si no damos seguridad a los participantes, ya que solo participarán aquellos que no se preocupen por las cuestiones de privacidad o, aún peor, nos darán información falsa .

Si vas a recolectar datos online, no olvides las recomendaciones siguientes:

1. Ofrece acceso a la política de privacidad, un documento en el que informamos de nuestra política a la hora de recolectar y difundir información de los participantes . Si utilizas un panel de acceso online, esto es responsabilidad del panel .

2. Comunícate de forma transparente con los panelistas durante toda su actividad: si recopilas información especialmente sensible, con la política de privacidad no es suficiente . Incluye mensajes claros en lugares clave de la encuesta .

3. Los casos siguientes son casos especiales que requieren un tratamiento distinto: incluir/recolectar cookies de terceros, recolectar información de navegación, pedir datos de geolocalización, pedir las direcciones de correo postal o electrónico y números de teléfono .

4. Cumple las obligaciones legales del país en el que recopilas la información, no solo en tu país de origen . Las obligaciones legales pueden variar enormemente entre países .

5. Ten en cuenta las diferencias entre países a nivel de privacidad . Por ejemplo, en Estados Unidos y Europa es habitual preguntar por los ingresos del hogar, la entidad bancaria y el número de hijos, pero en América Latina, estas preguntas se pueden considerar inadecuadas por el riesgo de secuestro .

Por último, para ayudarte a evaluar hasta qué punto la gente está dispuesta a participar en

proyectos de recolección de datos no convencionales (algunos de ellos estrechamente vinculados

a la privacidad), los resultados de una encuesta experimental realizada en el panel de Netquest dio

los resultados siguientes:

Privacidad

Page 25: Fundamentos de la recolección de datos online

Fundamentos de la recolección de datos online 25

Privacidad

Probar un producto en casa

Enviar fotos haciendo actividades concretas

Escanear códigos de barras de productos

Enviar la posición GPS

Grabar el rostro para medir las emociones viendo un vídeo

Instalar un medidor para hacer un seguimiento de la

información de navegación en el smartphone

Instalar un medidor para hacer un seguimiento de la

información de navegación en el ordenador

ACTIVIDAD DISTINTA A ENCUESTAS VOLUNTAD DE PARTICIPAR

72,4 %

54,9 %

51,8 %

20,0 %

17,4 %

17,0 %

15,8 %

Page 26: Fundamentos de la recolección de datos online

Fundamentos de la recolección de datos online 26

El reporting no forma parte del proceso de recolección de datos, así como tampoco la visualización (comunicación visual de los datos) . Ambas actividades conforman el punto de partida del análisis de los resultados .Sin embargo, la investigación online ha cambiado ligeramente el panorama: los datos se recogen

en tiempo real y los clientes quieren ver los resultados también en tiempo real . Esto implica que

las empresas de investigación de mercados ofrezcan dashboards online, herramientas de reporting

«hazlo tú mismo» e infográficos predefinidos que se llenan de datos tan pronto como se reciben .

Por descontado, estas soluciones extremadamente rápidas restringen el toque humano; el gran

valor que aporta un analista experto que profundiza en los datos para encontrar resultados

sorprendentes no es compatible con los resultados en tiempo real . Pero la velocidad es el mantra

de las empresas modernas y, como investigadores, no deberíamos ir a contracorriente .

Esto no significa que los análisis de resultados individualizados y exhaustivos carezcan de valor,

sino que debemos saber elegir entre ambos planteamientos en función del cliente y el problema

que se investiga, o combinarlos cuando fuere necesario . Por ejemplo, los clientes online (esto es,

de las páginas web de comercio online) están muy acostumbrados a trabajar con datos, de modo

que se sienten cómodos con un dashboard online, mientras que es probable que los clientes más

tradicionales no quieran prescindir de las recomendaciones personalizadas .

La mayoría de soluciones de software que se utilizan para recolectar datos online incluyen alguna

función de reporting online . Más allá de estos informes básicos, hay soluciones especializadas que

permiten implementar el reporting y la visualización avanzados . A modo de ejemplo, se enumeran

algunas de ellas a continuación:

• Dapresy (www .dapresy .com) ofrece herramientas de visualización de datos y herramientas de inteligencia empresarial que permiten a los investigadores procesar, analizar y crear dashboards basados en infográficos .

• Tableau (www .tableau .com) ayuda a los investigadores a ver y entender los datos . Permite conectar con casi todas las bases de datos, ofrece la función de arrastrar y soltar para crear visualizaciones y compartir con un solo clic .

• Qlik (www .qlik .com) ofrece plataformas intuitivas para la visualización de datos a medida, aplicaciones de análisis guiados, análisis integrados y reporting .

Reporting y visualización

Page 27: Fundamentos de la recolección de datos online

Fundamentos de la recolección de datos online 27

Reporting y visualización

• Microsoft BI (powerbi .microsoft .com) es un conjunto de herramientas de análisis empresarial para analizar datos y compartir información . MBI permite hacer un seguimiento de nuestra actividad y recibir respuestas rápidamente con unos dashboards muy completos disponibles en todos los dispositivos .

• IBM Cognos (www-03 .ibm .com/software/products/en/cognos-analytics) es una plataforma

BI para empresas para la detección de datos ordenada y el reporting gestionado que

automatiza la creación de informes y dashboards de modo que los usuarios puedan

hacerlo por sí mismos .

• Microstrategy (www .microstrategy .com) ofrece funciones de reporting para empresas y

detección de datos para la productividad móvil y la telemetría en tiempo real, y pone a

disposición de las empresas un amplio abanico de posibilidades para transformar sus datos

en inteligencia del mundo real .

Page 28: Fundamentos de la recolección de datos online

Contacto

EE .UU . & Canadá

[email protected]

Portugal

[email protected]

España

[email protected]

Europa & Asia

[email protected]

Colombia

[email protected]

Brasil

[email protected]

Cono Sur

[email protected]

México

[email protected]

netquest.com