el análisis de segmentación jerárquica mediante chaid · pdf filemanual,...

21
El análisis de segmentación jerárquica mediante CHAID Joaquín Aldás Manzano 1 Universitat de València Dpto. de Dirección de Empresas “Juan José Renau Piqueras” 1 Estas notas son una selección de aquellos textos que, bajo mi punto de vista, mejor abordan el tema analizado. Sus autores aparecen citados al principio de cada epígrafe, y a ellos hay que referirse cuando se citen los contenidos de estas notas. Mi única tarea ha sido la de seleccionar, ordenar y, en algunos casos traducir los textos originales.

Upload: danglien

Post on 07-Feb-2018

215 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: El análisis de segmentación jerárquica mediante CHAID · PDF filemanual, un empleado que no realiza trabajos manuales y un nivel ... Cuadro 1. Variables predictoras de la base de

El análisis de segmentación jerárquicamediante CHAID

Joaquín Aldás Manzano1

Universitat de ValènciaDpto. de Dirección de Empresas “Juan José Renau Piqueras”

1 Estas notas son una selección de aquellos textos que, bajo mi punto de vista, mejor abordan eltema analizado. Sus autores aparecen citados al principio de cada epígrafe, y a ellos hay quereferirse cuando se citen los contenidos de estas notas. Mi única tarea ha sido la de seleccionar,ordenar y, en algunos casos traducir los textos originales.

Page 2: El análisis de segmentación jerárquica mediante CHAID · PDF filemanual, un empleado que no realiza trabajos manuales y un nivel ... Cuadro 1. Variables predictoras de la base de

El análisis de segmentación mediante CHAID

1. ¿Qué es el análisis CHAID?(Magidson, 1993)

Supongamos que usted es el responsable de marketing directo que está encargadode vender suscripciones a una revista. Para maximizar sus beneficios, usted querráidentificar los segmentos de hogares que, según su experiencia en mailingsanteriores, mejor responden a una promoción de revistas. CHAID (Chi-SquaredAutomatic Interaction Detector) lleva a cabo una modelización del proceso desegmentación, que es útil cuando el objetivo global del investigador es dividir unapoblación en segmentos que difieren respecto a un criterio definido.

CHAID divide a la población en dos o más grupos distintos basados en lascategorías de la variable dependiente que es un mejor predictor. Luego dividecada uno de estos grupos en subgrupos más pequeños basándose en otras varia-bles predictoras. El proceso de partición, termina hasta que no se encuentranvariables que produzcan segmentos significativos. CHAID muestra los segmentosresultantes en un gráfico de árbol fácil de entender.

Los segmentos que construye CHAID son mutuamente excluyentes, es decir, lossegmentos no se superponen (un individuo no puede pertenecer a dos segmentos)y exhaustivos (un individuo ha de pertenecer siempre a un segmento, no puedenexistir individuos aislados).

2 Un ejemplo de aplicación del análisis chaid(Magidson, 1993; 1994)

Apliquemos el análisis CHAID para una promoción de marketing directo quetenía por objetivo animar a la gente a suscribirse a una revista. Los hogares querecibieron la promoción, fueron clasificados en tres grupos:

1. Los que responden y pagan. Esto es aquellos que remitieron el cupón desuscripción y luego aceptaron el cargo de la misma.

2. Los que responden y no pagan. Son aquellos que remitieron el cupón derespuesta pero cancelaron la suscripción antes de pagar.

3. Los que no responden, es decir, los que no devuelven el cupón desuscripción.

Joaquín Aldás ManzanoSegmentación mediante CHAID2

1

Page 3: El análisis de segmentación jerárquica mediante CHAID · PDF filemanual, un empleado que no realiza trabajos manuales y un nivel ... Cuadro 1. Variables predictoras de la base de

Como se verá, esta variable puede dicotomizarse para significar “responden”(niveles 1 y 2) y “no responden”, nivel 3.

Por su lado, el encargado de la promoción tenía en la base de datos utilizada, lassiguientes variables predictoras, recogidas en el cuadro 1.

1. El sexo del sustentador principal del hogar.2. Si el sustentador principal tiene o no hijos.3. La renta del hogar, agrupada en ocho categorías de menor a mayor

nivel de ingresos.4. Si ese hogar tiene o no tarjetas de crédito.5. Tamaño del hogar, medido por el número de miembros. Esta variable

tiene seis categorías. Las cuatro primeras indican directamente elnúmero de miembros (1= uno, 2 = dos, etc.). El código 5 se reservapara cinco o más miembros y el código 6 indica que el tamaño del hogares desconocido en la base de datos empleada.

6. Ocupación del sustentador principal. Sólo se sabe si es un obreromanual, un empleado que no realiza trabajos manuales y un nivelresidual de “otros”. El código 4 indica que es desconocida la ocupación.

En general, un análisis CHAID, necesita de estos dos tipos de variables señalados:

1. Una o más variables predictoras que se utilizarán para definir a lossegmentos. En la versión 6.0 de CHAID, cada variable predictora puedecontener hasta 31 categorías.

2. Una variable dependiente (que debe ser categórica) que es el criteriopara construir el modelo. También puede contener hasta 31 categorías.

3. Un método de análisis que será nominal u ordinal, como luego se expli-cará.

4. Si se elige el método ordinal, se debe ofrecer las puntuaciones de cadacategoría, como también se explicará más adelante.

Antes de comenzar el análisis CHAID, el programa exige que las variables predic-toras se clasifiquen en tres tipos: monotonic, free o float2. Las variables “monoto-nic” serán aquellas categóricas cuyas categorías tengan un orden natural en todossus niveles, como por ejemplo la variable ingresos de nuestra base de datos. Lasvariables tipo “float” serían idénticas a las anteriores, salvo para su último nivel,que normalmente representa valores perdidos. Es el caso de la variable edad de labase de datos. En las variables tipo “free” las categorías no tienen un ordennatural, corresponde a las variables estrictamente nominales, como la variableocupacn de la base de datos.

Joaquín Aldás ManzanoSegmentación mediante CHAID3

2

2 Se ha preferido mantener la notación en inglés para que sea más sencillo identificar a los trestipos de variables a la hora de seleccionarlos en los cuadros de diálogo del programa.

Page 4: El análisis de segmentación jerárquica mediante CHAID · PDF filemanual, un empleado que no realiza trabajos manuales y un nivel ... Cuadro 1. Variables predictoras de la base de

Las variables predictoras dicotómicas, por su lado, no necesitan ser clasificadaspor el investigador en ninguno de los niveles anteriores, dado que el programaautomáticamente las trata como “monotonic”.

Cuadro 1. Variables predictoras de la base de datos

1 = cuello blanco2 = cuello azul3 = otros4 = desconocido

Tipo de trabajo delsustentador principal

ocupacn

1 = uno2 = dos3 = tres4 = cuatro5 = cinco o más6 = desconocido

Número de miembros delhogar

tamhogar

1 = Sí2 = No

Existencia de tarjetas decrédito

tarjetas

1 = menos de $80002 = $8000-$99993 = $10000-$149994 = $15000-$199995 = $20000-$249996 = $25000-$349997 = $35000-$499998 = $50000 o más

Ingresos del hogaringresos

1 = Sí2 = No

Existencia de hijos en elhogar

hijos

1 = hombre2 = mujer

Sexo del sustentadorprincipal

sexo

1 = 18 a 24 años 2 = 25 a 34 años3 = 35 a 44 años4 = 45 a 54 años5 = 55 a 64 años6 = + 65 años7 = desconocido

Edad del sustentadorprincipal

EdadCodificaciónDescripciónVariable

En cada fase de división de la muestra, CHAID ofrece el valor p que puede inter-pretarse como la probabilidad de que la relación entre el predictor y la variable

Joaquín Aldás ManzanoSegmentación mediante CHAID4

3

Page 5: El análisis de segmentación jerárquica mediante CHAID · PDF filemanual, un empleado que no realiza trabajos manuales y un nivel ... Cuadro 1. Variables predictoras de la base de

dependiente sea significativa. El predictor con una p más baja es aquel que tendrála menor probabilidad de estar relacionado con la variable dependiente.

Finalmente, antes de desarrollar el ejemplo que estamos planteando, debemosseñalar que CHAID fusiona automáticamente aquellos niveles de la variablepredictora que no son significativamente distintos, lo que asegura que los casosdentro del mismo segmento son homogéneos respecto al criterio de segmentación,mientras que los casos de diferentes segmentos tienen a ser heterogéneos respectoal mencionado criterio de segmentación.

Veamos ya como llevar a cabo un análisis de segmentación tipo CHAID y cómointerpretar los resultados. Automáticamente, al abrir el análisis tipo CHAID deSPSS, se abre el cuadro de diálogo de la figura 1, donde deben indicarse cuálesson los predictores y cuál es la variable dependiente (en nuestro caso resp2 que esla variable de respuesta a la promoción dicotomizada).

Figura 1. Cuadro de diálogo para asignar las variables.

Pues bien, como “Dependent variable” se señalará a resp2 y como “Predictors” seseñalarán edad, sexo, hijos, ingresos, tarjetas, tamhogar y ocupacn. En nuestra

Joaquín Aldás ManzanoSegmentación mediante CHAID5

4

Page 6: El análisis de segmentación jerárquica mediante CHAID · PDF filemanual, un empleado que no realiza trabajos manuales y un nivel ... Cuadro 1. Variables predictoras de la base de

base de datos, existe un factor de elevación para cada cuestionario. Esta variable,que aparece como “freq” en la lista, sirve para indicar simplemente que si, porejemplo, toma un valor 10, existen diez hogares en la muestra exactamente conlas mismas respuestas, por lo que es innecesario introducirlos diez veces. Bastadecirle a CHAID que pondere ese cuestionario por diez. Esto se consigue introdu-ciendo “freq” como “Frequency Variable”.

El paso siguiente es indicar de qué tipo de los tres ya señalados (Monotonic, Floato Free) son cada uno de los predictores. Para ello se marcará el botón“Predictor” de la figura 1 y así se abrirá el cuadro de diálogo de la figura 2.Como ya se ha indicado, la variable edad deberá marcarse como “float”, dado quesu último nivel no guarda el orden natural al recoger valores perdidos, lo mismoque ocurre con “tamhogar”. La variable “ocupacn” se marcará como free, dadoque es estrictamente nominal. El resto no se indicarán porque el nivel por defectoes “monotonic” y todas las variables restantes o son de este tipo (ingresos) o sondicotómicas que son tratadas como “monotonic” por CHAID. Una vez hecho estose apretará la tecla “Continue”.

Figura 2. Cuadro de diálogo de las variables predictoras

A continuación hay que indicarle al programa cuales son las opciones estándar delalgoritmo de segmentación, que incluye la regla para dejar de segmentar y eltamaño mínimo del segmento que va a considerarse. Para abrir este cuadro dediálogo, basta apretar el botón “Standard”.

Joaquín Aldás ManzanoSegmentación mediante CHAID6

5

Page 7: El análisis de segmentación jerárquica mediante CHAID · PDF filemanual, un empleado que no realiza trabajos manuales y un nivel ... Cuadro 1. Variables predictoras de la base de

Figura 3. Cuadro de diálogo de las opciones estándar

� En el “Depth limit” será necesario indicar el número de niveles de segmenta-ción que va a pedirse a CHAID, es decir, el número de ramas en que se expan-dirá el gráfico de árbol. Indíquese “2” en el ejemplo.

� En “Before Merge Subgroup Size”, hay que indicarle a CHAID cuál es eltamaño de segmento inicial que no hay que intentar dividir. Se lo fijamos en4500 hogares.

� Por su parte, en “After Merge Subgroup Size” se le indica el tamaño delsegmento que, una vez comenzada la división no hay que intentar dividir enmás.

� Indicaremos marcando en “Auto” que sea el propio CHAID quien comience elanálisis automáticamente.

� Para seguir marcaremos “Continue”.

Una vez indicadas las preferencias, CHAID ya puede leer el fichero de datos, loque en la terminología del programa se conoce como “Scan Data”. Hay queapretar el botón con ese nombre que se observa en la figura 1. Antes de comenzar

Joaquín Aldás ManzanoSegmentación mediante CHAID7

6

Page 8: El análisis de segmentación jerárquica mediante CHAID · PDF filemanual, un empleado que no realiza trabajos manuales y un nivel ... Cuadro 1. Variables predictoras de la base de

el escaneo, CHAID pedirá que se cree un fichero para que se guarde el output quegenerará. Esta petición aparece en la figura 4 y al fichero le llamaremos resp2.chd.

Figura 4 Cuadro de diálogo para guardar el fichero de output

Una vez hecho esto, CHAID inmediatamente escaneará los datos, bastará decirle,a continuación, que genere el árbol. Esta salida se muestra en la figura 5. Y serála base para comentar los resultados a los que se ha llegado con el análisis desegmentación.

Joaquín Aldás ManzanoSegmentación mediante CHAID8

7

Page 9: El análisis de segmentación jerárquica mediante CHAID · PDF filemanual, un empleado que no realiza trabajos manuales y un nivel ... Cuadro 1. Variables predictoras de la base de

Figura 5. Diagrama de árbol.

resp21: 1.15%n=81040

11: 1.09%n=25384

-1-

231: 1.52%n=16132

11: 2.39%n=1758

-2-

ocupacn

2-.1: 1.42%n=14374

-3-

4c1: 1.92%n=6198

-4-

tamhogar

.1: 0.87%n=33326

h1: 0.81%n=25531

-5-

sexo

m1: 1.08%n=7795

-6-

Haciendo doble click sobre el nodo “Total” aparece las tablas cruzadas de lavariable dependiente (en columnas) con la variable independiente que sirve paradiscriminar en ese nodo (en este caso el tamaño del hogar). Asimismo ofrece lastablas cruzadas tanto antes como después de la fusión, permitiéndonos visionarlatanto en porcentajes verticales como horizontales o totales y en frecuencias. Lafigura 6 nos muestra ambas tablas cruzadas.

Figura 6 Tablas para el primer nodo antes y después de la fusión

Joaquín Aldás ManzanoSegmentación mediante CHAID9

8

Page 10: El análisis de segmentación jerárquica mediante CHAID · PDF filemanual, un empleado que no realiza trabajos manuales y un nivel ... Cuadro 1. Variables predictoras de la base de

Los resultados del análisis CHAID pueden mostrarse también en forma de tablasde ganancias, que resumen los segmentos del árbol. Para obtener estas tablas hayque abrir el menú “Ventana” y seleccionar “Gains Chart Options” apareciendo elcuadro de diálogo de la figura 7. Se marcará “Responders” para que aparezcanen cada segmento el total de respuestas y sus respectivos porcentajes. Se apreta-rá “Close” y se solicitará en el menú de “Ventana” la opción “Gains Chart” quenos ofrecerá la tabla que aparece en la figura 8.

Joaquín Aldás ManzanoSegmentación mediante CHAID10

9

Page 11: El análisis de segmentación jerárquica mediante CHAID · PDF filemanual, un empleado que no realiza trabajos manuales y un nivel ... Cuadro 1. Variables predictoras de la base de

Figura 7. Cuadro de diálogo de las opciones de Gains Chart

Figura 8. Tablas de Gains Chart

Joaquín Aldás ManzanoSegmentación mediante CHAID11

10

Page 12: El análisis de segmentación jerárquica mediante CHAID · PDF filemanual, un empleado que no realiza trabajos manuales y un nivel ... Cuadro 1. Variables predictoras de la base de

Finalmente, la última salida que será necesaria para analizar los resultados deCHAID, será la que nos resuma por deciles las tablas de ganancias. Paraobtenerla pincharemos en el nodo raíz, abriremos el menú de “Tree” y selecciona-remos “Prune”. Aparecerá una advertencia diciéndonos que se borrará el árbolentero, aceptaremos. Abriremos a continuación el menú “Windows” y selecciona-remos “Gains Chart Options”, marcaremos “Summary” y “Responders” y luegoapretaremos el botón “Close”. Volveremos al menú de ”Windows” y seleccionare-mos “Gains Chart”, lo que nos permitirá obtener la tabla que aparece en la figura9.

Figura 9. Resumen de los Gain Chart

Este resumen de “Gains Chart” se ofrece sin considerar predictor alguno, parautilizar el tamaño del hogar como predictor y obtener de nuevo el resumenanterior marcaremos en el menú de “Tree” en “Select” y seleccionaremos la varia-ble “tamhogar”, nos aparecerá el resumen para ese nodo, como vemos en la figura10.

Joaquín Aldás ManzanoSegmentación mediante CHAID12

11

Page 13: El análisis de segmentación jerárquica mediante CHAID · PDF filemanual, un empleado que no realiza trabajos manuales y un nivel ... Cuadro 1. Variables predictoras de la base de

Figura 10 Resumen de Gains Chart para “tamhogar”

Puede repetirse el mismo procedimiento para cualquier nodo que nos interese,basta con desplazarnos mediante las flechas a ese nodo, abrir el menú “Tree”,seleccionar “Select” y marcar OK. La figura 11 muestra el ejemplo para la varia-ble “ocupacn” que por lo tanto está considerando dos predictores “tamhogar” y“ocupacn”.

Joaquín Aldás ManzanoSegmentación mediante CHAID13

12

Page 14: El análisis de segmentación jerárquica mediante CHAID · PDF filemanual, un empleado que no realiza trabajos manuales y un nivel ... Cuadro 1. Variables predictoras de la base de

Figura 11. Gains Chart para dos predictores

Finalmente, para evaluar la rentabilidad de los segmentos, en lugar de hacerloúnicamente respecto a sus tasas de respuesta, pueden dárseles puntuaciones explí-citas en términos económicos. Por ejemplo se puede valorar una respuesta pagadacon $35 de beneficio una respuesta no pagada con –$7 de pérdidas (el coste delmail más la copia de regalo que se envía) y una no respuesta con –$0.15 de pérdi-das. Como estamos trabajando con una variable dicotómica (respuesta norespuesta) y la respuesta incluye la pagada y la no pagada, sería necesario evaluarel beneficio de la respuesta según los dos tipos existentes. Si hacemos un descrip-tivo de esa variable vemos que hay 478 respuestas pagadas y 453 no pagadas,luego el beneficio de la respuesta sería:

(35×478–7 ×453)/(478+453) = $14,56

Para introducir esos pesos, es necesario seleccionar en la ventana de “Method” laopción “ordinal”, abriéndose en ese momento la ventana que nos permite introdu-cir los pesos, tal y como aparece en la figura 12.

Joaquín Aldás ManzanoSegmentación mediante CHAID14

13

Page 15: El análisis de segmentación jerárquica mediante CHAID · PDF filemanual, un empleado que no realiza trabajos manuales y un nivel ... Cuadro 1. Variables predictoras de la base de

Figura 12 Introducción de los pesos

A partir de aquí, tras marcar OK, basta ir al menú “Tree” seleccionar Auto y serecalcula todo el análisis con esos pesos. Para pedir todas las salidas anteriores(Gains Chart, Gains Chart Summary, etc) basta repetir el proceso ya explicado.

Hasta aquí hemos explicado como manejar el programa para llevar a cabo unanálisis de segmentación CHAID, pero no hemos entrado en la interpretación delos resultados que, realmente, es lo importante. Dedicaremos a ello la parte finalde este tema.

La primera salida que nos ofrece CHAID es el llamado diagrama de árbol querecogimos en la figura 5. En este gráfico, el nivel 1 recoge al total de la muestra(“Total”) que son 81.040 hogares, de los cuales han respondido al mailing un1,15%. El nodo raíz se divide en cuatro subnodos que se forman mediante lascategorías del mejor predictor que es el tamaño del hogar. Observamos inmediata-mente que aunque esta variable tiene 6 categorías, CHAID ha encontrado quealgunos de estos grupos no eran significativamente distintos los ha fusionado enun solo grupo. Así aparecen los siguiente cuatro:

Joaquín Aldás ManzanoSegmentación mediante CHAID15

14

Page 16: El análisis de segmentación jerárquica mediante CHAID · PDF filemanual, un empleado que no realiza trabajos manuales y un nivel ... Cuadro 1. Variables predictoras de la base de

� El formado por aquellos hogares con un sólo miembro (“1”), que correspondea 25.384 hogares. El porcentaje de respuestas entre ellos es del 1.09%.

� El formado por los hogares con dos o tres miembros. Es la primera de lasfusiones y se identifica como tal porque en la etiqueta aparecen juntos loscódigos 2 y 3 (“23”). Está formado por 16.123 hogares y la tasa de respuestaentre ellos ha sido del 1,52%.

� El formado por los hogares con cuatro miembros o cinco o más, que es lasegunda fusión. En la etiqueta aparece como “4c” y está formado por 6.198hogares. La tasa de respuesta entre ellos es del 1,92%.

� El último grupo es el de los hogares de tamaño desconocido, en cuya etiquetaaparece el símbolo del valor perdido “.”. La tasa de respuesta entre ellos es del0,87% y contiene a 33.326 hogares.

A continuación CHAID divide a los grupos donde puedan apreciarse diferenciassignificativas respecto a la variable dependiente considerando otro predictores.Así, el grupo “23” lo separa en dos segmentos mediante la siguiente variable quemás discrimina, la ocupación del sustentador principal. Distinguiendo entreaquellos que tienen trabajos de cuello blanco (“1”) y todos los demás (“2-.”). Lomismo hace con el grupo de hogares de tamaño desconocido que divideatendiendo a la variable sexo en otros dos segmentos.

Después de este proceso ¿qué segmentos ha encontrado CHAID? En el gráfico deárbol, el programa los identifica con un número entre guiones (-1-, -2-,..., -6-) ypueden describirse del siguiente modo:

� SEGMENTO 1. Hogares unipersonales.� SEGMENTO 2. Hogares de dos o tres personas donde la ocupación del

sustentador principal es de “cuello blanco”.� SEGMENTO 3. Hogares de dos o tres personas donde la ocupación del

sustentador principal es distinta a la de “cuello blanco”.� SEGMENTO 4. Hogares de cuatro o más individuos.� SEGMENTO 5. Hogares de tamaño desconocido donde el sustentador princi-

pal es hombre.� SEGMENTO 6. Hogares de tamaño desconocido donde el sustentador princi-

pal es mujer.

Si se quiere llevar a cabo un seguimiento más detenido del procedimiento dedivisión y fusión, se puede solicitar al programa las tablas para cada uno de losnodos antes y después de la fusión, como se hizo en la figura 6, cuyos resultadosresumimos a continuación en el cuadro 2.

Joaquín Aldás ManzanoSegmentación mediante CHAID16

15

Page 17: El análisis de segmentación jerárquica mediante CHAID · PDF filemanual, un empleado que no realiza trabajos manuales y un nivel ... Cuadro 1. Variables predictoras de la base de

Cuadro 2. Comparación de las tasas de respuesta antes y después de la fusión según tamaño del hogar.

0,870,8733.326Desconocido1,922,06b3.0115 o más1,921,79b3.18741,521,59a4.89231,521,49a11.24021,091,0925.3841

Despuésfusión

Antesfusión

Porcentaje de respuestaN

Tamañodel

hogar

a,b Estos porcentajes no son significativamente distintos unos de otros y susgrupos son fusionados por CHAID

Pero es evidente que no basta con identificar los segmentos, de alguna manera esnecesario ordenarlos atendiendo a su capacidad para generar respuestas anuestros mailings. Esta información se logra mediante los cuadros de ganancias yresumen de ganancias, que indicamos cómo obtener en las figuras 8 a 11 y queaparecen recogidos en los cuadros 3 y 4.

El cuadro 3 se conoce como gráfico de ganancias detallado, a partir del momentoen que contiene una fila por segmento. Ordena los seis segmentos que ha obteni-do CHAID del mejor al peor según la tasa de respuesta. Así vemos que el mejorsegmento es el número 2 que, recordemos, era el formado por hogares de dos atres miembros cuyo sustentador principal tiene un trabajo de “cuello blanco”,dado que es el que tiene una mayor tasa de respuesta a nuestro mailing (2,4%) yque es un segmento formado por 1758 hogares (un 2,2% del total). Si analizamoslas columnas de porcentajes acumulados, vemos que los tres primeros segmentos,que suponen un 27,6% de la muestra, acumulan el 39,2% de las respuestas.Aparece una columna llamada índice, que resume la clasificación de cadasegmento tomando como base el peor que es igual a 100.

El cuadro 4 se conoce como cuadro de ganancias resumen y se construyedividiendo a la muestra en deciles donde los hogares están ordenados de mayor amenor índice de respuesta. Así la fila 1, corresponde al mejor 10% de los hogares(8.104) que tienen una tasa media de respuesta del 2,01% que sería la respuestaprevista si sólo los eligiéramos a ellos para el mailing. Este 10% de los hogaresacumulará por sí solo el 17,5% del total de respuestas.

Y, ¿quiénes componen ese 10% de los hogares?. Si en total son 8104 hogares,estará formado por los 1.758 del segmento 2, los 6198 del segmento 4 y losmejores hogares (hasta 148) del segmento 3.

Joaquín Aldás ManzanoSegmentación mediante CHAID17

16

Page 18: El análisis de segmentación jerárquica mediante CHAID · PDF filemanual, un empleado que no realiza trabajos manuales y un nivel ... Cuadro 1. Variables predictoras de la base de

Cuadro 3. Cuadro de ganancias

100100,01,1931100,081.040700,820625.5315611477,91,372568,555.509941,1847.7956511768,91,364158,947.714951,127625.3841414239,21,636527,622.3301241,420414.3743317617,32,01619,87.9561671,91196.198422084,52,4422,21.7582082,4421.75821

Indice% del totalTasa (%)respuesta

Respuestas% del totalTamañomuestral

IndiceTasa (%)respuesta

RespuestasTamañomuestral

AcumuladosSegmentos individualesSegmentoPuesto

Joaquín Aldás ManzanoSegmentación mediante CHAID18

17

Page 19: El análisis de segmentación jerárquica mediante CHAID · PDF filemanual, un empleado que no realiza trabajos manuales y un nivel ... Cuadro 1. Variables predictoras de la base de

Cuadro 4. Resumen de cuadro de ganancias al nivel 2

1001,15100,093181.0401001031,1892,486072.936901061,2284,979064.832801101,2777,371956.728701161,3369,764948.624601211,3960,456340.520501271,4651,047532.416401381,5941,538724.312301491,7229,927816.208201752,0117,51638.10410

IndicePuntuación% derespuestasRespuestasTamañoProfundidad

de selección

¿Cuál es la utilidad de este cuadro?. Supongamos que disponemos de recursos muylimitados y sólo podemos hacer un mailing de 50.000 cartas. Deberíamos seleccionaraquellos hogares que vayan a producir más respuestas. Vemos que 50.000 cartas nosproporcionaría una tasa de respuesta en torno al 1,33% y para ello deberíamos dirigir-las a los hogares de los segmentos 2, 4, 3 y 1 (y algunos del 6 hasta completar los50.000).

Hasta este momento el análisis ha sido llevado a cabo tomando como criterio desegmentación el porcentaje de respuestas. Sin embargo, en un momento determinado,podemos plantearnos realizar el análisis en términos de rentabilidad económica. Yaexplicamos que podemos suponer que una respuesta pagada nos proporciona un benefi-cio de $35, una respuesta no pagada un coste de –$17 (mailing más número de regalo)y una no respuesta un coste de –$0.15 (el mailing). CHAID nos permite introducirestos pesos en el algoritmo de segmentación (véase la figura 12) y llevar a cabo el análi-sis en términos económicos. Las salidas relevantes son las mismas que en el ejemploanterior y se resumen en la figura 10 y los cuadros 5 y 6.

Figura 10. Diagrama de árbol

resp20.02

n=81040

10.01

n=25384

-1-

230.07

n=16132

10.20n=1758

-2-

ocupacn

2-.0.06

n=14374

-3-

4c0.13

n=6198

-4-

tamhogar

.-0.02

n=33326

h-0.03

n=25531

-5-

sexo

m0.01

n=7795

-6-

Joaquín Aldás ManzanoSegmentación mediante CHAID19

18

Page 20: El análisis de segmentación jerárquica mediante CHAID · PDF filemanual, un empleado que no realiza trabajos manuales y un nivel ... Cuadro 1. Variables predictoras de la base de

Cuadro 5. Cuadro de ganancias

1000,02100,081.040-164-0,0325.531562220,0468,555.509450,017.795652510,0558,947.714520,0125.384144760,0927,622.3303090,0614.374337780,159,87.9566970,136.19842

1.0610,202,21.7581.0610,21.75821

IndiceBeneficio% del totalTamañomuestral

IndiceBeneficioTamañomuestral

AcumuladosSegmentos individualesSegmentoPuesto

Cuadro 6. Resumen de cuadro de ganancias al nivel 2

1000,0281.0401001290,0272.936901660,0364.832802140,0456.728702470,0548.624602860,0540.520503440,0732.416404420,0824.312305390,1016.208207690,158.10410

IndiceBeneficioTamañoProfundidadde selección

Analizando el gráfico, vemos que para el conjunto de hogares, la media de beneficio esde $0,02, pero evidentemente no todos los segmentos tienen la misma esperanza debeneficios. El mejor segmento (cuadro 5), que sigue siendo el 2, tiene una gananciaesperada de $0,2 mientras que el peor (segmento 6) ocasiona unas pérdidas de –$0,03.Si nuestro objetivo es no incurrir en pérdidas en ningún segmento no enviaríamoscartas al segmento 5 y si sólo podemos llevar a cabo un mailing de 50.000 cartas,obtendríamos un beneficio promedio de $0,05 (cuadro 6). Si no queremos ganar menosde $0,08 por carta, sólo deberíamos enviar 24.000 a los mejores segmentos que, ennuestro caso serían los 2, 4 y 3 (y completaríamos hasta las 24.000 con el 1).

Joaquín Aldás ManzanoSegmentación mediante CHAID20

19

Page 21: El análisis de segmentación jerárquica mediante CHAID · PDF filemanual, un empleado que no realiza trabajos manuales y un nivel ... Cuadro 1. Variables predictoras de la base de

Referencias bibliográficasMAGIDSON, J. (1993): SPSS for Windows CHAID Release 6.0. Chigago: SPSS Inc.MAGIDSON, J.(1994): The CHAID approach to segmentation modeling. En Bagozzi,

R.P. (ed). Advanced Methods in Marketing Research. Cambridge: Blackwell.

Joaquín Aldás ManzanoSegmentación mediante CHAID21

20