Download - Caso de Estudio: Powerade
1
Caso de Estudio: Powerade
Coca Cola FEMSA es la embotelladora más grande de la marca Coca-Cola a nivel mundial, al atender
2.9 millones de puntos de venta y comercializar 3.2 billones de cajas por año1Ingresa al mercado
colombiano en el 2003, año en el que adquiere el 100% del sistema Coca-Cola de América Latina. La
compañía maneja bebidas carbonatadas como no carbonatadas bajo varias marcas, tales como.
Coca-Cola, Fanta, Sprite, Fresca, Ciel, Café Black, Fuze Tea y Powerade. Con la marca Powerade se
embotellan exclusivamente bebidas isotónicas que buscan rehidratar y reponer minerales perdidos
en la actividad física. Según consultas a representantes de la empresa, las principales bebidas que le
compiten en el país se encuentran Gatorade (84,7% del mercado), Squash (0,1%) y Sporade (3,3%);
En este mercado Powerade ocupa el segundo lugar con (12%).
FEMSA Colombia ha concluido que el mercado de bebidas isotónicas no está completamente
atendido y considera que existe la oportunidad de aumentar su pool de consumidores del 12% al
21%2. Con el objetivo de alcanzar la meta del 21%, el presente estudio se orienta a identificar a los
clientes a los que Coca-Cola FEMSA debe ofrecer sus bebidas isotónicas para así capturar el mercado
desatendido de Bogotá, que representa el 16% de ventas de bebidas isotónicas del país.
En el marco del objetivo mencionado este estudio busca encontrar los factores que explican el
éxito de un cliente de bebidas isotónicas a fin de identificar otros clientes que teniendo
características similares, no alcanzan el mismo nivel de ventas. Es importante señalar que no se
busca identificar dónde abrir nuevos puntos de venta exitosos.
Los clientes de FEMSA Colombia para bebidas isotónicas cubren un gran número de canales, cerca
de 27, que involucran desde grandes superficies como súper-mercados hasta pequeños
comercializadores como porterías. Sin embargo, a partir del análisis histórico de ventas y de la
opinión experta de los representantes de la compañía, se acordó que el estudio se debería centrar
en cuatro canales: i) Licorerías/Cigarrerías, ii) Mini-mercados, iii) Tiendas de Barrio y iv) Panaderías.
Con base en los datos suministrados por Coca-Cola FEMSA se puede afirmar que la distribución de
las transacciones por canal no es uniforme. Es así que en 2014 los tres (3) mejores canales
participan con más del 50% donde los supermercados presentan la mayor participación, seguidos de
las Tiendas de Barrio y los Mini-mercados. Es de tener en cuenta que en este caso de estudio no se
incluyeron los supermercados por solicitud de FEMSA Colombia 2 (Ver Figura 1).
1 Según la Página oficial de FEMSA: http://www.femsa.com/es
2 Según reunión realizada con representantes de la empresa el 19 de agosto de 2015
2
Figura 1. Distribución de Transacciones por Canal (2014)
De otra parte, Coca-Cola FEMSA no puede determinar si el nivel de transacciones de un
determinado cliente se explica en características tales como cercanía a sitios de interés o si estas no
se están aprovechando para lograr mayores transacciones de Powerade. Igualmente la Firma no
cuenta con herramientas para determinar el éxito de un cliente para bebidas isotónicas pues no ha
realizado los análisis correspondientes. Esto significa que una de las dificultades a atender se
presenta como problema “no supervisado”.
Otro de las complicaciones que enfrenta el análisis se relaciona con el número de clientes de FEMSA
Coca-Cola en Bogotá, que son alrededor de 165’000, cada uno de los cuales cuenta con más de 12
características intrínsecas.
Finalmente también se presenta el problema de la distribución no uniforme en la ciudad de los
19’338 clientes, pertenecientes a los cuatro (4) canales estudiados durante el año 2015. (Ver Figura
2).
3
Figura 2. Clientes del 2015 de los canales: Mini-mercados, Panaderías, Tiendas de Barrio y
Licorerías/ Cigarrerías
Ante la situación anteriormente descrita y teniendo en cuenta que el objetivo de Coca-Cola FEMSA
es aumentar el porcentaje de participación en el mercado de bebidas isotónicas a través de la
captura del mercado desatendido, la pregunta que se debe resolver es: ¿A cuáles clientes de la
ciudad de Bogotá, pertenecientes a los cuatro (4) canales escogidos, se le debe ofrecer Powerade?
Análisis Exploratorios
Para resolver la pregunta de Coca-Cola FMSA se ha realizado el siguiente análisis respecto al
comportamiento de las transacciones de Powerade y las características de los clientes:
Con base en el registro de ventas realizado entre el primer trimestre de 2012 y el segundo trimestre
de 2015 se observa una tendencia creciente en las ventas de bebidas isotónicas siendo el
más importante el verificado en el segundo trimestre del 2015. Además de la clara
tendencia creciente, se verifica que actos como la promoción de Powerade durante la Copa
América de futbol3 mejoran el nivel de ventas de manera significativa. (Ver Figura 3)
3 Según datos suministrados por la firma
4
Figura 3. Registro de Ventas. Desempeño Trimestral (2012-2015)
Un análisis sobre la estratificación del mercado realizado para el 2014 muestra que si bien la mayoría
de ventas se realizan a clientes de estrato III, con una diferencia de más de mil unidades transadas
con respecto a los otros estratos, en promedio, el estrato V tiene el mejor comportamiento al
superar en 3 transacciones al segundo mejor estrato que es el IV. (Ver Figura 4)
Figura 4. Promedio de Transacciones por Estrato (2014)
Según la clasificación de la firma en clientes oro, plata y bronce establecida según la demanda de
productos Coca-Cola, de los datos obtenidos resulta que en promedio el mayor número de
transacciones corresponde a los clientes plata (Ver Figura 5). Esto quiere decir que los clientes que
más piden productos Coca-Cola, en promedio, no son los que más bebidas isotónicas solicitan.
5
Figura 5. Promedio de Transacciones por Calificación (2014)
En cuanto a la distribución de ventas según la localización, la información muestra que el mayor
número de transacciones se realiza en Bogotá Norte donde es 4 veces superior a la cantidad
transada en Bogotá Sur. Esta información no significa que el 100% de esta cantidad se distribuya en
Bogotá Norte pues según información obtenida en reunión con representantes de FEMSA, ciertos
clientes que reciben los productos en centros de distribución ubicados en Bogotá Norte los trasladan
a zonas en el Sur por sus propios medios. (Ver Figura 6).
Figura 6. Distribución de Ventas por Localización
6
Descripción de los Datos
Para lograr identificar a cuáles clientes se les debe ofrecer bebidas Powerade, se cuenta con la
información asociada a las características de los clientes durante el período comprendido entre
enero del 2012 y junio del 2015.
La información se organiza en las siguientes variables:
CEDIS: Variable binaria que divide a los clientes según su localización: al sur de la calle 13 o al
norte de esta.
OUTNUM: Número de identificación del cliente
GEC: Puntaje interno asignado a los clientes de FEMSA Colombia según la cantidad de
bebidas de marca Coca-Cola que estos compran, siendo oro (O) la más alta categoría, plata
(P) la segunda y bronce (B) la más baja.
NSE: Estrato dominante en el entorno del establecimiento del cliente, lo cual se desprende
de la estratificación incluida en las facturas de servicios públicos.
CREDAT: Fecha en la cual el establecimiento se ha formalizado como cliente.
SELMOD: Modo de venta de los productos al cliente a través de pre-vendedores,
distribuidores autorizados, auto-venta y call center.
CANAL: Canal al cual pertenece el cliente.
SPRDAT: Fecha de salida del cliente de la lista de clientes de Coca-Cola FEMSA.
NEVERAS: Número de neveras que tiene el cliente (provistas por FEMSA).
PUERTAS: Número de puertas totales que tienen las neveras.
LONGITUD: Distancia expresada en grados entre el meridiano del cliente y el meridiano de
Greenwich a lo largo de la línea ecuatorial.
LATITUD: Distancia expresada en grados entre la posición geográfica del cliente y la línea
ecuatorial.
Adicionalmente, se posee información sobre todas las transacciones de bebidas Powerade durante
el período comprendido entre enero del 2012 y junio del 2015, con los siguientes datos:
FECHA: Fecha de la transacción: año, mes y día.
LOCACION: Variable binaria que registra si el cliente se encuentra al sur de la calle 13 o al
norte de esta.
ARTNAM: Nombre de referencia del producto Powerade pues este tipo de bebida ofrece
varios sabores.
ARTNUM: Número de la referencia del producto.
TRANSACCIONES: Número de unidades compradas por cliente.
La información provista por FEMSA Colombia incluye datos sobre lugares que podrían afectar el
volumen de ventas del establecimiento, por ejemplo parques o gimnasios:
NOMBRE: Nombre del sitio de interés.
CATEGORIA: Tipos de sitio de interés clasificados en 14 categorías.
LONGITUD: Distancia expresada en grados entre el meridiano del sitio de interés y el
meridiano de Greenwich a lo largo de la línea ecuatorial.
7
LATITUD: Distancia expresada en grados entre la posición geográfica del sitio de interés y la
línea ecuatorial.
Con el fin de asociar a los clientes con los sitios de interés se ha identificado el número de sitios de
interés de cada categoría que se encuentran a 250, 500, 750 y 1000 metros. Por ejemplo COLE 1000
representa el número de colegios localizados a menos de mil metros del cliente. También se ha
identificado con base en las transacciones, los días que han pasado desde el último pedido de un
cliente. En adición, se transforman algunas variables, las puntuaciones RFM y RFMM mediante el
análisis por componentes principales para obtener dos de ellos.
El data set final contiene la siguiente información adicional a data set la inicial:
Recencia: Número de días transcurridos desde la última compra del cliente.
Frecuencia: Número de transacciones promedio del año.
Monetario: Cantidad de unidades transadas en el último año.
Media Monetaria: Cantidad promedio de unidades transadas en el último año.
RP: Puntaje de recencia de acuerdo al análisis RFM.
FP: Puntaje de frecuencia de acuerdo al análisis RFM.
MP: Puntaje de monetario de acuerdo al análisis RFM.
MMP: Puntaje de la media monetaria de acuerdo al análisis RFM.
Componente 1: Puntaje asignado al cliente para ser proyectado en el primer componente de
Componentes Principales.
Componente 2: Puntaje asignado al cliente para ser proyectado en el segundo componente
de Componentes Principales.
Cluster: Agrupación a la cual pertenece el cliente.
Metodología Aplicada
RFM
El análisis RFM se basa en asignar a cada cliente una puntuación de 1 a 5 en los siguientes factores:
recencia (R), frecuencia (F) y monetario (M). La puntuación en cada factor se determina ordenando a
los clientes en función de su desempeño con el objetivo de asignar a los quintiles puntuaciones de 5
a 1 de mejor a peor.
Es importante resaltar que la puntuación de cada factor es independiente de los otros. Como los
clientes pueden ser exitosos en dos dimensiones diferentes, ya sea por la cantidad de unidades
adquiridas, ya sea por la rotación del inventario, se realiza un análisis paralelo que consiste en
cambiar el factor monetario (M) por el factor media monetaria (MM) a fin de tener en cuenta la
segunda dimensión de éxito.
Los factores de los análisis RFM y RFMM son los siguientes:
Recencia: Cantidad de días transcurridos desde la última compra.
Frecuencia: Número de pedidos durante un período de tiempo.
8
Monetario: Cantidad de unidades adquiridas durante un período de tiempo.
Media Monetaria: Promedio de unidades adquiridas.
Como resultado del análisis RFM, a cada observación se le asignan cuatro (4) puntuaciones, una por
cada factor evaluado. Adicionalmente, se asignan dos puntuaciones que combinan la puntuación de
algunos factores en un único valor. Recencia, Frecuencia y Monetario para RFM y Recencia,
Frecuencia y Media Monetaria para RFMM. El resultado debe leerse de la siguiente manera: A más
alto sea el valor de la puntuación combinada, mejor será la observación. En total, resultaron 125
combinaciones diferentes de puntaje para RFM y 125 para RFMM. Con base en la aplicación del
análisis, la calificación más alta la obtienen las observaciones con puntaje de 555.4
Clúster (Análisis de conglomerados)
El Clustering consiste en hallar sub-grupos en un data set. Los grupos se organizan de tal manera que
las observaciones similares entre ellas y son diferentes a los otro sub-grupos. Es de recordar que los
clústers cubren todo el rango y no se intersecan entre ellos. Es decir que ninguna observación puede
pertenecer a dos clusters y todas las observaciones pertenecen a algún clúster.
El K medias Clustering, previo al algoritmo, determina el número de Clúster (K) resultantes. El
algoritmo busca minimizar la varianza entre las observaciones de cada clúster. El algoritmo se
desarrolla en tres pasos: Primero, asigna cada observación uno de los clústers de manera aleatoria.
Segundo, calcula el centroide de cada clúster y tercero, asigna a cada observación al clúster más
cercano por distancia Euclidiana al centroide. Los pasos 2 y 3 se repiten hasta que las observaciones
no cambien de clúster.5
Al final del algoritmo cada observación pertenecerá a un único clúster junta a sus similares.
Componentes Principales
El análisis de Componentes Principales permite resumir varias variables altamente correlacionadas a
un menor número de ellas que explican la mayor parte de la variabilidad de los datos del set original.
Este análisis se realiza sobre las variables independientes y no sobre las variables dependientes por
lo que se considera un método no supervisado. El primer componente es el hiperplano que mejor
explica la varianza de las variables por lo que minimiza la distancia Euclidiana, al hiperplano de cada
observación. El segundo componente encuentra el siguiente hiperplano ubicado más cerca de los
datos con base en la distancia Euclidiana y a su vez explica la siguiente mayor varianza. Esto significa
que se realiza una transformación de los datos para encontrar las dimensiones que mejor explican el
comportamiento de las observaciones.6
4 Ver: IBM SPSS Direct Marketing 20.
ftp://public.dhe.ibm.com/software/analytics/spss/documentation/statistics/20.0/es/client/Manuals/IBM_SPSS_Dir
ect_Marketing.pdf
5 Ver: James Gareth et alt: “An introduction to Statistical Learning”. Ed. Spinger 2014, pág. 385
6 Ver: James Gareth et alt: “An introduction to Statistical Learning”. Ed. Spinger 2014, págs. 256,380.
9
Al realizar Componentes principales se reduce la dimensionalidad del problema y permite realizar
otros procesos de manera más sencilla, como es, la interpretación de las características de un
clúster.
GAMs (Modelo Predictivo)
Este es un modelo aditivo generalizado, GAMs, por sus siglas en inglés que calcula la suma de las
influencias de cada variable independiente en la variable dependiente.
El modelo permite superar la linealidad al evaluar funciones no lineales para cada variable. Estas
funciones son llamadas cubic splines pues crean polinomios de grado 3 en varios rangos del dominio
de la variable. El número de rangos es definido con grados de libertad los cuales se utilizan para
calibrar el modelo. En consecuencia, a mayor grado de libertad mayor número de particiones en el
rango de la variable lo que resulta en mayor número de cubic splines. Un mayor número de cubic
splines aumenta la flexibilidad del modelo al ajustarlo a las observaciones con mayor precisión.
Una de las grandes ventajas que tiene el modelo es que al ser aditivo se puede apreciar la influencia
de cada variable independiente en la variable de respuesta.
Resultados Obtenidos
Con el fin de hacer comprensible la aplicación de la metodología y evitar una presentación extensa
se explican a continuación los resultados generales en todos los canales y para resultados
específicos se muestran para el canal Tiendas de Barrio.
RFM
Al aplicar el análisis RFM y RFMM se logró calificar el desempeño de los clientes. Los resultados en
RFM muestran que más del 10% de los clientes en los cuatro (4) canales estudiados recibieron
puntuación perfecta, mientras que en RFMM ningún canal superó este porcentaje de clientes. En
ambos análisis, el canal Mini-mercados registra mayor porcentaje de clientes con puntuación 555
siendo las Tiendas de Barrio las que obtienen el porcentaje mas bajo.
A partir de resultados del análisis RFM y RFMM se concluye que el RFMM es un análisis más exigente
por cuanto reduce al 50% la cantidad de clientes con puntuación perfecta identificados en el análisis
RFM. De todas formas, es importante señalar que no solamente los clientes con puntuaciones
perfectas son aquellos exitosos. (Ver Tabla 1).
10
Tabla 1. Puntuaciones Perfectas por Canal, RFM y RFMM
Canal Puntuación Perfecta Porcentaje Factores
Cigarrería / Licorería 157 11.28% Recencia Frecuencia Monetario
Mini-mercados 445 24.28%
Panadería 328 10.59%
Tiendas de Barrio 651 10.48%
Cigarrería / Licorería 66 4.74% Recencia Frecuencia
Media Monetaria
Mini-mercados 177 9.66%
Panadería 117 3.78%
Tiendas de Barrio 208 3.35%
Clústers
Al segmentar a los clientes se identificaron vecinos comportamentales y características comunes. A
partir de los puntajes de RFM y RFMM se realizó el análisis de conglomerados para cada uno de los
canales por lo que se encontraron los clúster con mejor desempeño, la cantidad de clientes en cada
uno de ellos y su ubicación geográfica en el mercado de Bogotá.
Se presenta a continuación como ejemplo del análisis, los resultados del canal Tiendas De Barrio:
En la tabla 2 con base en el análisis RFM, se observa que el Cluster 3 es definitivamente el mejor por
presentar puntuaciones más altas en R (4.59), F (4.6) y M (4.58). Esto quiere decir que los clientes
del clúster 3 han realizado la última compra en un período menor de días, en relación con la que
registran los demás, tienen mayor frecuencia de compras y mayor cantidad de unidades tranzadas
en el año estudiado. A su vez, el Cluster 4 registra la segunda mayor puntuación en F (4.07) y M, la
segunda mayor (4.09), lo que significa que los clientes del clúster 4 demandan con mayor frecuencia
y mayor cantidad. Es de anotar que los clientes de este clúster realizaron la última compra en un
período de tiempo mayor al registrado para los clúster 3, 5 y 1.
Tabla 2. Resultados de Conglomerados. Canal Tiendas de Barrio RFM
Cluster R F M
1 2.57 2.31 2.2
2 1.24 2.48 2.44
3 4.59 4.6 4.58
4 2.5 4.07 4.09
5 4.25 2.58 2.49
En la tabla 3, con base en el análisis RFM, se observa que el Cluster 3, además de tener las mejores
puntuaciones tiene el mayor número de clientes. En tanto, el clúster 4 agrupa el 14.2% de los
clientes pertenecientes al canal Tiendas de Barrio y se ubica como el segundo clúster más pequeño.
A pesar de haber encontrado dos clúster, 3 y 4, con buenas puntuaciones RFM, en el clúster 4 se
agrupan menos de la mitad de clientes con respecto al clúster 3.
11
Tabla 3.Tamaño de Conglomerados. Canal Tiendas de Barrio RFM
Cluster Frecuencia %
1 1284 20.7%
2 1551 25.0%
3 1922 30.9%
4 882 14.2%
5 574 9.2%
En la figura 7 se muestra la distribución de los clientes del clúster 3 analizado con RFM para el canal
de Tiendas de Barrio. Se puede apreciar una mayor concentración de clientes del clúster 3 al
Noroccidente de la localidad de Kennedy mientras que al occidente de Teusaquillo no se
evidenciaron clientes de este clúster.
Figura 7. Localización de Clúster 3 RFM. Canal Tiendas de Barrio.
En la tabla 4 con base en el análisis RFMM se observa que el clúster 4 presenta los mejores valores en
R (4.21), F (4.35) y MM (4.48) si bien ocupa el segundo lugar en R y F tiene la mejor puntuación en
MM mientras que el clúster 5, si bien tiene las mejores puntuaciones en R (4.6) y F (4.58) presenta la
más baja calificación en MM (1). Esto significa que los clientes del clúster 4 son los mejores en todos
los factores por cuanto el clúster 5 a pesar de estar mejor punteado en recencia y frecuencia, en
promedio realiza adquisiciones de pocas unidades (MM=1).
12
Tabla 4. Resultados de Conglomerados. Canal Tiendas de Barrio RFMM
Cluster R F MM
1 1.3 2.2 1.91
2 2.72 2.76 3.13
3 2.73 3.47 1
4 4.21 4.35 4.48
5 4.6 4.58 1
Con base en el análisis RFMM, en la tabla 5 se evidencia que la mayor cantidad de clientes se
encuentra en el Cluster 4 (34%) mientras que esta cantidad es menor en el Cluster 5 (7%). Esto indica
que la mayor parte de los clientes de Tiendas de Barrio pertenecen a uno de los clústers mejor
calificados, el 4 de RFMM, mientras que los clientes del clúster 5 son relativamente pocos.
Tabla 5.Tamaño de Conglomerados, Canal Tiendas de Barrio RFMM
Cluster Frecuencia %
1 1582 25.5%
2 1688 27.2%
3 365 5.9%
4 2118 34.1%
5 460 7.4%
La localización de los clientes del canal Tiendas de Barrio según el análisis RFMM se distribuyen en
Bogotá como se presenta en la Figura 8. Se podría concluir que los clientes tienden al concentrarse
en el occidente de Bogotá y que hay zonas de la ciudad donde ciertos canales se destacan sobre
otros. De todas formas es preciso señalar que con esta sola información no es posible llegar a
conclusiones más certeras por cuanto algunas mayores densidades de los puntos podrían explicarse
en una mayor densidad poblacional o de edificaciones en altura en algunas zonas de la ciudad.
13
Figura 8. Localización de Clúster RFMM. Canal Tiendas de Barrio.
De otra parte, también se concluye que, a partir del análisis RFMM no existen clúster que se
destaquen de manera significativa sobre el resto. En contraste, en el análisis RFM es posible
identificar los clúster que sobresalen con respecto a otros. La no predominancia de un clúster sobre
otros en el análisis RFMM se explica en la existencia de dos dimensiones de éxito: 1) clientes con
grandes volúmenes de compra, frecuencia media y recencia baja y 2) clientes con bajo volumen de
compra y frecuencia y recencia altas.
Componentes Principales
En el primer componente se define por el comportamiento de los cuatro factores R, F, M y MM . Esta
medición se interpreta de la siguiente manera: a menor valor asignado al clúster, el volumen de
compras es mayor, debido a que los valores de los factores del componente son negativos. Según los
resultados de este componente, se presenta un comportamiento diferente al resto en el canal de
Panaderías donde su valor es directamente proporcional al volumen de ventas. (Ver tabla 6). Se
asocia este componente a la primera dimensión de éxito.
En el segundo componente se define por el comportamiento de los tres factores R, F, y MM. No se
tiene en cuenta el factor M debido a que este componente se ve modificado por la cantidad de
compras realizadas durante el año estudiado. Esta medición se interpreta de la siguiente manera: si
el valor de este componente es mayor, el clúster tendrá una mayor rotación de inventario. Según los
resultados en este componente, se presentan comportamientos diferentes en los canales de
panadería y de licorería/cigarrería. En el caso del canal panadería no se tiene en cuenta el factor de
frecuencia (F). En licorería/cigarrería el valor resultante del clúster es inversamente proporcional a
un buen desempeño en recencia (R) y frecuencia (F). (Ver Tabla 7). Se asocia este componente a la
segunda dimensión de éxito.
14
Tabla 6. Coeficientes de Primer Componente por Canal.
Componente Principal 1 R F M MM
Tiendas de Barrio -0.533 -0.469 -0.506 -0.49
Mini-mercados -0.514 -0.537 -0.565 -0.358
Panadería 0.522 0.457 0.493 0.525
Licorería / Cigarrería -0.544 -0.457 -0.499 -0.497
Tabla 7. Coeficientes de Segundo Componente por Canal.
Componente Principal 2 R F M MM
Tiendas de Barrio 0.579 0.152
-0.801
Mini-mercados 0.365 0.199
-0.908
Panadería 0.687
-0.722
Licorería / Cigarrería -0.576 -0.153
0.802
Según los resultados de la Tabla 8. para el caso de las Tiendas de Barrio los clústers 1 y 2 tienen peor
desempeño en los dos componentes. El clúster 3 se asocia con clientes pequeños con alta rotación
de inventario mientras que el 4 se asocia con Tiendas grandes las cuales tienden a realizar pedidos
más grandes. El clúster 4 tiene más del doble de clientes que el clúster 3 y agrupa el mayor número
de clientes por más del doble al clúster 3. Sin embargo la suma de los clientes de los clusters menos
exitosos es mayor a la suma de los clusters de clientes exitosos.
Tabla 8. Clústers. Canal Tienda de Barrio y sus Componentes.
Clusters: Tienda de Barrio Componente 1 Componente 2 Tamaño
1 2.5475 0.1612 1851
2 0.3807 -0.8027 1691
3 -0.5910 2.2812 715
4 -2.5238 -0.2924 1956
Modelamiento
Se aplica siete (7) modelos GAMs diferentes, uno para cada dimensión de éxito por cada canal a
excepción de canal Mini-mercados por cuanto este solo cuenta con una dimensión de éxito.
El entrenamiento del modelo GAMs se realizó aplicando el método de 10 Fold Cross Validation variando
los grados de libertad entre 5 a 15. Se realizaron dos pruebas de eficiencia fin de validar el modelo.
En el modelo la variable X0 corresponde a las tiendas no exitosas y la variable X1 a las exitosas. El modelo
presenta dos tipos de errores: clasificar un cliente no exitoso como exitoso (falso positivo) y un cliente
exitoso como no exitoso (falso negativo). La proporción entre los dos tipos de errores fue controlada
definiendo un threshold, entendido como la probabilidad mínima para calificar un cliente como exitoso,
al cual le fue asignado un valor de 0.7. Los dos tipos de errores y los aciertos se muestran en la matriz de
15
confusión del canal Tienda de Barrio en la segunda dimensión de éxito: clientes con bajo volumen de
compra y frecuencia y recencia altas. (Ver Tabla 9).
Tabla 9. Matriz de Confusión. Canal Tiendas de Barrio en Segunda Dimensión de Éxito.
X0 X1
FALSO 231 189
VERDADERO 705 162
De otra parte, se evaluó el desempeño de los modelos bajo el criterio de Área bajo la curva. La forma en
que este criterio se lee es que a mayor área bajo la curva, mejor será el modelo. Esto equivale a decir que
las variables que el modelo ha determinado como significativas influyen realmente en el éxito de los
clientes.
Es importante señalar que la gráfica muestra sensibilidad en el eje de la Y y (1- especificidad) en el eje de
la X. Adicionalmente, en la gráfica se incluye una recta de pendiente 1 con un área bajo la curva de 0.5,
recta que representa un modelo equivalente a lanzar una moneda para determinar el éxito del cliente.
Esto significa que una mayor distancia de la curva arriba de la recta, indica que el desempeño del modelo
es mejor. El threshold es máximo en la parte izquierda de la gráfica mientras que en la parte derecha es
igual a cero (0). La Figura 9 muestra la gráfica del área bajo la curva del modelo para el canal Tienda de
Barrio en la segunda dimensión de éxito. Se aprecia que la curva se mantiene arriba de la recta durante
todo el rango y aumenta su distancia a ella en thresholds altos.
Figura 9. Área Bajo la Curva. Canal Tiendas de Barrio en Segunda Dimensión de éxito
Los resultados de aplicación del criterio Área bajo la curva muestran que los modelos de la segunda
dimensión de éxito de los canales Tiendas de Barrio, Panaderías y Licorería/Cigarrería tienen un
16
mejor desempeño respecto a los modelos de la primera dimensión de éxito. Por su parte, el modelo
de Mini-mercados presenta el mejor desempeño, seguido del modelo de la segunda dimensión de
éxito del canal Tiendas de Barrio. El modelo con más bajo desempeño es la primera dimensión de
éxito del canal Panadería que presenta un área bajo la curva menor a 0.5, por lo que sus resultados
no deben tenerse en cuenta. (Ver tabla 10).
Tabla 10. Área Bajo la Curva de los 7 modelos.
ÁREA BAJO LA CURVA
CANALES 1ª Dimensión de éxito 2ª Dimensión de éxito
Tienda de Barrio 0.5784 0.7033
Mini-mercado 0.7054 -
Panadería 0.4656 0.632
Licorería / Cigarrería 0.5172 0.6301
El resultado del modelo GAMs para Tiendas de Barrio en la segunda dimensión de éxito evidencia las
siguientes variables como significativas: i) Oro y ii) Plata, siendo plata la más determinante entre las
dos. Estas clasificaciones corresponden a las definidas por Coca-Cola FEMSA para sus clientes según
la cantidad de productos Coca-Cola adquiridos por estos. De otra parte, también se encuentran las
variables de iii) estrato social I, iv) estrato social II y v) estrato social III, siendo el estrato social II el
más determinante. Como se explicó atrás aquí se define el estrato dominante en el entorno del
establecimiento del cliente, lo cual se desprende de la estratificación incluida en las facturas de
servicios públicos.
Se presentan igualmente otras variables como: v) número de neveras, vi) número de puertas. Otras
variables significativas encontradas respecto a la localización fueron vii) latitud, viii) longitud, y
cercanía a ix) hospitales, x) bibliotecas, xi) colegios y xii) centros comerciales. Es de recordar que
todas las variables de cercanías se expresan con el nombre de la categoría del sitio de interés
seguida de un número. En esta denominación se representan el número de sitios de interés de esa
categoría a la distancia expresada en metros. Las cuatro (4) variables de mayor influencia son la
Latitud, Oro, Plata y Estrato II lo que significa que un cliente que pertenezca a estas categorías y
tenga una Latitud alta tiene mayor probabilidad de ser calificado como un cliente exitoso. (Ver tabla
11).
17
Tabla 11. Coeficientes del Modelo GAMS para Tiendas de Barrio. Segunda dimensión de éxito
GAMS TIENDAS DE BARRIO
Variable Coeficiente Splines
Intercepto -48.33 No
Oro 1.99 No
Plata 0.76 No
Estrato I 0.16 No
Estrato II 0.37 No
Estrato III 0.31 No
Hospitales 750 0.09 No
Hospitales 500 -0.47 No
Bibliotecas 1000 -0.32 No
Bibliotecas 750 0.26 No
Número de Neveras -0.11 No
Número de Puertas 0.34 No
Colegios 250 -0.01 Si
Colegios 500 -0.02 Si
Colegios 750 0.05 Si
Colegios 1000 -0.04 Si
Centro Comercial 750 0.26 Si
Centro Comercial 1000 0.15 Si
Longitud -0.42 No
Latitud 3.24 No
De los 7 modelos GAMs diseñados se concluye que sólo dos modelos, Mini-mercados y Tiendas de
Barrio de la segunda dimensión de éxito, permiten contar con información que le permita a Coca-
Cola- FEMSA mejorar su inserción en el mercado.
Conclusiones
A pesar de la buena aproximación lograda con la aplicación de la metodología a los datos puestos a
disposición para el presente estudio de caso, se concluye que es necesario realizar un mejor
modelamiento con un mayor nivel predictivo que permita lograr el objetivo planteado de aumentar
al 21% la participación del productos Powerade de Coca-Cola FEMSA en el mercado de Bogotá.
El análisis RFM es un buen método para asignar puntajes que soporten la segmentación de los
clientes. Sin embargo, al tener un número tan elevado de clientes por calificar, se presentan fallas en
este análisis. Es así que cuando todos clientes del mismo canal son calificados sin tener en cuenta,
18
por ejemplo, su localización o el estrato social dominante en su entorno, se puede calificar de
manera errónea a un cliente. Vale decir que un cliente que tiene un buen puntaje RFM respecto a
otros clientes con características similares, sea calificado con bajo desempeño frente a todo el set de
clientes. En estas circunstancias, sería conveniente realizar una segmentación previa al análisis RFM.
Este mismo razonamiento se puede realizar para RFMM.
El clustering resulta ser una buena herramienta para separar la muestra en clúster de clientes con
características similares por su puntuación RFM y RFMM. Si bien en la aplicación de esta herramienta
no se realizó sobre variables como la localización geográfica y ni la estratificación, esto parece ser
conveniente a fin de lograr resultados que permitan diseñar mejores estrategias para Coca-Cola
como por ejemplo, marketing diferenciado y aplicar metodologías más precisas a los agrupaciones
encontradas.
El modelamiento a través de GAMs es un método eficiente para encontrar en qué medida influencia
cada variable en el éxito de los clientes. Con el fin de obtener mayor información se deberían
realizar nuevos modelos reduciendo las variables de entrada para determinar la influencia de
algunos factores, sin tener en cuenta otros que pueden estar atrapando gran parte de la varianza
pero que ofrecen poca información. Es el caso de la calificación oro asignada al cliente pues esta ya
informa sobre la alta cantidad de productos adquiridos.
También es de señalar que el modelo GAMs, por su naturaleza aditiva, no tiene en consideración
interacciones entre variables que podrían ser importantes, como la combinación entre Latitud y
Longitud. Sin embargo, este inconveniente puede ser superado aplicando otros modelos que tengan
en consideración interacciones, sacrificando la interpretación. Así, las interacciones significativas
pueden agregarse al modelo GAMs original para incluir y determinar su influencia.
Por su parte, el análisis de Componentes Principales permite determinar el éxito de los clientes en
dos dimensiones diferentes que son fácilmente interpretables y cuantificables gracias a los puntajes
RFM RFMM. Este análisis se presenta como la mejor aproximación para estimar las dos dimensiones
de éxito señaladas en este caso de estudio: 1) clientes con grandes volúmenes de compra,
frecuencia media y recencia baja y 2) clientes con bajo volumen de compra y frecuencia y recencia
altas.
Propuesta de desarrollos futuros
Teniendo en cuenta que los estratos 2 y 3 son aquellos donde se registra un mayor número de
ventas totales y un menor número de ventas promedio, podría de interés para Coca-Cola FEMSA
realizar un estudio dirigido a estos estratos. Con los nuevos resultados podrían realizarse campañas
publicitarias en zonas donde predominan estos estratos, enfatizando el hecho de que Powerade
tiene un precio menor al de su mayor competidor Gatorade y así explotar esta ventaja competitiva7.
Igualmente, se podrían segmentar los clientes por zonas geográficas, dado que las diferencias socio-
económicas entre zonas de la ciudad pueden ser una variable significativa. También podrían
tomarse en consideración variables como la densidad poblacional y constructiva, en ciertas zonas
entre otras variables que pueden marcar la diferencia en el comportamiento de los clientes respecto
7 Según reunión realizada con representantes de la empresa el 19 de agosto de 2015
19
al mercado de bebidas isotónicas. Otra variable importante que no fue considerada se relaciona con
la localización de los clientes en la ciudad de Bogotá, es la presencia de publicidad Powerade. Se
parte del supuesto de que una mayor cantidad de publicidad en ciertas zonas de la ciudad explicaría
mayores adquisiciones de clientes allí ubicados, frente a menores adquisiciones por parte de otros
donde la publicidad es escasa o inexistente.
Además, estudios futuros deben tener en cuenta la competencia de Powerade por parte de otras
bebidas isotónicas. Podría ser de gran valor contar con información sobre los comportamientos de la
competencia para compararlos con las bebidas isotónicas de Coca-Cola FEMSA. Si los mercados
fuesen similares, la firma debería centrarse en llegar a mercados diferentes, no atendidos. Si la
competencia atendiera también otro nicho del mercado, Powerade no sólo debería llegar al
mercado desatendido sino entender también las razones que explican su ausencia en el mercado de
la competencia. De la mano, se debería de realizar encuestas de satisfacción y un piloto, con el
objetivo de obtener resultados para realizar nuevos análisis para problemas supervisados y así
conocer si las estrategias aplicadas son efectivas.
En conclusión la metodología aplicada en el caso de estudio tiene fuerte fundamento teórico y los
modelos de Mini-mercados y Tiendas de Barrio en la segunda dimensión de éxito son confiables. Sin
embargo hay muchas otras oportunidades para aplicar la misma metodología con las variaciones
antes señaladas y en consecuencia, obtener más y mejor información.