Recommendation System: Modelos de clientes Antonio Cerdán Orive
¿A qué llamamos Gestión de Clientes?
CAPTAR
GESTIONAR
FIDELIZAR
¿Qué es CRM? Customer Relationship Management Práctica de recolectar, almacenar, y analizar información a nivel de cliente, incorporando sus resultados al proceso de toma de decisiones de la compañía.
Customer Acquisition Customer Retention
Proceso de Captación de nuevos clientes, el paso fundamental de todo el CRM. Proceso de Cuidado y desarrollo de las relaciones con el cliente después de haberlo captado (adquirido) para la compañía.
Customer Churn
Conocido como desgaste del cliente. Proceso de gestionar la tasa de los clientes que están abandonando la compañía.
Customer WinBack
Proceso de re-adquisición de los clientes que dejaron la compañía a través de un proceso de churn.
Banca
Riesgo de Mora en Crédito ➔ ¿Cuál es la probabilidad de que un cliente
que solicita un préstamo incurra en mora?
➔ ¿Cuáles son los principales factores que
permitan identificar que un cliente no pague las cuotas de su préstamo?
➔ ¿Qué conocimiento podemos obtener de los
créditos denegados?
➔ ¿Qué ventajas podemos obtener del uso del
enfoque bayesiano?
Compra de Productos de Inversión
Banca
➔ ¿Qué cliente puede estar interesado en
invertir?
➔ ¿Qué tipo de producto adquirirá con mayor
probabilidad?
➔ ¿A quién me dirijo en una campaña de
captación de inversión?
➔ ¿Cuándo debo contactar cada cliente?
Banca
Fuga de Clientes de Alto Valor ➔ ¿Cómo detectar con antelación los clientes
que van a dejar la entidad?
➔ ¿Cuáles son sus características, y de sus
productos, más relevantes? ¿Cuál es el impacto de los factores externos como la economía?
➔ ¿Cómo podemos evitar las falsas alarmas en
algunas etapas del ciclo normal en el balance y las transacciones de los clientes?
➔ ¿Cuál es el impacto de las políticas de la
entidad sobre el churn ?
¿Qué preguntas de Negocio vamos a responder con este tipo de Modelos Predictivos?
Segmentación
Churn Forma de medir el número de individuos o cosas que pueden abandonar un colectivo durante un periodo de tiempo. Número de clientes que se dan de Churn = baja al final del Número de clientes periodo anterior
¿Cómo es la relación con cada uno de mis clientes? Evolución mes a mes La intensidad de esta relación dependerá de los productos contratados. Tiempo (meses) t=1
Producto
t=2
t=3
t=4
t=5
Tien e?
Consu mo
Tiene ?
Consu mo
Tien e?
Consu mo
Tien e?
Consu mo
Tien e?
Consu mo
Ahorros
1
xA1
1
xA2
1
xA3
1
xA4
1
xA5
ADS
0
0
0
0
0
0
0
0
0
0
Credito
0
0
1
xP2
1
xP3
0
0
0
0
Certificado
1
xT1
1
xT2
1
xT3
1
xT4
1
xT5
Hipoteca
0
0
0
0
0
0
1
xL4
1
xL5
Usamos Modelos Predictivos
¿A qué llamamos Modelos? ¿Qué es Modelar?
¿Qué es un Modelo? “Un modelo es una representación simplificada de la realidad”
“Todos los modelos son errados, pero algunos son útiles”
“A un modelo no se le exige que sea 'verdadero', sino que sea 'útil', de acuerdo a los objetivos para los cuales fue creado”
“Un modelo es una forma matemática de describir la relación entre una variable de respuesta y un conjunto de variables independientes”
“Los modelos se pueden ver como: Una teoría sobre cómo se generaron los datos Una forma útil de resumir los datos “
Un Ejemplo de Modelo Variable Objetivo: Precio de Billete de Avión Output Inputs Parámetro s
Formulemos un Modelo
¿Qué es Modelar? Una sesión de modelación: Aprender, Descubrir, Organizar, Innovar Organización La Modelación es un proceso controlado por los datos DATOS
MODELOS
Conocimiento
La Modelación ayuda a entender y organizar la información
Modelar es un Arte y una Ciencia
Los modelos son el elemento central de la creación de inteligencia. Tratan la incertidumbre, condesan y operacionalizan la información existente, empírica y teórica. Son almacenes y fábricas de conocimiento. (Pepe Almagro)
¿Para qué son los Modelos? Los Modelos son Herramientas Estratégicas que nos permiten:
Decidir Evaluar
Alerta
Innovar
¿Qué se necesita para Modelar? Modelar es todo un desafío ...
Conocimiento del negocio / problema Datos: internos, públicos, micro, macro, etc. Conocimientos de matemáticas Herramientas computacionales Paciencia y ganas de descubrir
PARTE 2
Modelos de Respuesta 0-1
Modelación y Gestión de Clientes
Modelación de la Probabilidad de Baja Un modelo de churn es una herramienta que permite evaluar la probabilidad de baja de un cliente en función de sus características propias y del tipo de relación que tiene con la Entidad.
La variable que se analiza toma valor 1 ó 0. Para representar la relación entre esa variable binaria (output) y las variables explicativas (inputs), se utilizan modelos de tipo logit o probit.
¿Cómo conocemos la probabilidad para cada cliente? Podemos identificar las variables que explican la “propensión a la baja” y usarlas para anticipar la pérdida del cliente.
Probabilidad de baja “media”, por región en la que vive. Transacciones y Saldos Uso del canal online Uso de los canales de atención al cliente Productos Contratados Reclamaciones
Metodología "tradicional" Tratamiento de Variables
Selección de Variables pre-modelo
Ajuste de Modelo Estimado
Trabajo con Censura
A partir de las variables continuas, se construyen variables categóricas utilizando el método piecewise.
Se realiza un análisis de correlación en el conjunto de variables disponible y en modelos ajustados. Se eliminan variables que tengan más de 50% de correlación con otras.
Una vez estimado el modelo seleccionado, se evalúa la consistencia de los parámetros estimados.
Se utiliza algún algoritmo basado en muestreo para incluir las operaciones denegadas en el estudio:
Los resultados poco coherentes con el sentido de negocio, son sustituidos por el analista.
Simple Augmentation Fuzzy Augmentation Reclasificación Parcelación HotDeck
El analista decide si utilizar o descartar los casos con información faltante.
Métodos utilizados de forma tradicional Redes Neuronales
Análisis Discriminante
Regresión Lineal
Regresión Logit / Probit
No se trata sólo del “Método” Un Proceso de Aprendizaje...
PROCESO CONTROLADO POR LOS DATOS
... Orientado a la Operación,
ENFOQUE ECONÓMICO
... que Refleja y Anticipa los Cambios,
ENFOQUE DINÁMICO
... haciendo Uso Exhaustivo de la Información.
ENFOQUE BAYESIANO
Para tener en cuenta, Especificación del Modelo
Enfoque para Inferencia
Método de Estimación
Software (Paquete)
Output, Inputs, Parámetros, Restricciones, Jerarquías Regresión, Serie Temporal, Vectorial,...
CLÁSICO
BAYESIANO
(No Bayesiano)
Distribución a Priori
Mínimos Cuadrados Máxima Verosimilitud
MCMC -Gibbs Sampler, Metropolis Hasting, Slice Sampler -
R, Phyton, SAS, SAP, SPSS, STATA, TOL, etc
Modelos Lineales Generalizados
Los modelos de regresión permiten modelar: ➔ ➔
➔
➔ ➔
➔
Variables Positivas Continuas Variables continuas restringidas a un dominio (i.e. sólo positivas) Respuesta Binarias Resultado de medidas en las que sólo se ha registrado si un evento ha ocurrido (Y=1) o no (Y=0). Una forma habitual de aproximarse al problema es modelar la probabilidad de que el evento ocurra (0 Alquiler
¿Cómo afecta la Edad? Producto I
Producto II
Edad: Efecto sobre la mora, por producto
Producto IV
¿Cómo afecta la Situación de la Vivienda? Producto I
Producto II
Producto III
Producto IV
Situación de la Vivienda: Efecto sobre la mora, por producto
Gracias