Los investigadores del MIT han empleado una nueva técnica de aprendizaje automático para reducir sustancialmente los falsos positivos en las tecnologías de detección de fraude. Crédito:Chelsea Turner
¿Alguna vez usó su tarjeta de crédito en una nueva tienda o ubicación solo para que la rechazaran? ¿Alguna vez se ha bloqueado una venta porque cobró una cantidad más alta de lo habitual?
Las tarjetas de crédito de los consumidores se rechazan sorprendentemente a menudo en transacciones legítimas. Una de las causas es que las tecnologías de detección de fraude utilizadas por el banco de un consumidor han marcado incorrectamente la venta como sospechosa. Ahora, los investigadores del MIT han empleado una nueva técnica de aprendizaje automático para reducir drásticamente estos falsos positivos, ahorrar dinero a los bancos y aliviar la frustración de los clientes.
El uso del aprendizaje automático para detectar el fraude financiero se remonta a principios de la década de 1990 y ha avanzado a lo largo de los años. Los investigadores entrenan modelos para extraer patrones de comportamiento de transacciones pasadas, llamado "características, "que indican fraude. Cuando desliza su tarjeta, la tarjeta hace ping al modelo y, si las funciones coinciden con el comportamiento de fraude, la venta se bloquea.
Entre bastidores, sin embargo, los científicos de datos deben idear esas características, que se centran principalmente en reglas generales de cantidad y ubicación. Si un cliente determinado gasta más de, decir, $ 2, 000 en una compra, o realiza numerosas compras en el mismo día, pueden estar marcados. Pero debido a que los hábitos de gasto de los consumidores varían, incluso en cuentas individuales, Estos modelos son a veces inexactos:un informe de 2015 de Javelin Strategy and Research estima que solo una de cada cinco predicciones de fraude es correcta y que los errores pueden costarle a un banco $ 118 mil millones en ingresos perdidos. como clientes rechazados, abstenerse de usar esa tarjeta de crédito.
Los investigadores del MIT han desarrollado un enfoque de "ingeniería de funciones automatizada" que extrae más de 200 funciones detalladas para cada transacción individual, por ejemplo, si un usuario estuvo presente durante las compras, y la cantidad promedio gastada en ciertos días en ciertos proveedores. Al hacerlo, puede identificar mejor cuándo los hábitos de gasto de un titular de tarjeta específico se desvían de la norma.
Probado en un conjunto de datos de 1.8 millones de transacciones de un gran banco, el modelo redujo las predicciones de falsos positivos en un 54 por ciento en comparación con los modelos tradicionales, que los investigadores estiman que podría haber salvado al banco 190, 000 euros (alrededor de $ 220, 000) en ingresos perdidos.
"El gran desafío en esta industria son los falsos positivos, "dice Kalyan Veeramachaneni, científico investigador principal del Laboratorio de Sistemas de Información y Decisión (LIDS) del MIT y coautor de un artículo que describe el modelo, que se presentó en la reciente Conferencia Europea de Aprendizaje Automático. "Podemos decir que hay una conexión directa entre la ingeniería de funciones y la reducción de falsos positivos ... Eso es lo más impactante para mejorar la precisión de estos modelos de aprendizaje automático".
Los coautores del artículo son:autor principal Roy Wedge, un ex investigador en el Laboratorio de Datos a IA en LIDS; James Max Kanter '15, SM '15; y Santiago Moral Rubio y Sergio Iglesias Pérez del Banco Bilbao Vizcaya Argentaria.
Extraer características "profundas"
Hace tres años, Veeramachaneni y Kanter desarrollaron Deep Feature Synthesis (DFS), un enfoque automatizado que extrae características muy detalladas de cualquier dato, y decidió aplicarlo a las transacciones financieras.
Las empresas a veces albergan competencias en las que proporcionan un conjunto de datos limitado junto con un problema de predicción como el fraude. Los científicos de datos desarrollan modelos de predicción, y un premio en efectivo se destina al modelo más preciso. Los investigadores participaron en una de esas competencias y obtuvieron las mejores puntuaciones con DFS.
Sin embargo, se dieron cuenta de que el enfoque podría alcanzar su máximo potencial si se capacitaba en varias fuentes de datos sin procesar. "Si miras los datos que publican las empresas, es una pequeña porción de lo que realmente tienen, ", Dice Veeramachaneni." Nuestra pregunta era:'¿Cómo llevamos este enfoque a las empresas reales?' "
Respaldado por el programa de descubrimiento de modelos basado en datos de la Agencia de Proyectos de Investigación Avanzada de Defensa, Kanter y su equipo en FeatureLabs, una empresa que comercializa la tecnología, desarrollaron una biblioteca de código abierto para la extracción automatizada de funciones. llamado Featuretools, que se utilizó en esta investigación.
Los investigadores obtuvieron un conjunto de datos de tres años proporcionado por un banco internacional, que incluía información detallada sobre el monto de la transacción, veces, ubicaciones, tipos de proveedores, y terminales utilizados. Contenía alrededor de 900 millones de transacciones de alrededor de 7 millones de tarjetas individuales. De esas transacciones, alrededor de 122, 000 fueron confirmados como fraude. Los investigadores entrenaron y probaron su modelo en subconjuntos de esos datos.
Entrenando, el modelo busca patrones de transacciones y entre tarjetas que coincidan con los casos de fraude. Luego, combina automáticamente todas las diferentes variables que encuentra en funciones "profundas" que brindan una visión muy detallada de cada transacción. Desde el conjunto de datos, el modelo DFS extrajo 237 características para cada transacción. Aquellos representan variables altamente personalizadas para los titulares de tarjetas, Veeramachaneni dice. "Decir, el viernes, es habitual que un cliente gaste $ 5 o $ 15 dólares en Starbucks, ", dice." Esa variable se verá así, '¿Cuánto dinero se gastó en una cafetería un viernes por la mañana?' "
Luego crea un árbol de decisión si / entonces para esa cuenta de características que señalan y no señalan fraude. Cuando se ejecuta una nueva transacción a través del árbol de decisiones, el modelo decide en tiempo real si la transacción es fraudulenta o no.
Frente a un modelo tradicional utilizado por un banco, el modelo DFS generó alrededor de 133, 000 falsos positivos frente a 289, 000 falsos positivos, aproximadamente un 54 por ciento menos de incidentes. Ese, junto con una menor cantidad de falsos negativos detectados (fraude real que no se detectó) podría ahorrarle al banco aproximadamente 190, 000 euros, estiman los investigadores.
Primitivas de apilamiento
La columna vertebral del modelo consiste en "primitivas, "funciones simples que toman dos entradas y dan una salida. Por ejemplo, calcular un promedio de dos números es una primitiva. Eso se puede combinar con una primitiva que mira la marca de tiempo de dos transacciones para obtener un tiempo promedio entre transacciones. Apilar otra primitiva que calcula la distancia entre dos direcciones de esas transacciones da un tiempo promedio entre dos compras en dos ubicaciones específicas. Otra primitiva podría determinar si la compra se realizó en un día laborable o un fin de semana, etcétera.
"Una vez que tengamos esos primitivos, no hay nada que nos detenga para apilarlos ... y empiezas a ver estas variables interesantes en las que no pensabas antes. Si profundiza en el algoritmo, los primitivos son la salsa secreta, "Veeramachaneni dice.
Una característica importante que genera el modelo, Veeramachaneni señala, está calculando la distancia entre esas dos ubicaciones y si sucedieron en persona o de forma remota. Si alguien que compra algo en decir, el Stata Center en persona y, media hora después, compra algo en persona a 200 millas de distancia, entonces es una alta probabilidad de fraude. Pero si una compra se realizó a través del teléfono móvil, la probabilidad de fraude cae.
"Hay tantas funciones que puede extraer que caracterizan los comportamientos que ve en los datos anteriores que se relacionan con casos de uso de fraude o no fraude, "Veeramachaneni dice.
Esta historia se vuelve a publicar por cortesía de MIT News (web.mit.edu/newsoffice/), un sitio popular que cubre noticias sobre la investigación del MIT, innovación y docencia.