Generación de datos realistas del mercado de valores para una investigación financiera más profunda

Crédito:CC0 Public Domain

Los mercados financieros se encuentran entre los sistemas complejos más estudiados y vigilados que existen. Esta rica literatura sobre modelos y análisis de mercado ha dado lugar a muchas innovaciones importantes, como herramientas automatizadas para detectar la manipulación del mercado. Pero todavía existe una gran brecha entre el estado actual de la técnica y los poderosos conocimientos necesarios para comprender completamente las complejas dimensiones del comportamiento del mercado.

Por último, estos modelos necesitan grandes volúmenes de datos, incluso más allá de lo que se produce a partir de pedidos de existencias reales. Los datos de pedidos de acciones del mundo real ofrecen a los investigadores solo un visión histórica del comportamiento que puede mostrar el mercado. Los modelos también requieren escenarios hipotéticos y posibilidades de ramificación para informar una investigación más profunda.

Un equipo de la Universidad de Michigan ha proporcionado una respuesta a esta necesidad en forma de datos falsos. El equipo, dirigido por el profesor Lynn A. Conway de Ciencias de la Computación e Ingeniería Michael Wellman, propone un enfoque para generar datos de mercado de valores realistas y de alta fidelidad basados en una técnica de aprendizaje profundo llamada redes generativas adversarias (GAN). Los flujos de órdenes sintéticos resultantes abren muchas puertas a los investigadores financieros que necesitan enormes conjuntos de datos para estudiar las complejas relaciones de causa y efecto que se desarrollan todos los días en los mercados reales.

En una palabra, Las GAN funcionan colocando dos modelos de aprendizaje uno contra el otro, uno llamado "generador" y el otro "discriminador". Los dos operan en una relación competitiva, donde el generador aprende a escupir datos sintéticos en función de lo que se alimenta, mientras que el discriminador aprende a diferenciar entre los flujos de datos reales y falsos.

A medida que el discriminador mejora en la captura de falsificaciones, el generador mejora al hacer que sus falsificaciones sean más convincentes. El resultado final es un generador capaz de imitar muy de cerca los conjuntos de datos de destino; en este caso, flujos de pedidos de stock.

Llamado Stock-GAN, la instancia utilizada por el equipo de Michigan se entrenó en dos tipos de conjuntos de datos compuestos por órdenes de acciones:uno de un simulador de mercado basado en agentes y otro de un mercado de valores real. Evaluaron sus datos generados utilizando una variedad de estadísticas, como la distribución del precio y la cantidad de pedidos, tiempos entre llegadas de pedidos, y evolución de la mejor oferta y la mejor demanda a lo largo del tiempo. Los resultados mostraron que sus datos generados coincidían estrechamente con las estadísticas correspondientes en datos reales, tanto para el mercado simulado como para el real.

Si bien este trabajo es solo un primer paso para generar flujos de pedidos realistas, dice Xintong Wang, un doctorado estudiante en el equipo, "Realizar esta tarea puede ayudar a preparar conjuntos de datos que pueden hacer posibles otras tareas".

En particular, Los nuevos algoritmos de aprendizaje automático que se especializan en el comercio automatizado se pueden entrenar y validar en los conjuntos de datos generados. y la detección automática de anomalías podría ser posible comparando los datos generados con el mercado real.

Como dice Wang, este sistema esencialmente permite a los investigadores de finanzas emprender historia alternativa, o contrafactual, investigación, una técnica que no es posible cuando se restringe a los flujos de orden del mundo real.

"Verdadero, Los datos históricos del mercado pueden verse como uno que se queda sin muchos resultados posibles obtenidos por la naturaleza, " ella explica, "y Stock-GAN puede generar muchos más a bajo costo".

Además de cambiar la historia, Los datos de existencias sintéticas completamente realizados también pueden ayudar a los investigadores financieros a explorar escenarios hipotéticos, insertar datos específicos en secuencias de orden y observar las permutaciones resultantes de datos futuros.

"Esto nos permite, en principio, inyectar eventos en el sistema y observar una evolución contrafactual del mercado, "Wang dice, "que es algo que nunca podemos obtener directamente de los datos de observación".

Más allá de detectar comportamientos fraudulentos o manipuladores, Los modelos entrenados con estos datos podrían ofrecer a los investigadores información sobre los diferentes tipos de prácticas comerciales legítimas que se ejercen en los mercados y qué resultados producen.

"Nos gustaría poder determinar de forma más general qué tipo de estrategias están utilizando los traders, "dice Wellman." Con ese conocimiento, podríamos determinar cuándo un flujo de pedidos contiene ciertas estrategias ".

Los investigadores también señalan que la ejecución de una investigación financiera sobre datos sintéticos supera los problemas de privacidad y seguridad asociados con la publicidad de datos comerciales reales.

"En general, "escriben los autores, "Nuestro trabajo proporciona un terreno fértil para futuras investigaciones en la intersección del aprendizaje profundo y las finanzas".

Esta investigación se publicó en el documento "Generación de flujos de órdenes realistas en el mercado de valores" en la Conferencia de la Asociación para el Avance de la Inteligencia Artificial (AAAI) de 2020.

Fosa común de la Muerte Negra descubierta en el hospital del monasterio del siglo XIV

Informe:Los jóvenes involucrados en la justicia experimentan desafíos mentales y psicológicos

Otro