• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  • Un paso por delante de los ladrones

    Variables como la hora del día, El lugar y la densidad de población ayudan a clasificar una determinada parcela de tierra como en riesgo o sin riesgo de robo en un momento dado. Crédito:ETH Zurich

    Un nuevo método de aprendizaje automático desarrollado por científicos de ETH permite predecir robos incluso en áreas escasamente pobladas.

    Los robos no ocurren en todas partes todo el tiempo. Ciertas comunidades, barrios y calles, así como las estaciones del año y las horas del día, tienen un riesgo menor o mayor de que se produzca un robo. Usando estadísticas de intrusión, Las técnicas de aprendizaje automático pueden identificar patrones y predecir el riesgo de un robo en una ubicación específica. Por lo tanto, los programas informáticos pueden ayudar a la policía a identificar los puntos críticos de robo (lugares con un riesgo particularmente alto de robo) en un día determinado. permitiéndoles desplegar patrullas en consecuencia.

    El desequilibrio de clases dificulta el aprendizaje

    Hasta la fecha, tales sistemas de alerta funcionan solo en áreas densamente pobladas, principalmente en las ciudades. Eso es porque los programas de computadora necesitan datos suficientes para reconocer patrones, y el crimen es menos frecuente en áreas escasamente pobladas. Esto se conoce como un "desequilibrio de clases" en las estadísticas. Específicamente, esto significa que por cada sección de la carretera que tenga un robo, hay varios cientos o incluso miles que no lo hacen.

    Los algoritmos funcionan en paralelo

    Cristina Kadar es informática y estudiante de doctorado en el Departamento de Gestión, Tecnología, y Economía. Ha desarrollado un método que puede hacer pronósticos confiables a pesar de los datos desequilibrados. Su investigación acaba de ser publicada en la revista Decision Support Systems. Probó numerosos métodos de aprendizaje automático con un gran conjunto de datos de robos en el cantón suizo de Aargau. los combinó y comparó las tasas de aciertos. Un método que utiliza el aprendizaje por conjuntos y combina análisis de diferentes algoritmos resultó ser el más preciso.

    El aprendizaje automático es cuando un algoritmo utiliza grandes conjuntos de datos para entrenarse a sí mismo para clasificar los datos correctamente. En este ejemplo, toma variables como la hora del día, lugar, densidad de población y mucho más, y aprende de ellos si clasificar una determinada parcela de tierra como en riesgo o no en riesgo de robo en un momento dado.

    El desafío consistía en entrenar los algoritmos de clasificación a pesar del pequeño número de robos en el conjunto de datos. Kadar preprocesó el conjunto de datos eliminando aleatoriamente unidades de datos sin robos hasta que llegó a la misma cantidad de unidades con robos que unidades sin ellos. Este método estadístico se denomina "submuestreo aleatorio". Kadar entrenó numerosos algoritmos de clasificación con este conjunto de datos reducido en paralelo, y sus pronósticos agregados produjeron el pronóstico de robo. Kadar tomó celdas de cuadrícula de 200 por 200 metros en un día determinado como sus unidades de datos individuales.

    Si bien los sistemas de alerta convencionales utilizan principalmente datos sobre robos, Kadar también alimentó los algoritmos de clasificación con datos de población agregados impersonales, como la densidad de población, estructura por edades, tipo de desarrollo del edificio, infraestructura (presencia de escuelas, estaciones de policía, hospitales, carreteras), proximidad a las fronteras nacionales, así como información temporal, incluido el día de la semana, vacaciones públicas, horas de luz diurna e incluso la fase de la luna.

    Tasa de aciertos mejor que en las ciudades

    Con el nuevo método, Kadar pudo mejorar significativamente la tasa de aciertos en comparación con los métodos convencionales. Indicó a la computadora que usara su método para predecir los puntos críticos donde era probable que ocurrieran robos dentro del cantón. Una revisión mostró que alrededor del 60 por ciento de los robos reales se cometieron en los puntos críticos previstos. En comparación, cuando los puntos críticos se predijeron utilizando el método tradicional empleado por la policía, sólo el 53 por ciento de los robos reales ocurrieron en el área prevista. "Con datos desequilibrados, el método logra por lo menos índices de aciertos igualmente buenos y, en algunos casos, mejores que los métodos convencionales en áreas urbanas, donde los datos son más densos y distribuidos de manera más uniforme, "dice Kadar.

    Los hallazgos son útiles ante todo para la policía, ya que el método también se puede utilizar para predecir regiones y tiempos con un mayor riesgo de robo en áreas menos densamente pobladas. Sin embargo, no hay ninguna razón por la que el método no pueda usarse para predecir otros riesgos:riesgos para la salud, por ejemplo, o la probabilidad de llamadas de emergencia al servicio de ambulancia. La industria inmobiliaria también podría utilizarlo para pronosticar la evolución de los precios inmobiliarios sobre la base de factores espaciales.


    © Ciencia https://es.scienceaq.com