Un nuevo estudio de Dressel et al. muestra que el software COMPAS no es más preciso o justo que las predicciones realizadas por personas con poca o ninguna experiencia en justicia penal. Crédito:Carla Schaffer / AAAS
Es posible que una herramienta de software de computadora de uso generalizado no sea más precisa o justa para predecir conductas delictivas repetidas que las personas sin experiencia en justicia penal. según un estudio de Dartmouth College.
El análisis de Dartmouth mostró que los no expertos que respondieron a una encuesta en línea se desempeñaron igual de bien que el sistema de software COMPAS (Correctional Offender Management Profiling for Alternative Sanctions) utilizado por los tribunales para ayudar a determinar el riesgo de reincidencia.
El documento también demuestra que, aunque COMPAS utiliza más de cien piezas de información para hacer una predicción, se puede lograr el mismo nivel de precisión con solo dos variables:la edad del acusado y el número de condenas anteriores.
Según el artículo de investigación, COMPAS se ha utilizado para evaluar a más de un millón de infractores desde que se desarrolló en 1998, con su componente de predicción de reincidencia en uso desde 2000.
El analisis, publicado en la revista Avances de la ciencia , fue realizada por el equipo de investigación de estudiantes y profesores de Julia Dressel y Hany Farid.
"Es preocupante que los trabajadores de Internet no capacitados puedan desempeñarse tan bien como un programa de computadora utilizado para tomar decisiones que alteran la vida de los acusados de delitos, "dijo Farid, Albert Bradley 1915 Profesor de Ciencias de la Computación del tercer siglo en Dartmouth College. "Es posible que el uso de dicho software no ayude a las personas a las que los algoritmos de caja negra podrían negar una segunda oportunidad".
Según el periódico, se utilizan herramientas de software en la fase preliminar, libertad condicional, y decisiones de sentencia para predecir el comportamiento delictivo, incluyendo quién es probable que no comparezca en una audiencia judicial y quién es probable que reincida en algún momento en el futuro. Los partidarios de tales sistemas argumentan que los macrodatos y el aprendizaje automático avanzado hacen que estos análisis sean más precisos y menos sesgados que las predicciones hechas por humanos.
"Las afirmaciones de que las herramientas de datos secretas y aparentemente sofisticadas son más precisas y justas que los humanos simplemente no están respaldadas por los hallazgos de nuestra investigación, "dijo Dressel, quien realizó la investigación como parte de su tesis de pregrado en ciencias de la computación en Dartmouth.
El documento de investigación compara el software comercial COMPAS con los trabajadores contratados a través del mercado de contratación colectiva en línea Mechanical Turk de Amazon para ver qué enfoque es más preciso y justo al juzgar la posibilidad de reincidencia. A los efectos del estudio, La reincidencia se definió como cometer un delito menor o mayor dentro de los dos años posteriores al último arresto del acusado.
Grupos de trabajadores de Internet vieron descripciones breves que incluían el sexo del acusado, la edad, y antecedentes penales previos. Luego, los resultados en humanos se compararon con los resultados del sistema COMPAS que utiliza 137 variables para cada individuo.
La precisión general se basó en la tasa a la que se predijo correctamente que un acusado reincidiría o no. La investigación también informó sobre falsos positivos, cuando se prevé que un acusado reincida pero no lo hace, y falsos negativos, cuando se prevé que un acusado no reincida, pero lo hace.
Con considerablemente menos información que COMPAS (siete características en comparación con 137) cuando los resultados se combinaron para determinar la "sabiduría de la multitud, "los humanos sin presunta experiencia en justicia penal fueron precisos en el 67 por ciento de los casos presentados, estadísticamente igual que el 65,2 por ciento de precisión de COMPAS. Los participantes del estudio y COMPAS estuvieron de acuerdo para el 69.2 por ciento de los 1000 acusados al predecir quién repetiría sus crímenes.
Según el estudio, la cuestión de la predicción precisa de la reincidencia no se limita a COMPAS. Una revisión separada citada en el estudio encontró que ocho de los nueve programas de software no lograron hacer predicciones precisas.
"Debe cuestionarse todo el uso de instrumentos de predicción de reincidencia en las salas de audiencias, ", Dijo Dressel." Junto con el trabajo anterior sobre la equidad de los algoritmos de justicia penal, estos resultados combinados arrojan serias dudas sobre todo el esfuerzo de predecir la reincidencia ".
A diferencia de otros análisis que se centran en si los algoritmos tienen prejuicios raciales, el estudio de Dartmouth considera la cuestión más fundamental de si el algoritmo COMPAS es mejor que los humanos no entrenados para predecir la reincidencia de una manera precisa y justa.
Sin embargo, cuando se consideró la raza, la investigación encontró que los resultados tanto de los encuestados humanos como del software mostraban disparidades significativas entre cómo se juzga a los acusados blancos y negros.
Según el periódico, Es valioso preguntar si pondríamos estas decisiones en manos de personas no capacitadas que respondan a una encuesta en línea. porque, en el final, "los resultados de estos dos enfoques parecen ser indistinguibles".