• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  •  science >> Ciencia >  >> Otro
    Estadísticas, los estudiantes de ciencias de la computación colaboran en problemas de datos del mundo real a través de mini-think tanks

    ¿Cuál es la diferencia entre estadística y ciencia de datos? quizás lo más importante, ¿Por qué tenemos dos campos con lo que parece ser el mismo enfoque? La mejor manera de comprender el surgimiento de la ciencia de datos como una disciplina separada, explica Herman "Gene" Ray, director del Centro de Estadística e Investigación Analítica de la Universidad Estatal de Kennesaw, es ver la ciencia de datos como la fusión de la informática y la estadística. "La mayoría de los programas de estadística tradicionales le enseñan mucha teoría y cómo resolver problemas a mano, ", dice." Las aplicaciones informáticas son algo así como una ocurrencia tardía. Pero las empresas no van a analizar 100 millones de registros a mano; están tratando con enormes muestras de conveniencia. Y ahí es donde interviene la ciencia de datos ".

    Y ahí es donde comienza la lucha académica interna:los estadísticos dicen que los científicos de datos carecen de la base estadística o matemática para comprender la recopilación y el análisis de datos, y los científicos de datos ponen los ojos en blanco ante los estadísticos por su falta de conocimientos de programación. Esta, dice Ray, fue el mayor obstáculo que enfrentaron para crear uno de los primeros doctores en Estados Unidos. programas de análisis y ciencia de datos:cómo hacer combinas estadística e informática? "Cada uno piensa que puede hacerlo sin el otro, ", dice." Pero la realidad es que la mayoría de los estadísticos no son muy buenos programadores, y la mayoría de los informáticos no comprenden realmente algunos de los matices de las estadísticas. Nuestro objetivo es salvar esa división ".

    Su solución en parte, aprovechó la creciente conciencia entre las empresas del área de Atlanta sobre la importancia de los datos. El Analytics and Data Science Institute creó nueve laboratorios de investigación patrocinados, cada uno centrado en los problemas de datos que enfrenta una empresa, un servicio público o una organización sin fines de lucro, y cada uno con uno a cuatro Ph.D. estudiantes dirigidos por un miembro de la facultad. "Son como think tanks en miniatura que exploran problemas del mundo real, "dice Ray". Y al hacerlo, los estudiantes llegan a comprender el problema desde la ciencia de la computación y la perspectiva estadística. "Un colega podría alentar a un estudiante de estadística de mentalidad más tradicional a explorar redes neuronales, mientras que un estudiante de ciencias de la computación de mentalidad más tradicional podría sentirse alentado a ver por qué tienen que usar el muestreo representativo en lugar del muestreo de conveniencia.

    Un proyecto reciente involucró trabajar con el Departamento de Bomberos del Condado de Cobb, un suburbio de Atlanta, que no cumplía con las métricas nacionales para los estándares de incendios. "Tomamos todos sus datos para eventos de incendio y ambulancia:desde la hora de la primera llamada telefónica hasta el momento en que la ambulancia salió de la estación de bomberos y el tiempo que tardó en llegar a un evento. Observamos las rutas y los patrones de tráfico, y luego optimizó los tiempos de respuesta utilizando la teoría de injertos y Google Maps. "Se cambiaron las rutas, zonas de incendio reasignadas, y se redujeron los tiempos de respuesta. "El jefe de bomberos del condado de Cobb es muy conocedor de los datos, "dice Ray, "por lo que está implementando cambios incrementales y luego observa cómo se actualizan los datos".

    Los laboratorios de investigación también agregan otra dimensión, y una cada vez más importante, a la experiencia de los estudiantes:cómo hablar con personas que no son estadísticos o científicos de datos.

    "Cuando me entrenaron, la expectativa era que trabajaría con otros estadísticos y presentaría en conferencias académicas, "dice Ray". todos hablábamos el mismo idioma. Hoy dia, un científico de datos podría estar hablando con un ejecutivo, o cliente, o hacedor de políticas, que tiene muy poca experiencia en estadísticas. Deben poder leer esto muy rápido, y asegúrese de que el mensaje correcto se siga comunicando al nivel adecuado. Esa es una de las cosas hermosas de estos laboratorios:obligan a todos a aprender a hablar de una manera para que el laboratorio tenga éxito ".


    © Ciencia https://es.scienceaq.com