En una reciente Reseñas de productos químicos artículo, Investigadores españoles han publicado la primera revisión exhaustiva de las metodologías de vanguardia que subyacen a los motores de búsqueda de productos químicos, reconocimiento de entidades con nombre y sistemas de minería de texto.
El campo de rápido crecimiento de las aplicaciones de big data en la investigación biomédica, junto con el uso de tecnologías de aprendizaje automático e inteligencia artificial para la minería de datos de texto, ha dado lugar a herramientas prometedoras. Los autores escriben, "Esta revisión está organizada para servir como una guía práctica para los investigadores que ingresan en este campo, pero también para ayudarlos a visualizar los próximos pasos en este campo emergente de la ciencia de datos".
"A través del lanzamiento de conjuntos de datos Gold Standard y la organización de varios eventos de evaluación comparativa de desafíos comunitarios, La Unidad de Minería de Textos Biológicos ha jugado un papel crítico en el desarrollo y evaluación de los sistemas actuales de minería de textos químicos, como se destaca en este artículo, "explica Martin Krallinger, jefe de la unidad y coautor principal de la revisión.
Una gran cantidad de datos no estructurados
Una fracción considerable de datos biomédicos relevantes solo está disponible en forma de datos no estructurados. Este tipo de datos incluye literatura científica en rápido crecimiento, patentes de química medicinal, expedientes médicos electrónicos y documentos de ensayos clínicos. De hecho, todos los años, más de 20, Se publican 000 nuevos compuestos en revistas de química médica y biológica.
Ser capaz de transformar datos de investigación biomédica no estructurados en bases de datos estructuradas que puedan ser procesadas de manera más eficiente por máquinas o consultadas por humanos es fundamental para una variedad de aplicaciones heterogéneas. Estos incluyen la identificación de nuevos objetivos de fármacos y sondas químicas para validar / descartar esos nuevos objetivos potenciales, reutilización de medicamentos aprobados, la identificación de eventos adversos de medicamentos o la recuperación de sistemas biológicos asociados con redes químicas de enfermedades o de genes químicos.
Como estrategia terapéutica para tratar las necesidades médicas, Los compuestos químicos constituyen un tipo de entidad clave de importancia crítica para la investigación biomédica. "La construcción de grandes bases de conocimientos químicos, integrar información química con datos biológicos y clínicos, es crucial para identificar y validar nuevos objetivos terapéuticos para necesidades médicas no satisfechas, así como para acelerar el proceso de descubrimiento de fármacos, "dice Julen Oyarzabal, director de Ciencias Traslacionales del CIMA y codirector de este informe.