• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  • Investigador desarrolla un chatbot con experiencia en nanomateriales
    Kevin Yager. Crédito:Jospeh Rubino/Laboratorio Nacional de Brookhaven

    Un investigador acaba de terminar de escribir un artículo científico. Sabe que su trabajo podría beneficiarse desde otra perspectiva. ¿Pasó por alto algo? O tal vez haya una aplicación de su investigación en la que no había pensado. Un segundo par de ojos sería genial, pero incluso el colaborador más amigable podría no tener tiempo para leer todas las publicaciones de antecedentes necesarias para ponerse al día.



    Kevin Yager, líder del grupo de nanomateriales electrónicos del Centro de Nanomateriales Funcionales (CFN), una instalación para usuarios de la Oficina de Ciencias del Departamento de Energía (DOE) de EE. UU. en el Laboratorio Nacional Brookhaven del DOE, ha imaginado cómo los recientes avances en inteligencia artificial (IA) y El aprendizaje automático (ML) podría ayudar a la generación de ideas y a la lluvia de ideas científicas. Para lograrlo, ha desarrollado un chatbot con conocimientos en los tipos de ciencia en los que participa.

    Los rápidos avances en IA y ML han dado paso a programas que pueden generar texto creativo y código de software útil. Estos chatbots de uso general han captado recientemente la imaginación del público. Los chatbots existentes, basados ​​en modelos lingüísticos grandes y diversos, carecen de conocimientos detallados de los subdominios científicos.

    Al aprovechar un método de recuperación de documentos, el robot de Yager tiene conocimientos en áreas de la ciencia de los nanomateriales que otros robots no tienen. Los detalles de este proyecto y cómo otros científicos pueden aprovechar este colega de IA para su propio trabajo se publicaron recientemente en Digital Discovery. .

    Auge de los robots

    "CFN ha estado buscando nuevas formas de aprovechar la IA/ML para acelerar el descubrimiento de nanomateriales durante mucho tiempo. Actualmente, nos está ayudando a identificar, catalogar y elegir muestras rápidamente, automatizar experimentos, controlar equipos y descubrir nuevos materiales. Esther Tsai, Un científico del grupo de nanomateriales electrónicos del CFN, está desarrollando un compañero de IA para ayudar a acelerar los experimentos de investigación de materiales en la Fuente Nacional de Luz Sincrotrón II (NSLS-II)". NSLS-II es otra instalación para usuarios de la Oficina de Ciencias del DOE en Brookhaven Lab.

    En CFN, se ha trabajado mucho en IA/ML que puede ayudar a impulsar experimentos mediante el uso de automatización, controles, robótica y análisis, pero tener un programa que fuera experto en texto científico era algo que los investigadores no habían explorado. tan profundamente. Ser capaz de documentar, comprender y transmitir rápidamente información sobre un experimento puede ayudar de varias maneras, desde derribar las barreras del idioma hasta ahorrar tiempo al resumir trabajos más grandes.

    Una demostración del chatbot de Yager respondiendo una pregunta relacionada con la investigación del CFN. Crédito:Laboratorio Nacional Brookhaven

    Cuidando tu idioma

    Para crear un chatbot especializado, el programa requería texto de dominio específico:lenguaje tomado de las áreas en las que el bot debe centrarse. En este caso, el texto son publicaciones científicas. El texto de dominio específico ayuda al modelo de IA a comprender nueva terminología y definiciones y le presenta conceptos científicos de vanguardia. Lo más importante es que este conjunto de documentos seleccionados permite al modelo de IA fundamentar su razonamiento utilizando hechos confiables.

    Para emular el lenguaje humano natural, los modelos de IA se entrenan en texto existente, lo que les permite aprender la estructura del lenguaje, memorizar diversos hechos y desarrollar un tipo de razonamiento primitivo. En lugar de volver a entrenar laboriosamente el modelo de IA en textos de nanociencia, Yager le dio la capacidad de buscar información relevante en un conjunto seleccionado de publicaciones. Proporcionarle una biblioteca de datos relevantes fue sólo la mitad de la batalla. Para utilizar este texto de forma precisa y eficaz, el robot necesitaría una forma de descifrar el contexto correcto.

    "Un desafío común con los modelos de lenguaje es que a veces 'alucinan' cosas que suenan plausibles pero que no son ciertas", explicó Yager. "Este ha sido un problema central a resolver para un chatbot utilizado en investigación en lugar de uno que hace algo como escribir poesía. No queremos que fabrique hechos o citas. Esto debía abordarse. La solución para esto fue algo que Llamamos 'incrustación', una forma de categorizar y vincular información rápidamente detrás de escena."

    La incrustación es un proceso que transforma palabras y frases en valores numéricos. El "vector de incrustación" resultante cuantifica el significado del texto. Cuando un usuario hace una pregunta al chatbot, también se envía al modelo de incrustación de ML para calcular su valor vectorial. Este vector se utiliza para buscar en una base de datos precalculada de fragmentos de texto de artículos científicos que estaban integrados de manera similar. Luego, el robot utiliza fragmentos de texto que encuentra relacionados semánticamente con la pregunta para obtener una comprensión más completa del contexto.

    La consulta del usuario y los fragmentos de texto se combinan en un "mensaje" que se envía a un modelo de lenguaje grande, un programa expansivo que crea texto modelado en el lenguaje humano natural, que genera la respuesta final. La incrustación garantiza que el texto que se extrae sea relevante en el contexto de la pregunta del usuario. Al proporcionar fragmentos de texto del cuerpo de documentos confiables, el chatbot genera respuestas objetivas y basadas en fuentes.

    "El programa debe ser como un bibliotecario de referencia", afirmó Yager. "Necesita depender en gran medida de los documentos para proporcionar respuestas obtenidas. Debe poder interpretar con precisión lo que la gente pregunta y ser capaz de reconstruir de manera efectiva el contexto de esas preguntas para recuperar la información más relevante. Si bien las respuestas pueden no Aún no es perfecto, ya es capaz de responder preguntas desafiantes y desencadenar algunas ideas interesantes mientras se planifican nuevos proyectos e investigaciones".

    Crédito:Laboratorio Nacional Brookhaven

    Bots que empoderan a los humanos

    CFN está desarrollando sistemas de IA/ML como herramientas que pueden liberar a los investigadores humanos para trabajar en problemas más desafiantes e interesantes y aprovechar más su tiempo limitado mientras las computadoras automatizan tareas repetitivas en segundo plano. Todavía hay muchas incógnitas sobre esta nueva forma de trabajar, pero estas preguntas son el comienzo de importantes debates que los científicos están teniendo en este momento para garantizar que el uso de IA/ML sea seguro y ético.

    "Hay una serie de tareas que un chatbot de dominio específico como este podría eliminar de la carga de trabajo de un científico. Clasificar y organizar documentos, resumir publicaciones, señalar información relevante y ponerse al día en un nuevo área temática son sólo algunas de las posibles aplicaciones", comentó Yager. "Sin embargo, estoy emocionado de ver adónde irá todo esto. Nunca podríamos haber imaginado dónde estamos ahora hace tres años, y estoy deseando saber dónde estaremos dentro de tres años".

    Para los investigadores interesados ​​en probar este software por sí mismos, el código fuente del chatbot de CFN y las herramientas asociadas se pueden encontrar en este repositorio de GitHub.

    Más información: Kevin G. Yager, Chatbots de dominio específico para la ciencia mediante incrustaciones, Digital Discovery (2023). DOI:10.1039/D3DD00112A

    Proporcionado por el Laboratorio Nacional Brookhaven




    © Ciencia https://es.scienceaq.com