Crédito:Universidad de California - San Diego
En la edición de mayo de PLOS Biología Computacional , Científicos de UC San Diego y la Universidad de Notre Dame informan sobre un estudio que podría abrir el campo para la identificación de proteínas basada en nanoporos y, finalmente, el perfil proteómico de un gran número de proteínas en mezclas complejas de diferentes tipos de moléculas.
Según el profesor de ingeniería y ciencias de la computación de UC San Diego, Pavel Pevzner, autor principal del artículo, el nuevo enfoque identifica proteínas analizando las distintas señales eléctricas producidas cuando las moléculas pasan a través de un nanoporo (que actúa como un tamiz). En teoria, dijo Pevzner, Los nanoporos podrían permitir a los investigadores caracterizar un gran número de proteínas en mezclas complejas.
Mientras que los nanoporos funcionan muy bien en el análisis de moléculas individuales, son menos eficaces cuando se intenta caracterizar un gran número de proteínas en mezclas complejas. Como resultado, el enfoque actualmente preferido para el cribado de mezclas complejas implica el uso de otras técnicas, especialmente espectrometría de masas. (Pevzner y los profesores de ciencias de la computación Vineet Bafna y Nuno Bandeira son investigadores principales del Centro de Espectrometría de Masas Computacional financiado por los NIH en UC San Diego).
Tan recientemente como 2016, Los principales desarrolladores de nanoporos se mostraron pesimistas sobre la posibilidad de aplicar nanoporos a la elaboración de perfiles de proteínas a gran escala en el corto plazo. "Ni siquiera estamos cerca de hacer eso en este momento, "El cofundador de Oxford Nanopore, Hagan Bayley, dijo a GenomeWeb:y agregó que "no diría que es un objetivo imposible, pero es un poco exagerado ".
Pevzner de UC San Diego, sin embargo, cree que se avecina un gran avance. "La clave es utilizar el aprendizaje automático para analizar la información generada por las proteínas cuando se trasladan a través de un nanoporo, ", dijo Pevzner." Al aplicar técnicas de aprendizaje automático, pudimos identificar distintas señales que podrían conducir a un análisis de proteínas nanoporosas a gran escala ".
En una entrevista con GenomeWeb, Pevzner dice que, Temprano, los obstáculos parecían intratables. "Los datos eran tan ruidosos que casi pensamos que deberíamos rendirnos, ", explicó." He estado trabajando durante casi 10 años en espectrometría de masas de arriba hacia abajo, y en comparación con la identificación de proteínas mediante espectrometría de masas descendente, que ahora es una zona casi madura, parecía que no había esperanza de que los nanoporos pudieran producir una señal comparable ".
Luego, cuando los investigadores aplicaron una herramienta de análisis forestal aleatorio del aprendizaje automático al problema, todo cambió. Llamado Mikhail Kolmogorov, un estudiante de posgrado en el laboratorio de Pevzner:"De repente, surgió la estructura de la señal ".
Como se indica en el documento PLOS, los investigadores argumentan que "la tecnología actual ya es suficiente para comparar nanospectra con pequeñas bases de datos de proteínas, p.ej., identificación de proteínas en proteomas bacterianos ".