Utilizando el análisis computacional, los investigadores han descubierto que muchas secuencias repetitivas se comparten entre proteínas y son similares en especies, desde bacterias hasta humanos. Crédito:Byron Lee y otros, eLife (2022). DOI:10.7554/eLife.77058
Alrededor del 70% de todas las proteínas humanas incluyen al menos una secuencia que consta de un solo aminoácido repetido muchas veces, con algunos otros aminoácidos salpicados. Estas "regiones de baja complejidad" también se encuentran en la mayoría de los otros organismos.
Las proteínas que contienen estas secuencias tienen muchas funciones diferentes, pero los biólogos del MIT ahora han ideado una forma de identificarlas y estudiarlas como un grupo unificado. Su técnica les permite analizar similitudes y diferencias entre LCR de diferentes especies y les ayuda a determinar las funciones de estas secuencias y las proteínas en las que se encuentran.
Usando su técnica, los investigadores han analizado todas las proteínas encontradas en ocho especies diferentes, desde bacterias hasta humanos. Descubrieron que, si bien los LCR pueden variar entre proteínas y especies, a menudo comparten una función similar:ayudar a la proteína en la que se encuentran a unirse a un ensamblaje a mayor escala, como el nucléolo, un orgánulo que se encuentra en casi todas las células humanas.
"En lugar de observar LCR específicos y sus funciones, que pueden parecer separados porque están involucrados en diferentes procesos, nuestro enfoque más amplio nos permite ver similitudes entre sus propiedades, lo que sugiere que, después de todo, tal vez las funciones de los LCR no sean tan dispares". ", dice Byron Lee, un estudiante de posgrado del MIT.
Los investigadores también encontraron algunas diferencias entre los LCR de diferentes especies y demostraron que estas secuencias LCR específicas de especie corresponden a funciones específicas de especie, como la formación de paredes celulares vegetales.
Lee y la estudiante graduada Nima Jaberi-Lashkari son los autores principales del estudio, que aparece hoy en eLife . Eliezer Calo, profesor asistente de biología en el MIT, es el autor principal del artículo.
Estudio a gran escala
Investigaciones anteriores han revelado que los LCR están involucrados en una variedad de procesos celulares, incluida la adhesión celular y la unión al ADN. Estos LCR suelen ser ricos en un solo aminoácido, como alanina, lisina o ácido glutámico.
Encontrar estas secuencias y luego estudiar sus funciones individualmente es un proceso que requiere mucho tiempo, por lo que el equipo del MIT decidió utilizar la bioinformática, un enfoque que utiliza métodos computacionales para analizar grandes conjuntos de datos biológicos, para evaluarlos como un grupo más grande.
"Lo que queríamos hacer era dar un paso atrás y, en lugar de mirar LCR individuales, tratar de echarles un vistazo a todos y ver si podíamos observar algunos patrones a mayor escala que podrían ayudarnos a descubrir cuál es el están haciendo los que tienen funciones asignadas, y también nos ayudan a aprender un poco sobre lo que están haciendo los que no tienen funciones asignadas", dice Jaberi-Lashkari.
Para hacer eso, los investigadores utilizaron una técnica llamada matriz de puntos, que es una forma de representar visualmente las secuencias de aminoácidos para generar imágenes de cada proteína en estudio. Luego usaron métodos computacionales de procesamiento de imágenes para comparar miles de estas matrices al mismo tiempo.
Usando esta técnica, los investigadores pudieron categorizar los LCR en función de qué aminoácidos se repetían con mayor frecuencia en el LCR. También agruparon las proteínas que contienen LCR por el número de copias de cada tipo de LCR que se encuentra en la proteína. El análisis de estos rasgos ayudó a los investigadores a aprender más sobre las funciones de estos LCR.
Como demostración, los investigadores eligieron una proteína humana, conocida como RPA43, que tiene tres LCR ricos en lisina. Esta proteína es una de las muchas subunidades que componen una enzima llamada ARN polimerasa 1, que sintetiza el ARN ribosómico. Los investigadores descubrieron que el número de copias de los LCR ricos en lisina es importante para ayudar a que la proteína se integre en el nucléolo, el orgánulo responsable de sintetizar los ribosomas.
Conjuntos biológicos
En una comparación de las proteínas encontradas en ocho especies diferentes, los investigadores encontraron que algunos tipos de LCR están muy conservados entre especies, lo que significa que las secuencias han cambiado muy poco a lo largo de escalas de tiempo evolutivas. Estas secuencias suelen encontrarse en proteínas y estructuras celulares que también están muy conservadas, como el nucléolo.
"Estas secuencias parecen ser importantes para el ensamblaje de ciertas partes del nucléolo", dice Lee. "Algunos de los principios que se sabe que son importantes para el ensamblaje de orden superior parecen estar en juego porque el número de copias, que podría controlar cuántas interacciones puede hacer una proteína, es importante para que la proteína se integre en ese compartimento".
Los investigadores también encontraron diferencias entre los LCR vistos en dos tipos diferentes de proteínas que están involucradas en el ensamblaje del nucléolo. Descubrieron que una proteína nucleolar conocida como TCOF contiene muchos LCR ricos en glutamina que pueden ayudar en la formación de ensamblajes, mientras que las proteínas nucleolares con solo unos pocos de estos LCR ricos en ácido glutámico podrían reclutarse como clientes (proteínas que interactúan con el andamio). ).
Otra estructura que parece tener muchos LCR conservados es el moteado nuclear, que se encuentra dentro del núcleo celular. Los investigadores también encontraron muchas similitudes entre los LCR que participan en la formación de ensamblajes a mayor escala, como la matriz extracelular, una red de moléculas que brinda soporte estructural a las células de plantas y animales.
El equipo de investigación también encontró ejemplos de estructuras con LCR que parecen haber divergido entre especies. Por ejemplo, las plantas tienen secuencias LCR distintivas en las proteínas que utilizan para armar sus paredes celulares, y estas LCR no se ven en otros tipos de organismos.
Los investigadores ahora planean expandir su análisis LCR a especies adicionales.
"Hay mucho por explorar, porque podemos expandir este mapa a prácticamente cualquier especie", dice Lee. "Eso nos da la oportunidad y el marco para identificar nuevos ensamblajes biológicos".
Esta historia se vuelve a publicar por cortesía de MIT News (web.mit.edu/newsoffice/), un sitio popular que cubre noticias sobre investigación, innovación y enseñanza del MIT. Proteína revelada como pegamento que contiene biomoléculas dentro del nucléolo