Crédito:CC0 Public Domain
La secuencia de ADN de todos es única. Pero para aquellos que deseen mantener su privacidad genética, puede que no sea lo suficientemente único.
Un nuevo estudio sostiene que más de la mitad de los estadounidenses podrían ser identificados por su nombre si todo lo que tuviera que empezar fuera una muestra de su ADN y algunos datos básicos. tales como dónde viven y qué edad podrían tener.
No sería sencillo y no sería barato. Pero el hecho de que se haya vuelto factible nos obligará a todos a repensar el significado de la privacidad en la era del ADN, dijeron los expertos.
Hay poco tiempo que perder. Los investigadores detrás del nuevo estudio dicen que una vez que 3 millones de estadounidenses hayan subido sus genomas a sitios web públicos de genealogía, casi todos en los EE. UU. serían identificables solo por su ADN y solo unas pocas pistas adicionales.
Más de 1 millón de estadounidenses ya han publicado su información genética, y decenas más lo hacen todos los días.
"La gente se ha estado preguntando cuánto tiempo pasará antes de que pueda utilizar el ADN para detectar a casi cualquier persona, "dijo Ruth Dickover, director del programa de ciencias forenses de la Universidad de California, Davis que no participó en el estudio. "Los autores dicen que no tomará tanto tiempo".
Esta nueva realidad representa la convergencia de dos tendencias de larga data.
Uno de ellos es el aumento de las pruebas genéticas directas al consumidor. Empresas como Ancestry.com y 23andMe pueden secuenciar el ADN de cualquier persona por unos 100 dólares. Todo lo que tiene que hacer es proporcionar una muestra de saliva y enviarla por correo.
El otro elemento esencial es la proliferación de bases de datos genealógicas de búsqueda pública como GEDmatch. Cualquiera puede cargar un genoma completo en estos sitios y las computadoras potentes lo procesarán, buscando tramos de secuencias de ADN coincidentes que puedan usarse para construir un árbol genealógico.
Para probar el poder creciente de estos sitios, Los investigadores dirigidos por el científico informático de la Universidad de Columbia, Yaniv Erlich, se propusieron ver si podían encontrar el nombre de una persona y, por lo tanto, su identidad, si todo lo que tenían que seguir era un fragmento de su ADN y una pequeña cantidad de información biográfica.
Comenzaron con una secuencia de ADN completa de una persona cuya información genética se publicó de forma anónima como parte de un estudio científico no relacionado. (De hecho, habían identificado a esta mujer en un estudio anterior, pero para los propósitos de este trabajo, fingieron no saber quién era ella.)
Erlich y sus colaboradores cargaron su código genético en GEDmatch y realizaron una búsqueda para ver si tenía algún pariente en el sitio. Encontraron dos:uno en Dakota del Norte y otro en Wyoming.
Los investigadores pudieron decir que todos estaban relacionados porque compartían una serie de polimorfismos de un solo nucleótido, o SNP. Estas son letras individuales en lugares específicos entre los aproximadamente 3 mil millones de A, Cs, Ts y Gs que componen el genoma humano.
Cuantos más SNP comparta la gente, cuanto más estrechamente relacionados estén.
Al comparar el ADN de los tres parientes, El equipo de Erlich pudo encontrar una pareja ancestral común que eran los bisabuelos de la mujer de Utah.
Próximo, los investigadores buscaron en sitios web genealógicos y otras fuentes en busca de descendientes adicionales de esa pareja de hace mucho tiempo. Encontraron 10 hijos y cientos de nietos y bisnietos.
Luego comenzaron a seleccionar su enorme lista de descendientes. Eliminaron a todos los hombres de la muestra, luego los que no estaban vivos cuando se secuenció el ADN de la mujer de Utah. Los autores también sabían que su tema estaba casado y cuántos hijos tenía, lo que les ayudó a concentrarse en su objetivo.
Después de un largo día de arduo trabajo, Los investigadores pudieron nombrar correctamente al propietario de la muestra de ADN.
Los autores dijeron que el mismo proceso funcionaría para aproximadamente el 60 por ciento de los estadounidenses de ascendencia europea, quiénes son las personas más propensas a utilizar sitios web genealógicos, Erlich dijo. Aunque las probabilidades de éxito serían menores para las personas de otros orígenes, todavía se esperaría que funcione para más de la mitad de todos los estadounidenses, ellos dijeron.
Para llegar a esta conclusión, los investigadores analizaron una base de datos diferente que constaba de 1,28 millones de personas anónimas a las que MyHeritage secuenciaba su ADN, una empresa de análisis de ADN e historia familiar en la que Erlich es el director científico.
Si puede encontrar el primo tercero de una persona en una base de datos genealógica, entonces debería poder identificar a la persona con una cantidad razonable de investigación, Erlich dijo. Entonces, el equipo verificó cuántos parientes del orden de un primo tercero o más cercanos podían encontrar para cada individuo en su conjunto de datos.
Encontraron mucho:el 60 por ciento de los 1,28 millones de personas se emparejaron con un pariente que era al menos tan cercano como un primo tercero, y el 15 por ciento tenía un pariente que era al menos tan cercano como un primo segundo.
Los hallazgos fueron publicados el jueves en la revista. Ciencias .
Hasta aquí, Joseph James DeAngelo, de 72 años, es la persona más famosa en ser identificada de esta manera. Es posible que lo conozca mejor como el presunto asesino de Golden State, acusado de 13 cargos de asesinato y 13 cargos de intento de secuestro.
Cuando los funcionarios encargados de hacer cumplir la ley utilizaron una base de datos de ADN de acceso público para atrapar a DeAngelo en abril, fue solo la segunda vez en la historia de la resolución de delitos que la estrategia se implementó con éxito.
Desde entonces, al menos 13 presuntos delincuentes adicionales han sido identificados de la misma manera.
"La resolución del caso Golden State Killer abrió este método como una posibilidad y otros laboratorios criminales lo están aprovechando, "Claramente, ha comenzado una tendencia", dijo Dickover.
Los ciudadanos privados también se están beneficiando de la tecnología. Los adoptados han encontrado padres y hermanos biológicos, y otros han encontrado primos lejanos que pueden arrojar nueva luz sobre los orígenes y la herencia de una familia.
Pero a medida que más de nosotros cargamos ADN en bases de datos de búsqueda pública, las implicaciones pueden ser espeluznantes.
"Cuando la policía atrapó al Golden State Killer, que fue un muy buen día para la humanidad, Erlich dijo. "El problema es que la misma estrategia puede ser mal utilizada".
Piense en gobiernos extranjeros que utilizan esta técnica para localizar a ciudadanos estadounidenses, él dijo. O los manifestantes y activistas perseguidos de esta manera.
Erlich y sus coautores propusieron una estrategia de mitigación que dificultaría la carga de una secuencia de ADN desconocida en una base de datos genealógica y la búsqueda de coincidencias.
Sugieren que las empresas de pruebas de ADN directas al consumidor pongan un código especial en los archivos de datos sin procesar que envían a sus clientes. Los sitios de genealogía podrían aceptar permitir que las personas carguen secuencias de ADN solo si tienen un código válido. Esto garantizaría que las personas pudieran realizar búsquedas relacionadas únicamente con su propio ADN.
Un sistema como este no evitaría que las fuerzas del orden usen bases de datos genealógicas para buscar sospechosos, Erlich dijo.
El objetivo final es permitir que las personas usen su ADN para obtener más información sobre sus propias familias sin sacrificar su privacidad. Erlich dijo.
Solo este año su primo adoptivo encontró una hermana biológica que vive al otro lado del mundo, él dijo.
"Por eso tenemos esta técnica, " él dijo.
© 2018 Los Angeles Times
Distribuido por Tribune Content Agency, LLC.