En una prueba de prueba de concepto para Project Silica, Microsoft y Warner Bros. han almacenado y leído con éxito la clásica película de 1978 "Superman" en una pieza de vidrio de sílice duradero de 7,5 cm x 7,5 cm x 2 mm, aproximadamente del tamaño de un posavasos. El cristal contiene 75,6 GB de datos más códigos de redundancia de error. Crédito:Jonathan Banks para Microsoft.
Microsoft y Warner Bros. han colaborado para almacenar y recuperar con éxito toda la película icónica de 1978 "Superman" en un pedazo de vidrio aproximadamente del tamaño de un posavasos. 75 por 75 por 2 milímetros de grosor.
Fue la primera prueba de prueba de concepto para Project Silica, un proyecto de investigación de Microsoft que utiliza descubrimientos recientes en óptica láser ultrarrápida e inteligencia artificial para almacenar datos en vidrio de cuarzo. Un láser codifica datos en vidrio creando capas de rejillas de nanoescala tridimensionales y deformaciones en varias profundidades y ángulos. Los algoritmos de aprendizaje automático leen los datos decodificando imágenes y patrones que se crean cuando la luz polarizada brilla a través del vidrio.
El vidrio de sílice duro puede soportar ser hervido en agua caliente, cocido al horno, microondas inundado fregado desmagnetizados y otras amenazas ambientales que pueden destruir valiosos archivos históricos o tesoros culturales si las cosas salen mal.
Representa una inversión de Microsoft Azure para desarrollar tecnologías de almacenamiento creadas específicamente para patrones de computación en la nube, en lugar de depender de medios de almacenamiento diseñados para funcionar en computadoras u otros escenarios. Es solo una de las muchas formas en que Azure confía en la experiencia en investigación de Microsoft para resolver desafíos a corto y largo plazo, desde las pruebas del centro de datos submarino de Project Natick hasta la potencia de procesamiento FPGA de Project Brainwave y la óptica emergente para la investigación en la nube.
"Almacenar toda la película de 'Superman' en un cristal y poder leerla con éxito es un hito importante, "dijo Mark Russinovich, Director de tecnología de Azure. "No estoy diciendo que todas las preguntas hayan sido respondidas por completo, pero parece que ahora estamos en una fase en la que estamos trabajando en el refinamiento y la experimentación, en lugar de hacer la pregunta '¿podemos hacerlo?' "
Warner Bros., que se acercó a Microsoft después de conocer la investigación, siempre está a la caza de nuevas tecnologías para salvaguardar su vasta biblioteca de activos:tesoros históricos como "Casablanca, "Programas de radio de la década de 1940, cortos animados, películas de teatro filmadas digitalmente, comedias de televisión, diarios de sets de filmación. Durante años, habían buscado una tecnología de almacenamiento que pudiera durar cientos de años, soporta inundaciones o llamaradas solares y que no requiere que se mantenga a una determinada temperatura o que necesite una renovación constante.
"Ese siempre había sido nuestro faro de esperanza para lo que creíamos que sería posible algún día, así que cuando supimos que Microsoft había desarrollado esta tecnología basada en vidrio, queríamos probarlo, ", dijo la directora de tecnología de Warner Bros., Vicky Colf.
Reducir los costos del almacenamiento a largo plazo
La mayoría de la gente piensa en "la nube" como una forma de almacenar todo, desde miles de fotos familiares hasta millones de correos electrónicos sin ocupar espacio en su teléfono o computadora. Pero toda esa información se almacena físicamente en hardware en una ubicación remota, lo que le permite acceder a él desde múltiples dispositivos.
La cantidad de datos que la humanidad ahora busca almacenar, desde registros médicos hasta videos divertidos de gatos e imágenes tomadas por naves espaciales, está aumentando al mismo tiempo que la capacidad de las tecnologías de almacenamiento existentes se está reduciendo.
El científico óptico senior de Microsoft, James Clegg, carga un trozo de vidrio en un sistema que utiliza óptica e inteligencia artificial para recuperar y leer datos almacenados en vidrio. Crédito:Jonathan Banks para Microsoft.
Los costos de almacenamiento a largo plazo aumentan por la necesidad de transferir datos repetidamente a medios más nuevos antes de que se pierda la información. Las unidades de disco duro pueden desgastarse después de tres a cinco años. La cinta magnética solo puede durar de cinco a siete. Los formatos de archivo se vuelven obsoletos, y las actualizaciones son caras. En sus propios archivos digitales, por ejemplo, Warner Bros. migra contenido de forma proactiva cada tres años para adelantarse a los problemas de degradación.
El almacenamiento de vidrio tiene el potencial de convertirse en una opción de menor costo porque solo escribe los datos en el vidrio una vez. Los láseres de femtosegundos, que emiten pulsos ópticos ultracortos y que se utilizan comúnmente en la cirugía LASIK, cambian permanentemente la estructura del vidrio. para que los datos se puedan conservar durante siglos.
El vidrio de cuarzo tampoco necesita aire acondicionado que consuma mucha energía para mantener el material a una temperatura constante o sistemas que eliminen la humedad del aire, los cuales podrían reducir la huella ambiental del almacenamiento de datos a gran escala.
"No estamos tratando de construir cosas que colocas en tu casa o desde las que reproduces películas. Estamos construyendo almacenamiento que opera a escala de la nube, "dijo Ant Rowstron, socio subdirector de laboratorio de Microsoft Research Cambridge en el Reino Unido, que colaboró con la Universidad de Southampton para desarrollar Project Silica.
"Una gran cosa que queríamos eliminar es este costoso ciclo de mover y reescribir datos a la próxima generación. Realmente queremos algo que pueda dejar en el estante por 50, 100 o 1, 000 años y olvídate hasta que lo necesites, "Dijo Rowstron.
Project Silica tiene como objetivo almacenar lo que se conoce como datos "fríos", datos de archivo que pueden tener un valor tremendo o que las empresas deben mantener, pero no es necesario acceder a ellos con frecuencia. Eso podría incluir datos médicos que deben conservarse durante toda la vida del paciente, datos de regulación financiera, contratos legales, información geológica relacionada con la exploración energética y los planes de construcción que las ciudades deben conservar.
Warner Bros. estaba muy interesado en ayudar a Microsoft a probar soluciones que podrían aliviar los costos y las ineficiencias asociadas con el almacenamiento de datos en estos horizontes de largo tiempo. Dijo Colf.
"Con la biblioteca de contenido más grande de la industria de los medios y el entretenimiento en muchos aspectos, nuestros desafíos son únicos en su escala, pero ciertamente no son únicos en términos del problema que estamos tratando de resolver, " ella dijo.
Convirtiendo datos digitales en artefactos físicos
Con casi 100 años de historia en cine y televisión, Warner Bros. posee una de las bibliotecas de entretenimiento más importantes y profundas del mundo. Relanzar películas antiguas en nuevos formatos o para nuevas audiencias es una parte importante del negocio. También es una tremenda responsabilidad cultural preservar a perpetuidad algunas de las historias más queridas del mundo, Dijo Colf.
"Imagínese si un título como 'El mago de Oz' o un programa como 'Amigos' no estuviera disponible para que generación tras generación lo disfrutaran, lo vieran y lo entendieran, ", dijo." Creemos que eso es inimaginable, y es por eso que nos tomamos muy en serio el trabajo de preservar y archivar nuestro contenido ".
La compañía tiene planes de despido para manejar múltiples escenarios en el peor de los casos:un terremoto o un huracán que azota una de las costas, un incendio donde los sistemas de supresión no se activan o una falla del control del clima que permite que la humedad se acumule y arruine la película.
El objetivo es tener tres copias de archivo de cada activo almacenadas en diferentes ubicaciones alrededor del mundo:dos copias digitalizadas separadas, junto con la copia física original en cualquier medio que se haya creado una película, un episodio de televisión o una caricatura animada.
Afortunadamente, Los negativos de película originales durarán siglos si se almacenan en las condiciones adecuadas. Pero para algunos programas de televisión más antiguos, piense en episodios de "Alice" filmados en la década de 1970, la copia física original tiene una vida útil limitada que requiere la migración a formatos más nuevos. Y para las películas y los programas de televisión de hoy que se graban digitalmente, la tercera copia con calidad de archivo tiene un ciclo de migración muy corto de tres a cinco años, que es un desafío de administrar.
"Supongamos que un programa de televisión está ingresando directamente a nuestros archivos digitales; no hay nada físico, "dijo Steven Anastasi, Warner Bros. vicepresidente de archivos de medios globales y servicios de preservación. "El archivo digital está entrando pero no tengo nada que pueda poner en una bóveda o en una mina de sal o nada físico que entre al edificio".
Warner Bros. potencialmente está considerando Project Silica para crear un activo físico permanente para almacenar contenido digital importante y proporcionar copias de respaldo duraderas. Ahora, para estrenos teatrales que se filman digitalmente, la empresa crea una tercera copia de archivo convirtiéndola de nuevo en película analógica. Divide el metraje final en tres componentes de color:cian, magenta y amarillo, y transfiere cada uno a negativos de película en blanco y negro que no se desvanecen como las películas en color.
Esos negativos se guardan en un archivo de almacenamiento en frío. En estas bóvedas altamente administradas, la temperatura y la humedad están estrictamente controladas, y los rastreadores de aire buscan señales de descomposición química que puedan indicar problemas. Si necesitan la película de vuelta, deben revertir esos complicados pasos.
Ese proceso es caro, y solo quedan unos pocos laboratorios de cine en el mundo que pueden hacerlo. Y el proceso no es óptimo desde un punto de vista cualitativo, dijo Brad Collar, Warner Bros. vicepresidente senior de archivos globales e ingeniería de medios.
"Cuando filmamos algo digitalmente, con ceros y unos que representan los píxeles en la pantalla, y lo imprimimos en un medio analógico llamado película, destruyes los valores de píxeles originales. Y, seguro, se ve bastante bien, pero no es reversible, "Dijo Collar.
"Si podemos tomar la representación digital de esos píxeles y ponerla en un medio como la sílice y leerla exactamente como estaba cuando salió de la cámara, hemos hecho nuestro trabajo de preservación lo mejor que hemos podido. Eso es lo que amo de esto " él dijo.
Brad Collar, Warner Bros. vicepresidente senior de archivos globales e ingeniería de medios, izquierda, y Vicky Colf, Director de tecnología de Warner Bros. demuestre el contraste entre almacenar películas en 22 bobinas de película y una pieza de vidrio del tamaño de un posavasos. Crédito:John Brecher para Microsoft.
No es económico crear negativos de películas de archivo para cada episodio de televisión filmado digitalmente en la biblioteca de Warner Bros. La empresa espera que Project Silica resulte ser un alternativa de mayor calidad para la creación de archivos físicos de contenido digital.
Hay mucho más trabajo por delante para alcanzar esa escala:los investigadores de Microsoft necesitarían aumentar significativamente la velocidad a la que se pueden escribir y leer los datos. así como su densidad. Warner Bros. prevé su propia infraestructura para leer datos de los archivos de vidrio. Pero ambos socios ven una promesa en lo lejos que han llegado.
"Si la solución de almacenamiento de Project Silica demuestra ser tan rentable y escalable como podría ser, y todos reconocemos que aún es temprano, esto es algo que nos encantaría ver adoptado por otros estudios, nuestros pares y otras industrias, "Dijo Colf.
"Si nos funciona, creemos firmemente que esto beneficiará a cualquiera que desee conservar y archivar contenido, " ella dijo.
Diseño de almacenamiento para la nube
Es imposible saber cuánta información se ha perdido porque nadie se dio cuenta de su valor en ese momento, desde películas mudas que nadie imaginó que se verían fuera de un cine hasta datos históricos de los que las herramientas analíticas modernas y la inteligencia artificial podrían obtener nuevos conocimientos.
Uno de los objetivos de la investigación de almacenamiento de próxima generación de Microsoft, que incluye esfuerzos paralelos para almacenar datos en ADN, es desarrollar soluciones que sean lo suficientemente baratas y sin esfuerzo como para que realmente no tenga que tomar una decisión sobre si almacenar sus datos, dice la empresa.
Los investigadores de Microsoft pasaron años tratando de llegar allí con las tecnologías que se utilizan actualmente en los centros de datos. Pero el tamaño la forma y las limitaciones de cosas como bobinas de cinta y discos giratorios, todos los cuales se inventaron para otros fines mucho antes de que existiera la nube, simplemente no podían obtener los beneficios que querían.
"Finalmente, simplemente pensamos '¿podemos construir algo desde cero para la nube que no necesite hacer nada más?' ", dijo Rowstron.
Lanzaron una colaboración con el Centro de Investigación Optoelectrónica de la Universidad de Southampton, donde los investigadores demostraron originalmente cómo almacenar datos en vidrio con láseres de femtosegundos. Con inversión de Azure, Cambridge de Microsoft, REINO UNIDO, laboratorio construyó un equipo interdisciplinario de físicos, expertos en óptica, ingenieros eléctricos e investigadores con experiencia en almacenamiento para impulsar la tecnología más allá.
El investigador de Microsoft Project Silica Youssef Assaf deja caer un cuadrado de vidrio de sílice en una tetera con agua hirviendo para demostrar su durabilidad. El equipo ha horneado hervido, microondas desmagnetizó y limpió piezas de vidrio similares con lana de acero, sin pérdida de los datos almacenados en el interior. Crédito:Jonathan Banks para Microsoft.
Desde entonces, el equipo de investigación de Microsoft ha logrado avances dramáticos en velocidad y precisión. También han trabajado en estrecha colaboración con sus homólogos de Azure para diseñar Project Silica teniendo en cuenta los desafíos y requisitos diarios del almacenamiento comercial en la nube.
"Obtener todas sus aportaciones y pensar en el proyecto desde el primer día significa que, al final, vamos a generar algo que sea realmente útil para ellos. Rowstron dijo sobre la relación con el equipo de productos de Azure.
Los láseres infrarrojos de Project Silica codifican datos en "vóxeles, "el equivalente tridimensional de los píxeles que componen una imagen plana. A diferencia de otros medios de almacenamiento óptico que escriben datos en la superficie de algo, Project Silica almacena datos dentro del propio vidrio. Una pieza de vidrio de 2 mm de espesor, por ejemplo, puede contener más de 100 capas de vóxeles.
Los datos se codifican en cada vóxel cambiando la fuerza y la orientación de intensos pulsos de láser que deforman físicamente el vidrio. Es algo así como crear icebergs al revés a un nivel de nanoescala, con diferentes profundidades y tamaños y ranuras que las hacen únicas.
Para volver a leer los datos, Los algoritmos de aprendizaje automático decodifican los patrones creados cuando la luz polarizada brilla a través del vidrio. A diferencia del almacenamiento en cinta, que lleva tiempo enrollarlo para llegar al lugar que desea volver a leer, los algoritmos pueden concentrarse rápidamente en cualquier punto dentro del cuadrado de vidrio, potencialmente reduciendo el tiempo de espera para recuperar información.
"Si tienes la edad suficiente para recordar rebobinar y reenviar canciones en cintas de casete, puede llevar un tiempo llegar a la parte que desea, "dijo Richard Black, Ingeniero principal de software de investigación de Microsoft. "Por el contrario, es muy rápido leer desde el vidrio porque puede moverse simultáneamente dentro del eje xoy o z ".
A diferencia de las frágiles copas de vino o las bombillas, los cuadrados de cristal de cuarzo utilizados para el almacenamiento de datos son sorprendentemente difíciles de destruir. Temprano, el equipo de investigación intentó hornear uno en un horno a 500 grados, microondas hirviéndolo, frotándolo con lana de acero. Y cuando leen los datos, todo estaba todavía allí.
Eso tenía mucho sentido para los archiveros de Warner Bros. quien hace años descubrió cajas de series de radio de Superman grabadas en la década de 1940 en trozos de vidrio de tamaño récord.
"De hecho, encontramos jugadores con los que podíamos volver a jugar estas cosas, y eran igual de buenos porque estaban almacenados en vidrio. Y pudimos digitalizar y guardar esos maravillosos contenidos, "Dijo Collar.
"Así que ahora uno de nuestros activos más antiguos en nuestra bóveda es el vidrio y una de las tecnologías más nuevas en nuestra bóveda es el vidrio. Y ambos son Superman. Así que realmente hemos completado el círculo, " él dijo.