Internet está creciendo pero la información antigua sigue desapareciendo a diario. Crédito:wk1003mike / shutterstock.com
Muchos usuarios de MySpace se sintieron consternados al descubrir a principios de este año que la plataforma de redes sociales perdió 50 millones de archivos cargados entre 2003 y 2015.
El hecho de que MySpace no cuide y preserve el contenido de sus usuarios debería servir como recordatorio de que depender de servicios gratuitos de terceros puede ser riesgoso.
MySpace probablemente ha conservado los datos de los usuarios; simplemente perdió su contenido. Los datos fueron valiosos para MySpace; el contenido de los usuarios lo es menos.
¿Qué pasó con MySpace?
MySpace es un sitio de redes sociales donde los artistas pueden cargar música u otro contenido para acceder y distribuir a su comunidad de usuarios. Siempre ha sido un sitio gratuito, con ingresos provenientes de anuncios y programación que se orienta a los usuarios para productos específicos.
Formado en 2003 a imitación del sitio social de juegos Friendster, MySpace creció rápidamente y fue comprado por News Corporation de Rupert Murdoch en 2005. En 2008, MySpace era el sitio de redes sociales líder, valorado en un momento en 12.000 millones de dólares estadounidenses, pero su popularidad disminuyó gracias a una sobreprevalencia de anuncios, preocupaciones sobre la exposición de menores a contenido sexual y otros problemas. En 2011, News Corporation vendió MySpace a medios específicos, que lo vendió de nuevo en 2016 a Time Inc., que a su vez fue comprada por Meredith Corporation en 2018.
Entonces, la empresa pasó por tres cambios de propiedad durante un período de 12 años, y vio caer precipitadamente los ingresos y la membresía durante ese tiempo. Una venta podría estar bien pero tres ventas a corto plazo me sugieren un negocio en problemas que no estaba en una buena posición para vigilar la propiedad intelectual de otros.
Cualquiera que utilice MySpace como servicio de almacenamiento y no tenga una copia de seguridad alternativa simplemente no tendrá suerte. Dejaste tu propiedad intelectual junto a la superautopista de la información, y cuando regresaste 10 años después, ya no estaba.
MySpace no es el único que se enfrenta a problemas. Servicios en la nube de Amazon, por ejemplo, también experimentó una interrupción sustancial en 2011 y otra en 2017. Aunque es temporal, y sin pérdida real de datos, estas interrupciones dejaron a los usuarios sin acceso a archivos valiosos e importantes durante algún tiempo.
Un problema mucho mayor
Conservar el contenido o la propiedad intelectual en Internet presenta un enigma. Si es accesible entonces no es seguro; si es seguro entonces no es accesible.
El contenido accesible está sujeto a alteraciones, robo u otro tipo de malas acciones. Solo el contenido inaccesible se puede bloquear y proteger contra piratería.
Internet tiene acceso actualmente a unos 15 zettabytes de datos, y está creciendo a una velocidad de 70 terabytes por segundo. Es un recipiente sin duda con fugas, y el contenido se desconecta constantemente para terminar perdido para siempre.
En una oracion, Myspace dijo:"Pedimos disculpas por las molestias". Crédito:chrisdorney / shutterstock.com
Se están realizando esfuerzos masivos y desesperados para preservar todo lo que vale la pena preservar, pero incluso clasificar lo que es y lo que no es en sí mismo una tarea formidable. ¿Qué será de valor en 10 años o 50 años? ¿Y cómo conservarlo?
El papel sin ácido puede durar 500 años; inscripciones en piedra aún más largas. Pero los medios magnéticos como los discos duros tienen una vida mucho más corta, durando sólo de tres a cinco años. También deben copiarse y verificarse en un ciclo de vida muy corto para evitar la degradación de los datos a tasas de falla observadas entre el 3% y el 8% anual.
Luego también está el problema de la preservación del software:¿cómo pueden las personas hoy o en el futuro interpretar esos archivos de WordPerfect o WordStar de la década de 1980? ¿Cuándo las empresas de software originales dejaron de darles soporte o se fueron a la quiebra?
Una startup sin fines de lucro llamada The Internet Archive conserva instantáneas de la web de forma continua, pero principalmente esto es para páginas web HTML públicas de nivel superior, como el sitio web de The New York Times y Facebook, no para archivos de contenido subyacentes. A partir del otoño pasado, su Wayback Machine tenía más de 450 mil millones de páginas en 25 petabytes de datos. Esto representaría el 0,0003% del total de internet.
Universidades los gobiernos y las sociedades científicas están luchando por preservar los datos científicos en una mezcolanza de archivos, como la Coalición de Preservación Digital del Reino Unido, Metaarchivo, o la Red de Preservación Digital colaborativa ahora disuelta. La conservación es difícil y costosa en el tiempo, dinero y equipo. Para ser más útil, no solo hay que almacenarlo, pero alojado en un formato que sea accesible y esté disponible para su reutilización futura.
El almacenamiento real cuesta menos de $ 0.05 por gigabyte, pero el almacenamiento es solo un pequeño porcentaje de los costos de conservación. Adquisición, redes, el mantenimiento y la administración requieren mano de obra humana sustancial y costosa.
Los modelos presupuestarios sugieren un gasto de conservación a 10 años de alrededor de $ 2,50 por gigabyte, o $ 2, 500 por terabyte, o $ 625, 000 para los archivos que MySpace no pudo conservar.
Considerando sus propios datos
Entonces sí, Internet se está pudriendo pero los archiveros y bibliotecarios digitales como yo sabíamos que ya estaba podrido, al igual que cualquiera que haya recibido el error "404 Archivo no encontrado".
Cuando exista un incentivo económico para conservar y utilizar los datos, como la información del usuario, perfiles o historial de navegación:puede existir durante bastante tiempo. Muchos han dicho que los datos son el nuevo petróleo, y las corporaciones están ansiosas por perforar y explotar este recurso.
Sin embargo, donde el contenido es menos valioso para quien posee los servidores, hay menos incentivos para invertir en su conservación. Una encuesta de 10 millones de visitas de 25 sitios aleatorios en 2004 sugiere que los errores 404 ocurren en cerca del 3% de las URL objetivo. Internet está creciendo mucho más rápido de lo que se está pudriendo, pero ambas cosas están sucediendo a la vez. Ninguna empresa gigante de Internet tiene sus intereses más cerca de su corazón que los suyos.
Una red de preservación se conoce con el acrónimo LOCKSS (Lots of Copies Keeps Stuff Safe) y esa es una buena regla general. Siempre tenga una copia de seguridad, y tener siempre múltiples copias de seguridad. Proteja su privacidad y proteja su contenido, al menos ese contenido que tal vez desee conservar, como fotos, Email, ese guión o novela, o archivos de video y música. Las reglas de derechos de autor no prohíben almacenar contenido que haya comprado, siempre y cuando no lo publiques para compartirlo públicamente.
El almacenamiento gratuito es una gran oferta, pero a veces solo obtienes lo que pagas. Internet no es seguro ni permanente. Nunca prometió ser y los usuarios no deben asumir que así será. Las piezas se están pudriendo, corroyendo y colapsando mientras escribo esto. Solo espere y planee no estar descansando en esa plataforma cuando caiga.
Este artículo se vuelve a publicar de The Conversation bajo una licencia Creative Commons. Lea el artículo original.