Tecnología

El 38% de páginas webs que existían en el 2013 han desaparecido por completo de internet

Este fenómeno lleva por nombre 'descomposición digital' y viene ocurriendo desde hace años. Por ello, existe una iniciativa que trata de preservar toda la información posible.

No todo lo que se sube a internet está disponible para siempre. Foto: PC World
No todo lo que se sube a internet está disponible para siempre. Foto: PC World

Siempre se ha dicho que lo que se sube a la internet nunca desaparece, pero parece que eso no es completamente cierto. Un reciente estudio ha demostrado que muchas páginas web dejan de existir para siempre, así se pierde toda la información que contenían. Por ejemplo, el 38% de sitios web del 2013 han desaparecido por completo de internet y ya no están disponible. Para contrarrestar esta situación, han surgido iniciativas que buscan preservar todo tipo de información subida a internet. Sin embargo, parece no ser suficiente.

Así como en la Tierra todo eventualmente se desintegra y desaparece por completo, lo mismo ocurre con internet y sus millones de páginas web. En el mundo tecnológico esto recibe el nombre de 'descomposición digital'. Esto significa que muchos sitios web, junto a toda la información que contenían, dejaron de estar disponibles para siempre. Hasta el momento, no se conocía con exactitud la cantidad de datos que desaparecieron para siempre de internet. Sin embargo, eso cambió con el reciente estudio de Pew Research Center que brinda cifras exactas.

Cada año se pierde información que nunca se recuperará

"Una cuarta parte de todas las páginas web que existieron en algún momento entre 2013 y 2023 ya no son accesibles", enfatizan los responsables del estudio. En su presentación colocan un cuadro donde muestran los porcentajes de sitios web que han desaparecido en ese rango de años. El que más información ha perdido fue el 2013, con un 38%. Esto resulta evidente debido a que estamos hablando de hace más de una década. Esto lleva a pensar en cuánto sería el porcentaje de páginas web anteriores al 2013 que desaparecieron por completo.

Cuadro que muestra el porcentaje de sitios web que desaparecieron en cada año. Foto: Pew Research Center

Cuadro que muestra el porcentaje de sitios web que desaparecieron en cada año. Foto: Pew Research Center

El estudio también analizó los enlaces que aparecen en distintas páginas web. Por ejemplo, en el caso de los sitios web dedicados a las noticias, se encontró que el 23% contiene por lo menos un link roto. Con respecto a las páginas de entidades gubernamentales, el estudio muestra que un 21% también incluye enlaces rotos. Por último, analizaron Wikipedia, en el que encontraron lo siguiente: el 54% de enlaces referenciados no redirigen a ninguna página web porque ya no existen.

Esto resulta en un grave problema porque, con el pasar de los años, si algún usuario quiere revisar y contrastar las fuentes utilizadas por páginas web de noticias o de algún artículo en Wikipedia, se encontrará con que la información utilizada ya no está disponible. Esto dejará vacíos de conocimiento que serán difíciles o imposibles de llenar.

Iniciativas para frenar la pérdida de información

Ante esta gran problemática surge Internet Archive, una gran hemeroteca digital que busca preservar la mayor cantidad de información subida al mundo digital. El proyecto, al que se puede acceder a través de este enlace, permite a los usuarios consultar todo tipo de contenido que se haya subido a internet. Incluso, y que es la razón de existir de esta hemeroteca, de muchas páginas web que actualmente ya no existen.

La sede central de Internet Archive se encuentra en una antigua iglesia. Foto: KALW

La sede central de Internet Archive se encuentra en una antigua iglesia. Foto: KALW

Hoy en día, Internet Archive contiene más de 840 mil millones de páginas web, 44 millones de libros y textos, 15 millones de grabaciones de audio, más de 10 millones de videos, casi 5 millones de imágenes y 1 millón de programas de software.

No hay duda de que internet ha sido una de las grandes invenciones tecnológicas de la humanidad por la cantidad de información que se almacena y se comporta; sin embargo, eso no impide que se corra el riesgo de que se pierdan datos muy importantes y valiosos. Uno nunca sabe si el contenido que se puede disfrutar hoy en día seguirá estando disponible en el futuro.