Bloquear Internet Archive no detendrá la IA, pero borrará la historia de la web

🚀 Una library sin libros. Imagina que un periódico anunciara que las bibliotecas ya no pueden guardar copias de sus ediciones. Eso es exactamente lo que está empezando a suceder en internet.

El Internet Archive—la biblioteca digital más grande del mundo—ha preservado periódicos desde mediados de los años 1990. Su misión es preservar la web y hacerla accesible al público. Para ello, operan la Wayback Machine, que ahora contiene más de un billón de páginas web archivadas y es utilizada diariamente por periodistas, investigadores y tribunales.

Pero en los últimos meses, The New York Times comenzó a bloquear al Archive para que no rastree su sitio web, utilizando medidas técnicas que van más allá de las reglas tradicionales del robots.txt. Esto arriesga cortar un registro en el que historiadores y periodistas han confiado durante décadas. Otros periódicos, incluyendo The Guardian, parecen estar siguiendo el mismo camino.

Durante casi tres décadas, historiadores, periodistas y el público han dependido del Internet Archive para preservar los sitios de noticias tal como aparecían en línea. Esas páginas archivadas son a menudo el único registro confiable de cómo las historias fueron originalmente publicadas. En muchos casos, los artículos se editan, cambian o eliminan—a veces abiertamente, a veces no. El Internet Archive frecuentemente se convierte en la única fuente para ver esos cambios. Cuando los principales editores bloquean los rastreadores del Archive, ese registro histórico comienza a desaparecer.

El Times dice que el movimiento está impulsado por preocupaciones sobre las empresas de IA que raspan contenido de noticias. Sin embargo, esta decisión no detendrá a la IA, pero sí borrará décadas de historia digital.

📎 Fuente: eff.org


Descubre más desde EDUCATRÓNICA

Suscríbete y recibe las últimas entradas en tu correo electrónico.

Deja un comentario