Recupera tu antigua web de los archivos de google reader

Google Reader va a cerrar en menos de un mes – (si lees esto desde google reader, hay que ir buscando una alternativa, en unos días os cuento la mía) , y con su cierre no solo se va a perder una herramienta que utilizan millones de personas (y que tengo claro que muchas estarían dispuestas a pagar dinero por seguir usandola, pero eso es otra historia). Lo que muchos quizás no saben es que con el cierre de Google Reader se va a borrar una extensa base de datos con la historia de millones de páginas web. Si, Google Reader guarda en su base de datos el histórico de todos los RSS que han pasado alguna vez por sus redes, existan o no existan en la actualidad. Está todo ahí. Es tal la cantidad de información que es difícil de imaginar. Pero no todo está perdido, todavía podemos hacer algo al respecto.

Por suerte, hay una forma de recuperar por medio de google reader el contenido de cualquier web que haya tenido su RSS en algún momento en alguna cuenta de google reader. Si, cualquier web, en cualquier punto de los últimos años, si ha estado en google reader, se puede recuperar entera si tenía un RSS.

Los pasos son muy sencillos, no se tarda más de 5 minutos en guardar una web completa. No lo dejes para mañana.

1.- Buscamos el RSS de la web que queremos recuperar. No importa que la web ya no exista, si podemos encontrar la dirección RSS, podremos descargarla.

2.- Si no somos capaces de recordar el RSS y la web ya no existe en la actualidad, podemos utilizar el archivo de internet para visitar la antigua web y recuperar la URL del RSS.

3.- Una vez tenemos el RSS tenemos que pedirle a Google Reader (antes del 1 de julio que cerrará) que nos devuelva la información que tiene. Para eso usamos este pequeño formulario. Introduce la URL del FEED ((la URL con http:// aunque ya no exista) y dale a Descargar.

Este código ha sido obtenido de labnol.org. Lo que hace internamente es codificar la URL y la envía a google en este formato:

http://www.google.com/reader/api/0/stream/contents/feed/http%3A%2F%2Fplanetahuevo.es%2Ffeed%2F?n=9999

Esto nos devuelve toda la información del Feed, con todos los artículos históricos de ese feed en formato Json, y repito ¡aunque la web ya no exista sigue funcionando!

4.- Para guardar una copia del Json podemos seleccionar y guardar el texto completo que aparece en un archivo de texto de nuestro ordenador, que yo recomiendo guardar con la extensión .json para recordar el formato.

Con esto ya tenemos una copia de la web, pero es complicada de ver. Para poder leer el json o guardarlo de una forma más limpia podemos hacer lo siguiente:

1.- Abrimos el visor de Json online http://jsonviewer.stack.hu

2.- Pulsamos en Load Json Data

3.- Ponemos la URL que nos ha dado en el paso 3 y cargamos.

4.- Nos muestra el mismo archivo json que antes pero más bonito. Seleccionamos todo (clic en el interior del código y CTRL+A) y lo copiamos y pegamos en un archivo TXT en blanco que guardaremos nuevamente como archivo .json

5.- Si cuando tenemos el json cargado le damos con al botón de viewer (arriba a la derecha) podremos ver la información del json estructurada. En el desplegable items podremos ver todos y cada uno de los artículos del blog, perfectamente legibles (son los Items).

Para que veáis un ejemplo real, he sido capaz de recuperar hoy mismo, en junio de 2013, la antigua web de www.comando-gesserit.com que como podéis leer en este post del planetahuevo cerro en mayo de 2008. Pues bien, este es el archivo JSON del RSS de todos sus artículos, ¡con algunas imágenes y todo! Una verdadera joya que dedico a sus creadoras.

Siguenos

Hazte Habitante

Etiquetas