ma in quel caso dovrebbe essere tra i risultati di una semplice ricerca su google, non mi pare siano molti i siti aggirabili in questo modo. Il crawler non avrebbe comunque accesso alla pagina con tutti i contenuti
È spiegato nelle FAQ: per poter indicizzare gli editori devono dare accesso al crawler una pagina senza firewalll.
Così facendo però Google tiene una versione della pagina nella sua cache. Ed è questa che 12ft va ad interrogare, non quellla che è sul server originale.
Non sono tenuti a farlo, infatti per alcuni editori tipo Gedi se cerchi il titolo di un articolo ti esce il link alla pagina con paywall e non a quella cachata. Per gli altri casi invece nel risultato hai un menu "Copia cache", che ti permette di vedere la versione cachata da Google.
Non so, anche se mi regalassero abbonamento a Il Giornale, mica lo leggerei
bè certo, siamo andati OT senza entrare del merito del contenuto dell'articolo dietro paywall