Author

Topic: I meravigliosi robots.txt di repubblica, corriere e governo.it (Read 3030 times)

member
Activity: 154
Merit: 10

Dai... dai... ce la puoi fare. (cit)

Certo! Farcela con rispetto non e' facile.

Ma apprezzo la sua citazione.
hero member
Activity: 588
Merit: 500
...omissis... chi cazzo se ne frega del perchè lo fanno.

Grazie.

Dai... dai... ce la puoi fare. (cit)
member
Activity: 154
Merit: 10
...omissis... chi cazzo se ne frega del perchè lo fanno.

Grazie.
legendary
Activity: 1526
Merit: 1010
▇ ▅ ▃ ▇ ▅ █
ah no? e come arrivi a un articolo di un mese o un anno fa se non cercandolo con un motore di ricerca?
eliminare risultati da una ricerca arbitrariamente è proprio censura
anche wikipedia parla con questi termini http://it.wikipedia.org/wiki/Google#Censura

Censura e' rimuovere un contenuto.

L'indicizzazione e' una questione di efficienza.

Probabilmente, ma sto speculando sulle spalle degli altri e non si dovrebbe mai fare questa cosa ovviamente, per questioni economiche del giornale hanno deciso di non rendere ricercabili dai motori di ricerca quei contenuti.

"Grazie".

PS: tra l'altro il link che ha postato Lei @Anon39 e' inerente alla censura di Google, e la descrizione del suo link è il come Google ha protetto i suoi interessi economici nei confronti della censura attuata dal Governo Cinese: il Governo Cinese ha censurato, Google si protegge.
Google si protegge perche' e' una compagnia privata.
Interessi economici appunto come ho gia' detto.
Questo è l'articolo corretto che Lei avrebbe dovuto postare: http://it.wikipedia.org/wiki/Censura
(NP: non credevo davvero di dover arrivare a spiegare queste cose).

"Grazie 2"
ti ringrazi da solo?
cosa c'entra l'efficienza di ricerca? qui si sta dicendo che questi giornali, come dici tu, RIMUOVONO un contenuto dai risultati di una ricerca, e questa è CENSURA, chi cazzo se ne frega del perchè lo fanno.
member
Activity: 154
Merit: 10
ah no? e come arrivi a un articolo di un mese o un anno fa se non cercandolo con un motore di ricerca?
eliminare risultati da una ricerca arbitrariamente è proprio censura
anche wikipedia parla con questi termini http://it.wikipedia.org/wiki/Google#Censura

Censura e' rimuovere un contenuto.

L'indicizzazione e' una questione di efficienza.

Probabilmente, ma sto speculando sulle spalle degli altri e non si dovrebbe mai fare questa cosa ovviamente, per questioni economiche del giornale hanno deciso di non rendere ricercabili dai motori di ricerca quei contenuti.

"Grazie".

PS: tra l'altro il link che ha postato Lei @Anon39 e' inerente alla censura di Google, e la descrizione del suo link è il come Google ha protetto i suoi interessi economici nei confronti della censura attuata dal Governo Cinese: il Governo Cinese ha censurato, Google si protegge.
Google si protegge perche' e' una compagnia privata.
Interessi economici appunto come ho gia' detto.
Questo è l'articolo corretto che Lei avrebbe dovuto postare: http://it.wikipedia.org/wiki/Censura
(NP: non credevo davvero di dover arrivare a spiegare queste cose).

"Grazie 2"
legendary
Activity: 1526
Merit: 1010
▇ ▅ ▃ ▇ ▅ █

Si certo quello è chiaro, ma se io avessi spirito censorio e volessi avere la certezza di censurare un certo contenuto mi limiterei a eliminarlo dal mio sito...scrivendolo nel robots.txt lo lascio sotto gli occhi di chi vuole commentare tale file come stiamo facendo qui...

Continuate a parlare di censura, per me l'indicizzazione con la censura non c'entra niente.
ah no? e come arrivi a un articolo di un mese o un anno fa se non cercandolo con un motore di ricerca?
eliminare risultati da una ricerca arbitrariamente è proprio censura
anche wikipedia parla con questi termini http://it.wikipedia.org/wiki/Google#Censura
member
Activity: 154
Merit: 10

Si certo quello è chiaro, ma se io avessi spirito censorio e volessi avere la certezza di censurare un certo contenuto mi limiterei a eliminarlo dal mio sito...scrivendolo nel robots.txt lo lascio sotto gli occhi di chi vuole commentare tale file come stiamo facendo qui...

Continuate a parlare di censura, per me l'indicizzazione con la censura non c'entra niente.
hero member
Activity: 484
Merit: 500
Perchè se cerchi Tizio+Caio su Google per altri motivi (recruiting per esempio) non devono mostrare quel contenuto.

Si certo quello è chiaro, ma se io avessi spirito censorio e volessi avere la certezza di censurare un certo contenuto mi limiterei a eliminarlo dal mio sito...scrivendolo nel robots.txt lo lascio sotto gli occhi di chi vuole commentare tale file come stiamo facendo qui...
member
Activity: 154
Merit: 10

La lingua italiana prevede anche che si scriva "indicizzazione"!

http://www.treccani.it/enciclopedia/indicizzazione/

(Senza rancore, te la sei cercata  Grin)

Post corretto.
hero member
Activity: 686
Merit: 500
Scusate quello che non capisco perchè questi quotidiani hanno un elenco di pagine che non vogliono far indicizzare? Se vogliono "censurare"...

Cosa c'entra la censura con l'indicizzazzione?!?

Dai... dai... ce la puoi fare: si chiama lingua italiana.

La lingua italiana prevede anche che si scriva "indicizzazione"!

http://www.treccani.it/enciclopedia/indicizzazione/

(Senza rancore, te la sei cercata  Grin)
member
Activity: 154
Merit: 10
Scusate quello che non capisco perchè questi quotidiani hanno un elenco di pagine che non vogliono far indicizzare? Se vogliono "censurare"...

Cosa c'entra la censura con l'indicizzazione?!?

Dai... dai... ce la puoi fare: si chiama lingua italiana.
hero member
Activity: 590
Merit: 500
Perchè se cerchi Tizio+Caio su Google per altri motivi (recruiting per esempio) non devono mostrare quel contenuto.
hero member
Activity: 484
Merit: 500
Scusate quello che non capisco perchè questi quotidiani hanno un elenco di pagine che non vogliono far indicizzare? Se vogliono "censurare" quei contenuti non gli verrebbe più semplice eliminare direttamente quegli articoli? Se uno ci arriva navigando "a mano" sono ancora disponibili...
legendary
Activity: 1316
Merit: 1481
OT @ alchimista

mi spieghi perché non mi rispondi al pm che ti ho mandato?
legendary
Activity: 882
Merit: 1000
Hehe interessante..
Grazie x la segnalazione!
member
Activity: 154
Merit: 10
E ci è voluto fino al 2009 per approvare una legge del genere?!?
hero member
Activity: 590
Merit: 500
Considera che l'operazione trasparenza tratta al 90% dei dipendenti e non dei politici.
sr. member
Activity: 455
Merit: 251
blockchain longa, vita brevis
Il punto è che se cerchi il nome di un certo politico, google non ti darà risultati riguardanti l'operazione trasparenza, e dunque della sua presenza/assenza a lavoro, del suo stipendio, etc.

Non lo trovo troppo giusto, è un cavillo che possono permettersi, ma è divertente e sconfortante quanto sia dissonante con la trasparenza per cui è stata fatta la legge.
hero member
Activity: 658
Merit: 502
Cioè fatemi capire, il governo italiano ha fatto una legge sulla trasparenza e poi nasconde le pagine sul suo sito? "disallow - operazione trasparenza" Grin rotolo


In realtà protegge solo l' elenco nomi. Le possibilità da come la vedo io, possono essere due. Una per tutelare la privacy dei dirigenti e consulenti, l'altra potrebbe essere che cambiano con una certa frequenta e per evitare disguidi si preferisci non farli indicizzare



FaSan
legendary
Activity: 981
Merit: 1029
Cioè fatemi capire, il governo italiano ha fatto una legge sulla trasparenza e poi nasconde le pagine sul suo sito? "disallow - operazione trasparenza" Grin rotolo
hero member
Activity: 590
Merit: 500
Probabilmente in certi casi è fatto per tutelare la privacy sui motori di ricerca.
Soprattutto per quanto riguarda l'operazione trasparenza delle Pubbliche Amministrazioni che deve essere bene in vista sul sito.

Nei casi dei quotidiani probabilmente saranno avvocati che avranno diffidato da rendere noto ai motori di ricerca un certo nome.

Anche perchè te magari 20 anni fa hai stuprato una gallina e sei finito su Repubblica e se oggi cerchi lavoro tutti quelli che cercheranno il tuo nome arriveranno alla gallina.
legendary
Activity: 1092
Merit: 1021
Non ci avevo mai fatto caso. Che bello... Roll Eyes
legendary
Activity: 1582
Merit: 1196
Reputation first.
Assurdo, e poi si ostinano a dire a voce alta che siamo in un paese democratico. Il massimo si raggiunge quando si apre il robots.txt del governo e si leggono i decreti che hanno deciso di non pubblicare  Grin
legendary
Activity: 1316
Merit: 1481
bella storia...
ma pensa te
sr. member
Activity: 455
Merit: 251
blockchain longa, vita brevis
Tutti i siti hanno un robots.txt, queste contiene la lista delle pagine di quel sito che non devono essere indicizzate dai motori di ricerca.
Se si cerca il robot.txt del sito di Repubblica e del Corriere si ottiene una lista BELLISSIMA di articoli, verosimilmente quelli su cui ci sono beghe legali e che l'editore, o il capo-redattore, o chi per loro, ha deciso di non far apparire sui motori di ricerca.

Divertitevi con:
http://www.repubblica.it/robots.txt
http://www.corriere.it/robots.txt

Non sorprendentemente, la maggior parte degli articoli parlano di arresti e corruzione con protagonisti politici o dottori, dei quali compare il nome.

Capita anche con i titolari di grosse aziende.


Ma ancora più bello:
http://www.governo.it/robots.txt

Le pagine censurate sono quelle relative a questa legge:

La legge n. 69 del 18 giugno 2009 (“Disposizioni per lo sviluppo economico, la semplificazione, la competitività nonché in materia di processo civile”) impone, all’art. 21, comma 1, che tutte le pubbliche amministrazioni debbano rendere note, attraverso i propri siti internet, alcune informazioni relative ai dirigenti (curriculum vitae, retribuzione, recapiti istituzionali) e i tassi di assenza e di presenza del personale, aggregati per ciascun ufficio dirigenziale.
Jump to: