ebook img

Trovare su Internet: dal pulsante cerca ai confini dell'hacking PDF

149 Pages·2013·9.14 MB·Italian
Save to my drive
Quick download
Download
Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.

Preview Trovare su Internet: dal pulsante cerca ai confini dell'hacking

T I ROVARE SU NTERNET D C ' AL PULSANTE ERCA AI CONFINI DELLHACKING Fabio Brivio © Apogeo - IF - Idee editoriali Feltrinelli s.r.l. Socio Unico Giangiacomo Feltrinelli Editore s.r.l. ISBN edizione cartacea: 9788850332588 Il presente file può essere usato esclusivamente per finalità di carattere personale. Tutti i contenuti sono protetti dalla Legge sul diritto d'autore. Nomi e marchi citati nel testo sono generalmente depositati o registrati dalle rispettive case produttrici. L'edizione cartacea è in vendita nelle migliori librerie. ~ Seguici su Twitter @apogeonline Una vita senza ricerca non è degna di essere vissuta Socrate Introduzione Cercare è per metà trovare La prima edizione del libro che avete tra le mani nasceva nel 2005. Si trattava di un progetto molto più compatto, di sole 72 pagine, introduttivo all’uso di Google. L’idea era quella di creare una semplice guida per imparare a cercare, e soprattutto trovare, su Internet le risposte alle proprie domande, mettendo in condizione il lettore di accedere a diverse tipologie di informazioni, per soddisfare le necessità lavorative, di studio o personali. Dopo otto anni, quattro edizioni, e 35.000 copie vendute, il progetto si amplia nel numero di pagine e nelle intenzioni. Non più solo trovare su Internet con Google, ma trovare su Internet con Google e, soprattutto, oltre Google. Cercare su Internet La Rete è un serbatoio inimmaginabile di risorse. I limiti al suo sviluppo sono difficilmente descrivibili così come la quantità di informazioni distribuite nei più svariati formati. Per farsi un’idea, la Figura I.1 presenta una rappresentazione di Internet su scala planetaria, la Figura I.2 ne offre una differente astrazione, mentre la Figura I.3 mostra in un’infografica su cosa succede in un “minuto di Internet”. Di fronte a uno scenario di questo tipo non solo l’organizzazione delle informazioni presenta numerosi problemi, ma anche orientarsi in Rete non è semplice. Figura I.1 Densità e localizzazione geografica dei computer che compongono Internet. (Fonte: http://en.wikipedia.org/wiki/Carna_Botnet. Vale la pena dare un’occhiata a questa pagina per osservare una versione dinamica della mappa nell’arco di una giornata.) Figura I.2 Una mappa di Internet: è facile perdersi in questa fitta ragnatela. (Fonte: Wikimedia Commons http://commons.wikimedia.org/wiki/File:Internet_map_1024.jpg, licenza Creative Commons BY http://creativecommons.org/licenses/by/2.5/.) Figura I.3 Intel ha provato a descrivere cosa accade su Internet in sessanta secondi. Qualche numero? 200 milioni di e-mail inviate, 20 milioni di foto pubblicate, 6 milioni di visite a Facebook, centomila tweet postati, più di 2 milioni di ricerche con Google... (Fonte: http://www.intel.com/content/www/us/en/communications/internet-minute-infographic.html.) Cercare su Internet, senza sapere esattamente dove, è un’impresa ben più ardua del cercare il classico ago nel pagliaio. Per fortuna con Internet si sono sviluppati degli strumenti e dei servizi che aiutano nelle operazioni di ricerca. Tra questi i più famosi sono i motori di ricerca, che con pochi clic permettono di scandagliare milioni di dati. Google è fino a oggi riconosciuto come il principe dei motori di ricerca (basti pensare che nel mondo anglosassone to google ha assunto il significato di cercare in Rete). Ogni giorno Google soddisfa le richieste di milioni di utenti. Le sue funzionalità e le sue modalità di ricerca sono tanto potenti e articolate che se un’informazione è disponibile, Google quasi sicuramente è in grado di trovarla; basta formulare la domanda giusta nel modo giusto. In questo libro si parla quindi di Google, ma non solo. Per arrivare velocemente all’informazione desiderata, a volte è necessario guardare oltre Google e conoscere le logiche e le architetture su cui si basano la Rete e il Web. Un Web nella Rete Nelle prossime pagine faremo a volte riferimento a server e client. L’architettura di Internet si basa infatti su questi due concetti che quindi hanno implicitamente a che fare con tutte le tecniche di ricerca che vedremo. Alcune precisazioni sono quindi importanti. Per prima cosa cercare su Internet e cercare nel Web non vogliono dire esattamente la stessa cosa. Internet – “la rete delle reti” – è una grande “ragnatela” di computer sparsi per il mondo e connessi in diversi modi. Le modalità in cui questi computer comunicano sono differenti e basate su diversi protocolli. NOTA Per protocollo si intende l’insieme delle regole che guidano lo scambio di informazioni tra macchine diverse. Ogni protocollo è pensato per consentire servizi specifici, quindi esistono, per esempio, protocolli per scambiare messaggi via posta elettronica, trasferire file, comunicare via chat, condividere e scaricare file multimediali (audio e video) e navigare tra ipertesti. La particolarità di Internet è quella di non avere un centro: la sua struttura è costruita in modo tale che, anche in caso di danneggiamento di una sua parte, la Rete rimanga attiva e funzionante. Non è cioè possibile “spegnere” Internet, ma è possibile spegnere alcuni dei computer che ne fanno parte, o impedire la comunicazione tra due o più macchine (anche solo limitatamente ad alcuni servizi). Il Web (o WWW, acronimo di World Wide Web) è una parte di Internet, dove occupa uno spazio ben preciso: quello degli ipertesti, appunto. In pratica il Web è una rete di computer sui quali sono presenti documenti ipertestuali. NOTA Questi computer comunicano tra loro utilizzando uno specifico protocollo chiamato HTTP (HyperText Transfer Protocol). Insomma, nella rete Internet non tutte le macchine ospitano documenti ipertestuali. Paragonare Internet al Web è perciò scorretto: il Web è solo una delle possibilità offerte dalla Rete, e non necessariamente una macchina connessa a Internet dà accesso a pagine ipertestuali o pagine web. È del resto anche vero che oggi Internet e il Web convivono in stretta simbiosi, per cui è facile trovare siti web che consentono di utilizzare le modalità comunicative proprie di altri protocolli. Esempi sono i servizi di posta elettronica come Hotmail, Gmail o Yahoo! a cui si accede via Web, ma che in maniera del tutto trasparente per l’utente utilizzano specifici protocolli per l’invio e la ricezione dei messaggi. HTTP è quindi l’elemento che garantisce la comunicazione nel Web, ma gli ipertesti non potrebbero esistere in quanto tali senza il cosiddetto link, o collegamento ipertestuale, il ponte di congiunzione tra una pagina web e l’altra. Si potrebbe in un certo senso dire che il Web è un gigantesco ipertesto reticolare: a prescindere dal punto di partenza, attraverso percorsi inimmaginabili è possibile raggiungere qualsiasi pagina. Tornando a Internet, i computer che ne fanno parte possono assumere il ruolo di client o di server: i client sono i computer da cui si parte per “navigare”, mentre i server sono i computer su cui risiedono i documenti e le risorse disponibili. NOTA La varietà di client si è andata allargando negli ultimi anni. Ai tradizionali computer desktop o notebook si sono affiancati numerosi dispositivi mobili: smartphone e tablet, a dispetto delle dimensioni ridotte, sono a tutti gli effetti client da cui è possibile accedere a Internet in completa mobilità. Per usare una metafora, si può vedere una biblioteca (intesa come edificio, personale, scaffali, libri, schedari e così via) come un server a cui gli utenti, cioè i client, possono inoltrare la richiesta di uno o più libri. NOTA Poiché la funzione di un server è ospitare documenti e risorse, questo viene anche detto host (ospite). In pratica succede che un client effettua la richiesta di un documento, questa richiesta viene trasferita a un server utilizzando il protocollo del caso, il server la elabora e, se rileva tra i suoi archivi il documento in oggetto, lo restituisce al client. NOTA Ogni documento ospitato sui server deve avere un indirizzo univoco che ne rende possibile l’individuazione e il recupero senza alcuna ambiguità. Questo indirizzo è detto URL (Uniform Resource Locator). URL o URI sono quindi gli indirizzi internet che il browser invia come richiesta al server. Sintetizzando, il client fa una domanda e il server risponde. La domanda è la cosiddetta query e la sua formulazione varia a seconda dello strumento e del tipo di ricerca che si vuole svolgere, come vedremo nei capitoli che seguono.

Description:
Su Wikipedia, ogni mese, vengono scritte 10.000 nuove voci per un totale di 1.015.953, solo in italiano. Su Facebook, ogni giorno, vengono aggiunte 200 milioni di foto. Su YouTube, ogni minuto, vengono caricate 60 ore di nuovi video. Internet è un serbatoio inesauribile di risorse ma, proprio per q
See more

The list of books you might like

Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.