Tutti noi conosciamo come funzionano queste semplici funzioni di google ma sicuramente molti di voi ignorano molti comandi base e molti dei comandi avanzati che ci offre questo motore. E’ importante conoscere i comandi sotto elencati , fondamentali per la pratica che affronteremo dopo. Li riepiloghiamo (ci serviranno dopo nella parte di hacking).
Operatori Base (USO: OERATORE STRINGA)
Operatori Avanzati (Uso OPERATORE: STRINGA)
Google ha una sua sintassi con delle regole precise. Tale sintassi permette di sfruttare al meglio le query. Tuttavia anche la scelta di parole chiave deve essere mirata ed il meno generica possibile. Google ha un singolare comportamento con le parole chiave: se infatti queste vengono ripetute più volte, il risultato della query cambia, e si hanno molti più risultati rispetto al singolo inserimento. Di seguito riporterò gli operatori di ricerca più comuni.
intitle:
Trova le pagine contenenti nel proprio titolo la parola chiave
specificata. Esempio: intitle:xhtmlallintitle:
Restituisce le pagine che contengono nel titolo tutte le parole
specificate. Esempio: allintitle:xhtml tutorialsinurl:
Limita i risultati alle pagine contenenti una determinata parola nell'URL.
Esempio: inurl:cssallinurl:
Limita i risultati alle pagine contenenti tutte le parole specificate nel
proprio URL. Esempio: allinurl:css designintext:
Restituisce le pagine che contengono nel testo la parola chiave
specificata. Esempio: intext:blogallintext:
Limita i risultati alla pagine che contengono nel testo tutte le parole
specificate. Esempio: allintext:eric meyerlink: Ricerca le pagine Web
che contengono collegamenti al link specificato. Esempio: link:www.html.itinanchor:
Ricerca negli anchor dei link presenti nelle
pagine. Esempio: inanchor:linuxsite: Restringe la ricerca
ad un sito o ad un dominio di livello superiore. Esempi: site:com o site:it o site:www.redhat.comcache: Trova una copia della
pagina che Google ha indicizzato nella propria cache. Utile quando le
pagine non sono più online. Esempio: cache:www.nomesito/nomepagina.htmfiletype:
o ext: Limita i risultati ad un documento avente
una determinata estensione di file (.doc, .pdf, .rtf, .pl,
.sh, .xls, eccetera). Esempio: filetype:pldefine:
Fornisce la descrizione di un termine ed i link ad esso correlati.
Esempio: define:wormrelated:
Cerca pagine simili o affini alla pagina specificata. Esempio: related:www.html.itinfo: Si ottengono ulteriori
informazioni e link su un URL specificato. Fondamentale per tale
descrizione è l'uso accorto dei metatag.
Esempio: info:www.w3.orgL'hacker è colui al quale piace esplorare i
dettagli di una tecnologia, a differenza degli utenti comuni che si
accontentano del minimo necessario. Google è una tecnologia che offre molto a
chi sa cercare. Ma come in tutte le ricerche, c'è una
via normale ed una via oscura. La via normale è questa, quella che passa dalla API di Google e rispetta i criteri
d'uso del motore di ricerca; l'altra, quella oscura, è rappresentata dal non
usare
http://johnny.ihackstuff.com/ è l'URL del sito nel quale si trova il Google Hacking Database, un'enciclopedica raccolta di stringhe di ricerca di Google del tutto simili a quelle viste in precedenza, con un'unica, fondamentale differenza: queste stringhe permettono di mettere in luce bug dei siti o dei forum di tali siti, di trovare password e username, chiavi di ingresso a canali IRC, di testare vulnerabilità e molto altro ancora, fermo restando che lo scopo è quello di segnalare e di porre rimedio a tutti questi bug. Google come strumento di ricerca e di protezione, dunque, e non come strumento di offesa. Ora vedremo alcune stringhe particolari :
intitle:index.of "parent
directory"
Se non si pongono limiti a Google il risultato sarà quello di vedere il nostro sito completamente scoperto dalla prima all'ultima directory. Una buona regola è quella di reindirizzare la navigazione verso la home page del sito o, in alternativa, porre una password apposita.
intitle:index.of "parent
directory" images OR image
Stesso discorso del precedente esempio, con l'aggiunta di una directory specifica.
"index of /backup"
index
of /css
In questo caso vengono colpite altre due directory
sensibilissime, col rischio di vedere barbaramente copiati i nostri layouts o altri file riservati. Una buona protezione
consiste nell'agire direttamente sul file robots.txt:
User-Agent:
Googlebot
Disallow:
/backup
Disallow:
/css
filetype:htpasswd htpasswd
Intitle:index of passwd passwd.bak
Ecco due tipi di file che gli utenti Unix/Linux conoscono molto bene. Questi due hack forniscono l'elenco di siti che hanno lasciato scoperti questi due tipi di file. Per porre rimedio occorre andare ancora una volta sul file robots.txt ed aggiungere ad esempio una stringa come:
User-Agent:
Googlebot
Disallow:
/*.bak$
Con la stringa di sopra impediamo a Google di indicizzare una determinata estensione di file, come nel primo caso avevamo impedito l'indicizzazione delle directory specificate. Ancora:
filetype:dat "password.dat"
filetype:log inurl:"password.log"
Qui si ricercano informazioni riservate di sistema. Cambiando le estensioni o specificando un dominio particolare è possibile andare incontro ad alcune "gradite" sorprese.
sets mode: +k
Questa query viene usata
per cercare all'interno dei file di log le password di protezione dei canali
IRC. L'attributo +k
indica la modalità dei canali di chat che avvisa
l'utente della restrizione delle impostazioni. Qui meglio di altrove ci si
rende conto dell'importanza fondamentale della scelta della
parole chiave e del bisogno che questi file di log siano opportunamente
protetti.
filetype:xls username password
filetype:xls private OR
reserved
filetype:doc site:mil +classified
Il formato di questi file risulterà certamente più familiare agli utenti Windows. Nell'ultimo caso è presente quella restrizione di campo in un dominio specifico di cui parlavo poc'anzi. Vale sempre la regola della protezione mediante password e della modifica del file robots.txt.
Il 21 dicembre 2004 il worm Santy fece la sua comparsa in Internet, attaccando migliaia di siti Web e "defacciandoli" con la scritta rossa su sfondo nero:
This site is
defaced!
NeverEverNoSanity WebWorm generation.
La particolarità di questo worm è che faceva uso di un hack di Google per rintracciare quei siti che erano affetti da una particolare vulnerabilità della piattaforma PHP Bulletin Board (phpBB), interrogando Google in modo automatico ed utilizzando quindi quella particolare tecnica di ricerca meglio nota come scraping, ovverosia una ricerca che non fa uso della API di Google ma che si riallaccia direttamente al codice delle pagine, violando i termini d'uso del motore di ricerca, come abbiamo già avuto modo di vedere in precedenza. Google da allora ha deciso di rispondere all'hacking in maniera perentoria, rispondendo a volte con pagine come questa:
...but we can't
process your request right now. A computer virus or spyware
application is sending us automated request, and it appears that your computer
or network has been infected. (...)
Qual era l'hack in questione? Si può risalire ad esso analizzando direttamente il codice sorgente di Santy, usando l'hack filetype:pl "Santy worm" per cercarlo sul Web (nel momento
in cui scrivo è reperibile unicamente nella cache di Google):
Sub GoGoogle()
{
my
@urls;
my
@ts = qw/t p topic/;
my
$startURL = 'http://www.google.com/search?num=100&lr=&as_qdr=all' . '&q=allinurl%3°+%22viewtopic.php%22+%22'. (...)
L'hack allinurl:viewtopic.php, come abbiamo
visto, delimita la ricerca delle parole solo all'interno dell'URL del sito,
indirizzando il worm verso l'obiettivo specifico,
quello appunto del forum phpBB. Lo scraping in questione viene fatto
utilizzando un semplice script in Perl. Esempi di
tali script possono essere rintracciati sul libro Google. Trucchi e
segreti per hacker di Tali Calishain e Rael
Dornfest, edito in Italia da HOPS - Tecniche
Nuove. Tuttavia è da notare che la maggior parte degli script presenti su tale
volume fa uso della API di Google, per la quale è
necessario essere in possesso di una regolare chiave per sviluppatori
di Google, rilasciata in modo assolutamente gratuito. Con tale chiave
è possibile effettuare quotidianamente un numero
massimo di 1000 query. Oltre tale
numero scatta automaticamente il blocco imposto da Google, oltre il quale si
entra nel campo dell'abuso degli strumenti in questione. Esistono diversi
programmi disponibili sul Web per eseguire (in modo legale o no) query automatizzate. Fra tutti citerò quello di Johnny
Long, autore del Google Hacking
Database e massimo esperto in materia di Google hacking.
Il software si chiama Gooscan (per
Linux), è gratuito, ed esegue hack scelti dall'utente
che possono essere salvati e successivamente
analizzati. Il software può incorporare il Google Hacking Database.
Per concludere il Google hacking può costituire una fonte di serio pericolo, qualora esso venisse utilizzato per loschi fini. La speranza di questo scritto sta nella possibilità di aver condiviso con voi la bellezza della ricerca e l'amore per il Web, che oggi come ieri affratella e unisce le persone di tutto il mondo.
Sono buono
Vi faccio delle stringhe pronte per cercare telecamere in tutto il mondo… sicurezza, sorveglianza, strade, private, insomma di ogni genere buon divertimento
Aprire google
Digitare o fare copia ed incolla delle sottocitate stringhe
cerca
e… buona visione
intitle:”Live view - AXIS”
intitle:”Live view - AXIS 213 PTZ Network Camera version
4.12″
intitle:”live” (intext:”MOBOTIX M1″ intext:”MOBOTIX
M10″) intext:”Open Menu”
intitle:flexwatch
intext:”Copyright by Seyeon TECH Co”
inurl:indexFrame.shtml
Axis
control/userimage.html
inurl:indexframe.shtml
inurl:”MultiCameraFrame?Mode=”
inurl:”view/index.shtml”
inurl:”view/indexFrame.shtml”
inurl:view/view.shtml
inurl:/view/view.shtml?videos=
inurl:ViewerFrame?Mode=
inurl:ViewerFrame?Mode=Motion
inurl:ViewerFrame?Mode=Refresh
/view/view.shtml
axis
sample/LvAppl/
control/userimage.html
“(c)copyright 1999-2003 VICTOR COMPANY OF JAPAN,
LIMITED. All rights reserved”
“V.Networks [Motion Picture(Java)”
“Control the Pan/Tilt and move to the Preset Position”
/app/idxas.html
“Saving & Retrieving Mode”
/ViewerFrame?Mode=Motion
“TOSHIBA Network Camera - User Login”
/home/homeJ.html
“my webcamXP server!”
allintitle: Network Camera NetworkCamera
intitle:liveapplet
intitle:”WJ-NT104 Main”
intitle:”snc-rz30 home”
inurl:”/jpg/” | “/mjpg/” |
“/axis-cgi/” ?inurl:”image.cgi”
| “video.cgi” | “video.mjpg”
filetype:mjpg | filetype:cgi
intitle:”live view” intitle:axis
intitle:axis intitle:”video
server”
camera linksys inurl:main.cgi
intitle:”active webcam page”
intitle:”EvoCam” inurl:”webcam.html”
Display Cameras intitle:”Express6 Live Image”
intitle:liveapplet inurl:LvAppl
intitle:”my webcamXP
server!” inurl:”:8080″
intitle:”Network Camera” inurl:ViewerFrame
intitle:snc-z20 inurl:home/
intitle:snc-rz30 inurl:home/
intitle:”toshiba network camera - User Login”
intitle:”Live View / - AXIS” | inurl:view/view.shtml
intitle:”WJ-NT104 Main Page”
inurl:”ViewerFrame?Mode=”
site:.viewnetcam.com
tilt intitle:”Live View / - AXIS” | inurl:view/view.shtml
e c’e’ (ovviamente) anche gente che si diverte a
cercarne in giro e a mettere l’elenco sul proprio sito:
http://www.theone.se/linkto/axiscams.html
http://www.butterfat.net/goocam/
http://www.griffid.com/?page=livecams
Cosa so di te...