GOOGLERANK / ITA / COVER / funzionamento-google.html
COME FUNZIONA GOOGLE - DESCRIZIONE GENERALE E CARATTERISTICHE PRINCIPALI
CONTENUTI: L'ARCHITETTURA HARDWARE DI GOOGLE, I SUOI SERVER, DOCUMENTI INDICIZZATI, CARATTERISTICHE E LIMITAZIONI, I PRINCIPI DI VALUTAZIONE E RANKING, GOOGLEPLEX
MARKET SHARE
Per capire l'importanza di ottimizzare e successivamente provare a posizionare un sito nelle pagine di risposta (SERP) di Google, è utile rendersi conto della base di utenza su cui questo motore di ricerca può contare:
I numeri parlano da soli: con una percentuale molto prossima al 50%, Google gestisce da solo la metà di tutte le ricerche effettuate sul web (ad onor del vero, lo studio soprariportato è riferito alle ricerche effettuate negli Stati Uniti). Percentuale ancora più significativa se pensiamo che molta dell'utenza di Yahoo o MSN effettua ricerche attraverso strumenti indiretti quali la posta elettronica e i chat client.
LE TRE REGOLE FONDAMENTALI DEL RANKING SU GOOGLE
Se vuoi ottenere un alto posizionamento per il tuo sito , devi PENSARE come pensa Google. Ma come "ragiona" Google? Bene, per farla semplice, Google agisce come agirebbe un essere UMANO PARANOICO, PIGRO, CURIOSO e DOTATO DI MODEM 18 Kbs (leggi il capitolo relativo al "RANDOM SURFER MODEL" che non è limitato all'algoritmo Pagerank ma a tutta la filosofia di indicizzazione di Google)
quindi:
1. VELOCITA' DEL SERVER SU CUI E' PUBBLICATO IL TUO SITO:
deve essere più veloce possibile . Le pagine del tuo sito devono essere scaricabili alla velocità della luce (o quasi). Proprio così: Google pone in maggior risalto i siti residenti su server veloci.
Bizzarro ma ragionevole: Google mette ai primi posti delle pagine delle ricerche i siti più autorevoli, e un webmaster che investe denaro per un ottimo hosting/server molto probabilmente è titolare di un sito che vuole rendere importante (o almeno ci prova N.d.A.).
Inoltre Google preferisce i server veloci perchè come scopo principale ha quello di offrire ai suoi utenti collegamenti a risorse, le quali devono essere accessibili velocemente.
Se hai intenzione di ottenere buone posizioni nelle pagine di risposta devi scegliere con intelligenza il tuo provider. Se hai timore di spendere troppo per un hosting (o un server) di qualità, tieni sempre a mente quanto traffico è in grado di portarti Google. Gratuitamente.
IP: se ne parlerà anche più avanti, ma oltre alla buona velocità del server, il provider che sceglierai dovrà anche offrirti la possibilità di avere un IP UNICO , DEDICATO
Sovente, soprattutto per chi sceglie l'hosting virtuale, al dominio viene assegnato un IP condiviso con altre decine di altri siti: questo rende talvolta impossibile per i motori di ricerca arrivare ai siti e indicizzarli (in Google questa limitazione è molto evidente). Tuttavia negli ultimi anni, grazie anche all'opera informativa fatta dagli esperti del settore su FORUM e siti divulgativi, si è compresa l'importanza di fornire un IP dedicato anche ai clienti dell'hosting virtuale. Alcuni provider hanno iniziato ad offrire quest'opzione nei loro hosting plain: è verso questi operatori che dovrai preferibilmente rivolgere la tua attenzione.
2. AGGIORNAMENTO DEL TUO SITO:
Googlebot ha la capacità di controllare la data in cui le tue pagine sono state pubblicate l'ultima volta (tramite l'header request IF-MODIFIED SINCE). Puoi trarre vantaggio da questa caratteristica, piuttosto che esser penalizzato (vengono penalizzate le pagine che non vengono aggiornate da molto tempo, indipendentemente dai contenuti), mantenendo le pagine del tuo sito costantemente aggiornate.
Ovviamente è impossibile aggiornare molte pagine quotidianamente, come è impossibile che tu abbia nuovi contenuti ogni giorno, ma ti sveliamo una piccola malizia: PUOI SEMPLICEMENTE RIPUBBLICARE LE PAGINE DEL TUO SITO QUOTIDIANAMENTE, ANCHE SE NON SONO STATE MODIFICATE. Lascia che Google sappia che aggiorni frequentemente il tuo sito.
In caso di pagine dinamiche (php, asp...) che vengono create on the fly dal server quando sono richieste, Google effettua un confronto con la copia cache, e ne registra eventuali modifiche. Per tale motivo, può essere utile inserire CONTENUTI RANDOM nelle proprie pagine (anche solo la data è sufficiente).
Ovviamente metti in atto questo stratagemma con cautela. Non sarebbe considerato realistico l'aggiornamento contemporaneo e totale di tutte le pagine.
3. GRANDI QUANTITA' DI CONTENUTI PRESENTATI IN PAGINE HTML:
Google adora i siti semplici, con una struttura lineare e con tonnellate di contenuti . Anche se dall'inizio del 2005 il vecchio limite di 101 KB (codice più testo) per le copie cache delle pagine è stato eliminato, Google odia le pagine lunghe e noiose. Meglio, anche per incrementare legittimamente il numero delle pagine all'interno del sito e ampliarne organicamente la struttura, tenersi ben al di sotto di tale limite.
Ecco cosa devi fare: crea pagine in HTML 4 (anche il nuovo standard W3C XHTML 1.0 transictional va benissimo), di dimensione non superiore ai 50 KB, mantenendo la struttura delle pagine il più semplice possibile. Se, a causa della natura dei suoi contenuti, scopri che una pagina pesa più di 50KB , suddividila in più pagine.
Ricorda:
MOLTE PAGINE, HTML, MENO DI 50KB (non più di 3 o 4 paragrafi, formattati tradizionalmente - vedi la sezione STRUTTURA HTML). Questa Guida Strategica ti spiegherà COME produrre quelle pagine da 50 KB (e molto altro).
L'ARCHITETTURA HARDWARE e SOFTWARE DI GOOGLE
Google possiede un sistema hardware particolarmente complesso, ma flessibile.
I suoi 20 data center* gestiscono più di 10.000 server (di cui solo un'ottantina sono raggiungibili pubblicamente). Quei 10.000 servers sono come frazioni di un puzzle gigantesco, ognuno dotato di un grande hard disk EIDE e potenti schede LAN in grado di gestire grandi quantità di flusso dati e tante richieste contemporanee.
Il sistema operativo di Google è una versione modificata della celebre Red Hat di Linux; Come web server si è optato per Apache, qui in una particolare versione denominata GWS (Google Web Server).
Facile da comprendere, questa architettura basata sulla distribuzione garantisce estrema potenza di calcolo, costi contenuti e soprattutto flessibilità. Per implementare il sistema i tecnici di Google non devono fare altro che acquistare altri computer e metterli in produzione.
Google non indicizza semplicemente pagine web, ma anche post sui newsgroup, Immagini, News e prodotti come libri, software, cd.... i tipi di file riconosciuti sono HTM, HTML, pagine dinamiche (come ASP, PHP, JSP CFM...). inoltre, file di Microsoft Word (DOC), RTF, TXT, Acrobat PDF, Shockwave Flash SWF.
Per un approfondimento sui Datacenter di Google, consulta l'apposita sezione "GOOGLE DATA CENTER"oppure "AGGIORNAMENTO DI GOOGLE"
Risultati: Google ignora la differenza tra minuscole e maiuscole . Ogni pagina più pesante di 101 KB verrà indicizzata e archiviata con l'assegnazione (arbitraria) del peso di 101KB.
Google indicizza Acrobat (pdf), Microsoft Word (doc), Rich Text (rtf), Text (txt), Excel (xls), Postscript (ps) e PowerPoint (ppt) files, e file di MACROMEDIA FLASH (SWF)
Aggiornamento frequente : circa 3 milioni (numero crescente) di siti che sono considerati importanti e rilevanti vengono reindicizzati quotidianamente.
Cache di Google: una copia di ogni pagina indicizzata è contenuta dall'archivio di Google , così come è stata rilevata dagli spider. Le pagine dei siti che vengono aggiornati quotidianamente possono differire dalla versione contenuta dalla cache di Google. Questo è irrilevante, perchè per la valutazione della pagina si considera la versione nella cache.
L'archiviazione e l'inserimento nella cache riguarda SOLO il codice html, ed esclude anche eventuali file esterni importanti come file CSS o JS.
Limitazioni di Google :
Google ignora le maiuscole e le minuscole, il che rende all'utente comune le cose facili, ma può creare problemi quando si cerca un contenuto per cui è determinante l'utilizzo delle maiuscole (ad esempio un titolo di un film)
Google indicizza i contenuti dei file Macromedia Flash, limitando però l'analisi ai LINK (get_url) escludendo i testi all'interno, che siano statici o dinamici.
GOOGLE SITEMAPS
Nelle parole di Google stesso, Sitemaps è un esperimento che si prefigge di indicizzare e catalogare più agevolmente e velocemente le risorse presenti sul web tramite l'utilizzo di file in XML. Il servizio prevede tre fasi: 1. Creazione di una mappa del sito secondo uno standard prefissato -vedi GENERATORE GOOGLE SITEMAP IN PHP presente nella sezione GOODIES 2. L' apertura di un account gratuito presso SITEMAPS DI GOOGLE 3. L'aggiornamento della mappa del proprio sito e la segnalazione a Google del nuovo file.
Sitemaps potrebbe essere una risposta concreta a tutti i webmaster che per vari motivi verificano scarso (o nullo) passaggio degli spider nelle proprie pagine web. Tuttavia, come chiaramente specificato da Google, la creazione di una mappa compatibile con il servizio Sitemaps NON HA INFLUENZA sul posizionamento nelle Serp. Pertanto ogni riferimento a questo servizio sperimentale, almeno in questa guida, termina qui.
Se prossimamente dovessimo verificare che una creazione di una mappa in formato XML compatibile ha invece grandi vantaggi nel ranking su Google, sarò ben lieto di dedicarci un'intera e dedicata sezione.
GOOGLEPLEX
Googleplex altro non è che l'edificio in cui ci sono gli uffici dello staff di Google.
Esso è situato a Mountain View, California, molto vicino al Parco Shoreline.

Per trovare il Googleplex utilizzando GOOGLE EARTH , usa le seguenti coordinate:
Longitude:
-122.0840472573312
Latitude: 37.42198291064995
Oppure scarica il file GOOGLEPLEX (richiede Google Earth installato sul tuo computer)
IL CONTROVERSO BREVETTO "20050071741" DEL MARZO 2005.
Da molti acclamato come un contenitore prezioso di segreti dell'algoritmo di Google, e nella precedente edizione esageratamente sottovalutato, è una valida introduzione a strumenti quali il calcolo della Click thru ratio, utilizzati o utilizzabili da Google nella valutazione dei documenti nell'archivio.
LEGGILO nell'apposita sezione.
La presente GUIDA AL POSIZIONAMENTO SU GOOGLE conterrà inoltre moltissimi altri riferimenti a brevetti attualmente implementati, come ad esempio HILLTOP o il discusso TRUSTRANK , buon proseguimento nella lettura.
RISORSE ESTERNE, REFERENCE
THE GOOGLE FILE SYSTEM
THE GOOGLE (CLUSTER) ARCHITECTURE
CARATTERISTICHE E FUNZIONI SPECIALI DI GOOGLE
GOOGLE SITEMAPS FREQUENTLY ASKED QUESTIONS (ITALIANO)
|
PAGINA INIZIALE - COVER
INTRODUZIONE ALLA GUIDA
FUNZIONAMENTO DI GOOGLE™
CARATTERISTICHE GENERALI
LISTA DATA CENTER
PREVENZIONE SPAM
LA SANDBOX DI GOOGLE
STEMMING E APPROCCIO LINGUISTICO
ANALISI DI PROGETTO
ANALIZZA TE STESSO E I TUOI CONCORRENTI
SCEGLI LE GIUSTE PAROLE CHIAVE
STUDIO DEL MERCATO E DELLE PAROLE CHIAVE
STRUTTURA DEL SITO
U.R.L.
ESEMPIO GRAFICO
SPIEGAZIONE
DOORWAY / RICH CONTENT PAGE
MACROMEDIA™ FLASH
COSTRUZIONE DELLE PAGINE
TITLE TAG
META TAG
BODY
BODY CONTENT
STRUTTURA HTML
ATTRIBUTO ALT DELLE IMMAGINI
COLLEGAMENTI IPERTESTUALI
DENSITA' DELLE PAROLE CHIAVE SOVRAOTTIMIZZAZIONE
SITE NETWORKING
INTRODUZIONE E APPLICAZIONE
DIRECTORY STYLE
PASSIVE MODE STYLE
SITI SATELLITE
PAGERANK™
DESCRIZIONE
L'IMPORTANZA DELLE DIRECTORY
PAGERANK IN VENDITA?
AGGIORNAMENTO DEL DATABASE DI GOOGLE™
SUGGERIMENTI PER LA LINK POPULARITY
GOODIES
GLOSSARIO
SEO: COMPETENZE, STRUMENTI, SOFTWARE
TUTELA LEGALE DEI PROPRI CONTENUTI
GENERATORE GOOGLE SITEMAP
|