OTTIMIZZAZIONE E POSIZIONAMENTO SU GOOGLE - LA GUDA DEFINITIVA - ITALIANO - CARATTERISTICHE GOOGLE - FEAR MANIFESTO EDITION 2006

GOOGLERANK / ITA / COVER / funzionamento-google.html

COME FUNZIONA GOOGLE - DESCRIZIONE GENERALE E CARATTERISTICHE PRINCIPALI

CONTENUTI: L'ARCHITETTURA HARDWARE DI GOOGLE, I SUOI SERVER, DOCUMENTI INDICIZZATI, CARATTERISTICHE E LIMITAZIONI, I PRINCIPI DI VALUTAZIONE E RANKING, GOOGLEPLEX

MARKET SHARE

Per capire l'importanza di ottimizzare e successivamente provare a posizionare un sito nelle pagine di risposta (SERP) di Google, è utile rendersi conto della base di utenza su cui questo motore di ricerca può contare:

fetta mercato Google

I numeri parlano da soli: con una percentuale molto prossima al 50%, Google gestisce da solo la metà di tutte le ricerche effettuate sul web (ad onor del vero, lo studio soprariportato è riferito alle ricerche effettuate negli Stati Uniti). Percentuale ancora più significativa se pensiamo che molta dell'utenza di Yahoo o MSN effettua ricerche attraverso strumenti indiretti quali la posta elettronica e i chat client.

LE TRE REGOLE FONDAMENTALI DEL RANKING SU GOOGLE

Se vuoi ottenere un alto posizionamento per il tuo sito , devi PENSARE come pensa Google. Ma come "ragiona" Google? Bene, per farla semplice, Google agisce come agirebbe un essere UMANO PARANOICO, PIGRO, CURIOSO e DOTATO DI MODEM 18 Kbs (leggi il capitolo relativo al "RANDOM SURFER MODEL" che non è limitato all'algoritmo Pagerank ma a tutta la filosofia di indicizzazione di Google)

quindi:

1. VELOCITA' DEL SERVER SU CUI E' PUBBLICATO IL TUO SITO:
deve essere più veloce possibile . Le pagine del tuo sito devono essere scaricabili alla velocità della luce (o quasi). Proprio così: Google pone in maggior risalto i siti residenti su server veloci.
Bizzarro ma ragionevole: Google mette ai primi posti delle pagine delle ricerche i siti più autorevoli, e un webmaster che investe denaro per un ottimo hosting/server molto probabilmente è titolare di un sito che vuole rendere importante (o almeno ci prova N.d.A.).
Inoltre Google preferisce i server veloci perchè come scopo principale ha quello di offrire ai suoi utenti collegamenti a risorse, le quali devono essere accessibili velocemente.
Se hai intenzione di ottenere buone posizioni nelle pagine di risposta devi scegliere con intelligenza il tuo provider. Se hai timore di spendere troppo per un hosting (o un server) di qualità, tieni sempre a mente quanto traffico è in grado di portarti Google. Gratuitamente.

IP: se ne parlerà anche più avanti, ma oltre alla buona velocità del server, il provider che sceglierai dovrà anche offrirti la possibilità di avere un IP UNICO , DEDICATO
Sovente, soprattutto per chi sceglie l'hosting virtuale, al dominio  viene  assegnato un IP condiviso con altre decine di altri siti: questo rende talvolta impossibile per i motori di ricerca arrivare ai siti e indicizzarli (in Google questa limitazione è molto evidente). Tuttavia negli ultimi anni, grazie anche all'opera informativa fatta dagli esperti del settore su FORUM e siti divulgativi, si è compresa l'importanza di fornire un IP dedicato anche ai clienti dell'hosting virtuale. Alcuni provider hanno iniziato ad offrire quest'opzione nei loro hosting plain: è verso questi operatori che dovrai preferibilmente rivolgere la tua attenzione.

2. AGGIORNAMENTO DEL TUO SITO:
Googlebot ha la capacità di controllare la data in cui le tue pagine sono state pubblicate l'ultima volta (tramite l'header request IF-MODIFIED SINCE). Puoi trarre vantaggio da questa caratteristica, piuttosto che esser penalizzato (vengono penalizzate le pagine che non vengono aggiornate da molto tempo, indipendentemente dai contenuti), mantenendo le pagine del tuo sito costantemente aggiornate.
Ovviamente è impossibile aggiornare molte pagine quotidianamente, come è impossibile che tu abbia nuovi contenuti ogni giorno, ma ti sveliamo una piccola malizia: PUOI SEMPLICEMENTE RIPUBBLICARE LE PAGINE DEL TUO SITO QUOTIDIANAMENTE, ANCHE SE NON SONO STATE MODIFICATE. Lascia che Google sappia che aggiorni frequentemente il tuo sito.

In caso di pagine dinamiche (php, asp...) che vengono create on the fly dal server quando sono richieste, Google effettua un confronto con la copia cache, e ne registra eventuali modifiche. Per tale motivo, può essere utile inserire CONTENUTI RANDOM nelle proprie pagine (anche solo la data è sufficiente).

Ovviamente metti in atto questo stratagemma con cautela. Non sarebbe considerato realistico l'aggiornamento contemporaneo e totale di tutte le pagine.

3. GRANDI QUANTITA' DI CONTENUTI PRESENTATI IN PAGINE HTML:
Google adora i siti semplici, con una struttura lineare e con tonnellate di contenuti . Anche se dall'inizio del 2005 il vecchio limite di 101 KB (codice più testo) per le copie cache delle pagine è stato eliminato, Google odia le pagine lunghe e noiose. Meglio, anche per incrementare legittimamente il numero delle pagine all'interno del sito e ampliarne organicamente la struttura, tenersi ben al di sotto di tale limite.

Ecco cosa devi fare: crea pagine in HTML 4 (anche il nuovo standard W3C XHTML 1.0 transictional va benissimo), di dimensione non superiore ai 50 KB, mantenendo la struttura delle pagine il più semplice possibile. Se, a causa della natura dei suoi contenuti, scopri che una pagina pesa più di 50KB , suddividila in più pagine.

Ricorda:

MOLTE PAGINE, HTML, MENO DI 50KB (non più di 3 o 4 paragrafi, formattati tradizionalmente - vedi la sezione STRUTTURA HTML). Questa Guida Strategica ti spiegherà COME produrre quelle pagine da 50 KB (e molto altro).

L'ARCHITETTURA HARDWARE e SOFTWARE DI GOOGLE

Google possiede un sistema hardware particolarmente complesso, ma flessibile.
I suoi 20 data center* gestiscono più di 10.000 server (di cui solo un'ottantina sono raggiungibili pubblicamente). Quei 10.000 servers sono come frazioni di un puzzle gigantesco, ognuno dotato di un grande hard disk EIDE e potenti schede LAN in grado di gestire grandi quantità di flusso dati e tante richieste contemporanee.
Il sistema operativo di Google è una versione modificata della celebre Red Hat di Linux; Come web server si è optato per Apache, qui in una particolare versione denominata GWS (Google Web Server).
Facile da comprendere, questa architettura basata sulla distribuzione garantisce estrema potenza di calcolo, costi contenuti e soprattutto flessibilità. Per implementare il sistema i tecnici di Google non devono fare altro che acquistare altri computer e metterli in produzione.

Google non indicizza semplicemente pagine web, ma anche post sui newsgroup, Immagini, News e prodotti come libri, software, cd.... i tipi di file riconosciuti sono HTM, HTML, pagine dinamiche (come ASP, PHP, JSP CFM...). inoltre, file di Microsoft Word (DOC), RTF, TXT, Acrobat PDF, Shockwave Flash SWF.

Per un approfondimento sui Datacenter di Google, consulta l'apposita sezione "GOOGLE DATA CENTER"oppure "AGGIORNAMENTO DI GOOGLE"

Risultati: Google ignora la differenza tra minuscole e maiuscole . Ogni pagina più pesante di 101 KB verrà indicizzata e archiviata con l'assegnazione (arbitraria) del peso di 101KB.

Google indicizza Acrobat (pdf), Microsoft Word (doc), Rich Text (rtf), Text (txt), Excel (xls), Postscript (ps) e PowerPoint (ppt) files, e file di MACROMEDIA FLASH (SWF)

Aggiornamento frequente : circa 3 milioni (numero crescente) di siti che sono considerati importanti e rilevanti vengono reindicizzati quotidianamente.

Cache di Google: una copia di ogni pagina indicizzata è contenuta dall'archivio di Google , così come è stata rilevata dagli spider. Le pagine dei siti che vengono aggiornati quotidianamente possono differire dalla versione contenuta dalla cache di Google. Questo è irrilevante, perchè per la valutazione della pagina si considera la versione nella cache.
L'archiviazione e l'inserimento nella cache riguarda SOLO il codice html, ed esclude anche eventuali file esterni importanti come file CSS o JS.

Limitazioni di Google :

Google ignora le maiuscole e le minuscole, il che rende all'utente comune le cose facili, ma può creare problemi quando si cerca un contenuto per cui è determinante l'utilizzo delle maiuscole (ad esempio un titolo di un film)
Google indicizza i contenuti dei file Macromedia
Flash, limitando però l'analisi ai LINK (get_url) escludendo i testi all'interno, che siano statici o dinamici.

GOOGLE SITEMAPS

Nelle parole di Google stesso, Sitemaps è un esperimento che si prefigge di indicizzare e catalogare più agevolmente e velocemente le risorse presenti sul web tramite l'utilizzo di file in XML. Il servizio prevede tre fasi: 1. Creazione di una mappa del sito secondo uno standard prefissato -vedi GENERATORE GOOGLE SITEMAP IN PHP presente nella sezione GOODIES 2. L' apertura di un account gratuito presso SITEMAPS DI GOOGLE 3. L'aggiornamento della mappa del proprio sito e la segnalazione a Google del nuovo file.

Sitemaps potrebbe essere una risposta concreta a tutti i webmaster che per vari motivi verificano scarso (o nullo) passaggio degli spider nelle proprie pagine web. Tuttavia, come chiaramente specificato da Google, la creazione di una mappa compatibile con il servizio Sitemaps NON HA INFLUENZA sul posizionamento nelle Serp. Pertanto ogni riferimento a questo servizio sperimentale, almeno in questa guida, termina qui.

Se prossimamente dovessimo verificare che una creazione di una mappa in formato XML compatibile ha invece grandi vantaggi nel ranking su Google, sarò ben lieto di dedicarci un'intera e dedicata sezione.

GOOGLEPLEX

Googleplex altro non è che l'edificio in cui ci sono gli uffici dello staff di Google.
Esso è situato a Mountain View, California, molto vicino al Parco Shoreline.

googleplex

Per trovare il Googleplex utilizzando GOOGLE EARTH , usa le seguenti coordinate:
Longitude: -122.0840472573312
Latitude: 37.42198291064995
Oppure scarica il file GOOGLEPLEX (richiede Google Earth installato sul tuo computer)

IL CONTROVERSO BREVETTO "20050071741" DEL MARZO 2005.

Da molti acclamato come un contenitore prezioso di segreti dell'algoritmo di Google, e nella precedente edizione esageratamente sottovalutato, è una valida introduzione a strumenti quali il calcolo della Click thru ratio, utilizzati o utilizzabili da Google nella valutazione dei documenti nell'archivio.
LEGGILO nell'apposita sezione.

La presente GUIDA AL POSIZIONAMENTO SU GOOGLE conterrà inoltre moltissimi altri riferimenti a brevetti attualmente implementati, come ad esempio HILLTOP o il discusso TRUSTRANK , buon proseguimento nella lettura.

 

RISORSE ESTERNE, REFERENCE

THE GOOGLE FILE SYSTEM
THE GOOGLE (CLUSTER) ARCHITECTURE

CARATTERISTICHE E FUNZIONI SPECIALI DI GOOGLE
GOOGLE SITEMAPS FREQUENTLY ASKED QUESTIONS (ITALIANO)

PAGINA INIZIALE - COVER

INTRODUZIONE ALLA GUIDA

FUNZIONAMENTO DI GOOGLE™

CARATTERISTICHE GENERALI
LISTA DATA CENTER
PREVENZIONE SPAM
LA SANDBOX DI GOOGLE
STEMMING E APPROCCIO LINGUISTICO

ANALISI DI PROGETTO

STRUTTURA DEL SITO

COSTRUZIONE DELLE PAGINE

TITLE TAG
META TAG
BODY
BODY CONTENT

STRUTTURA HTML
ATTRIBUTO ALT DELLE IMMAGINI

COLLEGAMENTI IPERTESTUALI
DENSITA' DELLE PAROLE CHIAVE
SOVRAOTTIMIZZAZIONE

SITE NETWORKING

PAGERANK™

DESCRIZIONE
L'IMPORTANZA DELLE DIRECTORY
PAGERANK IN VENDITA?

AGGIORNAMENTO DEL DATABASE DI GOOGLE™
SUGGERIMENTI PER LA LINK POPULARITY

GOODIES

GLOSSARIO
SEO: COMPETENZE, STRUMENTI, SOFTWARE

TUTELA LEGALE DEI PROPRI CONTENUTI

GENERATORE GOOGLE SITEMAP

© 2002/2006 GOOGLERANK.COM (FEAR MANIFESTO ITALIA ) TUTTI I DIRITTI RISERVATI| CONTATTI | PRIVACY POLICY