Brain: guida di sopravvivenza

Google RankBrain

Di A.J. Kohn

articolo orginale:

Brain Survival Guide
9 Giugno 2016

Questa è una guida per sopravvivere al RankBrain. Il motivo per cui l’ho fatta, in parte, è perché c’è una mole impressionante di disinformazione sul RankBrain. E la verità è che non c’è niente che potete fare per ottimizzare per il RankBrain.

Non sto dicendo RankBrain non sia interessante o importante. Mi piace conoscere come funziona la ricerca, sia che questo mi aiuti nel mio lavoro, o meno. Quello che voglio dire è che non ci sono tattiche da impiegare, basate sulla nostra comprensione del RankBrain.

Quindi, se siete alla ricerca di strategie di ottimizzazione, dovreste guardarvi dal contenuto acchiappa-click per il RankBrain, che viene pompato da operatori inaffidabili e da inserzionisti affamati di visualizzazioni.

Non è possibile ottimizzare Per il RankBrain

img1

Inizierò con questa semplice affermazione, per assicurarmi che il maggior numero di persone possibile, legga, comprenda e conservi nella mente, questo fatto.

Non si può ottimizzare per il RankBrain.

Leggerete un sacco di post che dicono il contrario; a volte hanno semplicemente torto senza mezzi termini, a volte usano il RankBrain come veicolo per perorare la causa delle “best practice” SEO, e a volte collegano dei puntini che non ci sono proprio.

Continuate a leggere se volete la prova che l’ottimizzazione per il RankBrain è una perdita di tempo e ci si dovrebbe invece concentrare su altre strategie e tattiche di gran lunga più efficaci.

Che cosa è il RankBrain?

Il RankBrain è un algoritmo di “apprendimento approfondito” (“deep learning” – n.d.t.) sviluppato da Google, per contribuire a migliorare i risultati della ricerca. L’apprendimento approfondito è una forma di apprendimento automatico della macchina e può essere classificata in una delle componenti dello spettro dell’Intelligenza Artificiale (AI).

Penso al Deep Learning come a una forma di apprendimento artificiale, in cui l’algoritmo è in grado di adattarsi e imparare da solo, senza un ulteriore intervento umano. Una delle manifestazioni più interessanti dell’apprendimento approfondito è stata l’identificazione dei gatti (tra le altre cose) nelle miniature dei video di YouTube (pdf).

Come funziona RankBrain?

Sapere come funziona RankBrain è importante perché determina se è possibile operare delle azioni di ottimizzazione o no. Nonostante quello che si potrebbe leggere, sul RankBrain ci sono poche fonti di informazioni valide.

Greg Corrado

Il primo è l’annuncio del RankBrain del 26 ottobre, di Bloomberg, che comprendeva le dichiarazioni e le sintesi di una chat con Greg Corrado, Senior Research Scientist di Google.

RankBrain utilizza l’intelligenza artificiale per associare grandi quantità di lingua scritta ad entità matematiche (chiamate vettori) che il computer è in grado di comprendere. Se il RankBrain vede una parola o una frase che non gli è familiare, la macchina può fare un’ipotesi su ciò quali parole o frasi potrebbero avere un significato simile e filtrare il risultato di conseguenza, il che la rende più efficace nel gestire query di ricerca mai incontrate prima.

Questo passo rende abbastanza chiaro che RankBrain utilizza i vettori per comprendere meglio il linguaggio complesso.

Word2Vec è il riferimento citato più spesso quando si parla di vettori. E va notato che Jeff Dean, Greg Corrado e molti altri hanno contribuito a questo lavoro. Questi nomi li vedrete spuntare molte volte quando si parla di apprendimento approfondito.

Ho scritto qualcosa riguardo ai vettori nel mio post su Hummingbird. In particolare mi piace questa citazione di Jeff Dean da un’intervista del 2013:

Credo che avremo anche una maggiore capacità di intervento sulla comprensione del testo. Si ne vedono i primi flebili barlumi nei vettori di parole e vorremmo arrivare al punto in cui abbiamo una maggiore comprensione, a un livello superiore delle semplici parole. Se potessimo arrivare al punto in cui si capiscono le frasi, avremmo davvero uno strumento piuttosto potente. Per cui, se due frasi significano la stessa cosa, ma sono scritte in modo molto diverso, e noi siamo in grado di accorgercene, allora avremmo uno strumento davvero molto potente. Perché allora hai un certo livello di comprensione del testo, infatti, puoi parafrasarlo.

Ero davvero incuriosito dall’idea che Google sapesse che due frasi diverse significassero la stessa cosa; in questa direzione hanno fatto una discreta quantità di progressi, con la ricerca sui vettori dei paragrafi (pdf).

img2

E’ difficile dire esattamente che tipo di analisi vettoriale utilizza RankBrain. Penso che non sbaglio dicendo che è una analisi di vettori a lunghezza variabile e non andare oltre.

Quindi, cos’altro abbiamo imparato dall’intervista di Corrado? Più avanti nel filmato, ci sono delle dichiarazioni su quanto Google fa affidamento su RankBrain.

Ha detto che il sistema aiuta Mountain View, la sede Californiana di Google, a trattare il 15 per cento delle query che ogni giorno riceve e che i suoi sistemi non hanno mai visto prima.

E’ piuttosto chiaro: RankBrain viene utilizzato principalmente per le query mai viste in precedenza da Google, anche se sembra probabile che la sua quota di intervento possa essere cresciuta a seguito del successo iniziale.

Purtroppo l’affermazione che segue ha causato un sacco di costernazione.

Corrado ha detto che RankBrain è una delle “centinaia” di segnali che finiscono in un algoritmo, che determina quali risultati vengono visualizzati in una pagina di ricerca di Google e ordinati per rilevanza. Nei pochi mesi da quando è stato rilasciato, RankBrain è diventato il terzo segnale più importante che contribuisce al risultato di una query di ricerca.

Questo ha provocato le reazioni fin troppo tipiche della comunità SEO. #theskyisfalling (catastrofe – n.d.t.)

Il fatto è che non sappiamo come Google misura “l’importanza”, né si capisce se vale solo per il 15 per cento delle query, o per tutte.

Andrey Lipattsev

Per sottolineare la pedita di tempo indotta dal ‘terzo segnale più importante’, abbiamo dichiarazioni di Andrey Lipattsev, senior strategist della qualità della ricerca di Google, in una seduta di domane e risposte con Ammon Johns e altri.

video

In breve, RankBrain potrebbe essere stato ‘chiamato’ in molte interrogazioni, ma può non avere materialmente influenzato i risultati.

Oppure, se volete andare sul tecnico, RankBrain potrebbe non aver causato un riordino dei risultati. Così “l’importanza” potrebbe essere stata misurata in termini di frequenza e non di impatto.

Più avanti nel video, vi accorgerete che RankBrain ha accesso a un sottoinsieme dei segnali, cosicché RankBrain funzionerebbe più come un meta-segnale. La sensazione è che stiamo comparando le mele con le arance.

Ma cosa ancora più importante, perché è importante? Cosa cambierete in quello che stata facendo, sapendo che è il terzo segnale più importante?

Gary Illyes

Un’altra fonte di informazioni sul RankBrain sono le dichiarazioni di Gary Illyes in una conversazione con Eric Enge. In particolare, Gary ha potuto fornire alcuni esempi di RankBrain in azione.

Voglio dire, se pensate per esempio a una query del tipo: “Si può raggiungere un punteggio del 100% su Super Mario, senza una spiegazione dettagliata del gioco?” Questa potrebbe essere una query reale che riceviamo. Lì c’è un termine negativo (“senza”) che è molto difficile da catturare con i normali sistemi che avevamo, e infatti i nostri vecchi parser delle query effettivamente ignoravano la parte della frase con il termine “senza”.

RankBrain fatto un lavoro incredibile nell’individuare il senso e nell’istruire i nostri sistemi di ricerca per fornire i risultati giusti.

Le dichiarazioni di Gary prestano un chiaro sostegno all’idea che RankBrain aiuti Google a comprendere meglio le query complesse in linguaggio naturale.

Paul Haahr

img3

Paul Haahr che parla al SMX West 2016

Forse le affermazioni più interessanti sul RankBrain sono quelle di Paul Haahr, un Ingegnere del Ranking di Google, all’SMX West, durante il suo intervento su come funziona Google: How Google Works: An Google Ranking Engineer’s Story e nella parte domande e risposte.

Ho avuto la fortuna di vedere questa presentazione dal vivo ed è forse lo scorcio migliore e più illuminante sulla ricerca di Google (a parte Scherzi, se non l’avete visto dovreste subito riconsegnare la vostra licenza SEO).

E’ nella parte delle domande e risposte, che Haahr discute del RankBrain.

RankBrain va a vedere un sottoinsieme dei segnali ed è un sistema di apprendimento automatico, o di apprendimento approfondito, che ha le sue idee su come combinare i segnali e intrepretare i documenti.

Crediamo di capire come funziona, ma non capiamo quello che sta facendo esattamente.

Utilizza un sacco di concetti che abbiamo pubblicato, sull’apprendimento approfondito. C’è un po’ di lavoro passa da Word2Vec o di word embedding (mappatura di un insieme di parole in un vettore – n.d.t.) che è uno degli strati di cui è composto RankBrain. In realtà si innesta alla fine del processo successivo al recupero dei documenti, che ho mostrato prima.

Danny chiede poi come RankBrain potrebbe funzionare per accertare la qualità o l’autorevolezza del documento.

Dipende tutto dai dati con cui è stato fatto il training del sistema. Non vede solo pagine web, ma vede le query e altri segnali in modo che possa giudicare in base a quel genere di cose.

Queste affermazioni sono di gran lunga le più importanti, perché forniscono una valanga di informazioni. In primo luogo Haahr afferma che RankBrain entra in gioco alla fine della fase successiva al recupero dei documenti.

Questa è una precisazione importante, perché significa che RankBrain non riscrive la query prima che Google vada in cerca dei risultati, ma invece agisce a valle.

Per cui Google recupera risultati utilizzando la query grezza, ma poi RankBrain potrebbe riscrivere la query o interpretarla in modo diverso, nel tentativo di selezionare e riordinare i risultati di quella query.

Inoltre, Haahr chiarisce che RankBrain ha accesso a un sottoinsieme di segnali e alla la query. Come ho già detto questo fa apparire RankBrain più come un meta-segnale, piuttosto che un segnale a se stante.

Ciò che non sappiamo sono i segnali precisi che compongono quel sottoinsieme. Molti prenderanno questa affermazione per teorizzare che utilizza i dati dei link, o dei clic, o un assortimento di segnali diversi. Il fatto è che non abbiamo idea di quali sono i segnali a cui RankBrain ha accesso, né con quale peso RankBrain potrebbe utilizzarli, o se vengono utilizzati in modo uniforme su tutte le query.

L’impossibilità di conoscere le variabili rende ogni tipo di analisi di regressione di RankBrain un’impresa fallita in partenza.

Naturalmente c’è anche la dichiarazione che non sanno che cosa RankBrain stia facendo. Questo perché RankBrain è un algoritmo di apprendimento profondo che esegue un apprendimento non supervisionato. Si crea da solo le proprie regole.

Più precisamente, se una ingegnere del ranking di Google non sa cosa sta facendo RankBrain, pensate che qualcuno al di fuori di Google, di colpo lo capisca meglio? La risposta è no.

Non è possibile ottimizzare Per RankBrain

img4

Non possiamo ottimizzare per RankBrain basandoci su ciò che sappiamo riguardo a cos’è e come funziona. In essenza, RankBrain riguarda una migliore comprensione del linguaggio, sia del contenuto dei documenti, che delle domande.

Quindi, cosa fareste di diverso in base a questa conoscenza?

Google sta analizzando le parole le, le frasi e i paragrafi e li trasforma in vettori matematici. Si sta cercando di assegnare significato a quella porzione di testo, per poter rispondere in modo più preciso alla sintassi delle interrogazioni complesse.

L’unica cosa che potete fare è migliorare la vostra scrittura in modo che Google possa meglio comprendere il significato dei contenuti. Ma che non è proprio l’ottimizzazione per RankBrain che sta solo facendo una corretta SEO e fornire una migliore esperienza utente (UX).

Migliorando il vostro modo di scrivere e rendendolo più chiaro, finirete per guadagnare più link e nel tempo, per essere visto come un’autorità su questo argomento. Quindi sarete a posto, indipendentemente da quali altri segnali RankBrain utilizzi.

L’unica cosa che non dovete fare è pensare che RankBrain capirà i vostri testi scritti male, o che adesso avete la licenza per scrivere in modo colloquiale molto spinto. Un solida stile di scrittura è più importante oggi di quanto non lo sia mai stato.

In sintesi

RankBrain è un algoritmo di apprendimento approfondito che si inserisce nella fase di successiva al recupero dei documenti e si basa su vettori di testo a lunghezza variabile e altri segnali, per interpretare meglio il senso di query complesse in linguaggio naturale. Anche se è affascinante, non c’è nulla che si può fare per ottimizzare specificamente per RankBrain.

A.J. KohnA.J. Kohn

Traduzione di

Stampa articolo in formato PDFScarica il file in formato PDF

Elenco Articoli di AJ Kohn

Post A Comment

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *