Cambia l’algoritmo: Big G riuscirà a comprendere meglio il linguaggio naturale e cambiare approccio senza scartare alcun elemento dalle frasi
Qualche esempio
In particolare, Big G sarà in grado di capire come e in che modo le diverse parole si riferiscono le une alle altre in una frase fornita come input. The Verge racconta che in un incontro con la stampa Google ha fornito il seguente esempio: “Can you get medicine for someone pharmacy?”. L’algoritmo è stato in grado di analizzare quella frase in modo diverso da quanto accadeva in passato: nel primo caso, secondo il vicepresidente Pandu Nayak, lo prendeva in carico trattandolo come una macedonia di parole estraendone le più importanti (in quell’esempio “medicine” e “pharmacy”) e sfornando risultati locali sulle farmacie. Nient’altro. Col nuovo sistema l’algoritmo è in grado di comprendere il contesto, o almeno di provarci, tenendo per esempio in considerazione quel “for someone” e capire così che la vera domanda è un’altra, e cioè riguarda la possibilità o meno di ritirare in farmacia dei farmaci per conto di altri. Di conseguenza, restituirà contenuti di maggiore valore. Tutta un’altra storia, in effetti.
Chi è Bert
Il nuovo algoritmo si basa su Bert, che significa “Bidirectional Encoder Representations from Transformers”. Per farla breve, il punto è proprio quello dell’esempio: il nuovo sistema prende in carico l’intera frase, senza spezzettarla, e in questo modo non si perde per strada elementi importanti della richiesta. Lo fa tramite un meccanismo di autoapprendimento attraverso il quale Google ha addestrato l’algoritmo anche tramite la sperimentazione su un corpus di frasi in inglese dalle quali ha rimosso il 15% delle parole. Una sorta di gigantesco “fill in the gaps” sul quale Bert si è fatto le ossa. E continuerà a farsele grazie alle ricerche degli utenti.
Si parte dagli Stati Uniti
Un altro esempio? Google ha proposto la frase “parking on a hill with no curb” in cui la parola “no” è evidentemente essenziale ma che di solito veniva costantemente scartata. La modifica, valutata a priori tramite una serie di test che hanno coinvolto anche una valutazione umana della qualità dei risultati, riguarderà appunto circa una ricerca su dieci a partire da quelle effettuate in inglese dagli Stati Uniti. Più avanti il ritocco arriverà anche nelle altre lingue. Ovviamente non tutte le ricerche saranno interessate dal nuovo algoritmo, che Google garantisce dovrebbe evitare ogni genere di pregiudizio, perché si tratta solo di uno dei tanti tasselli che compongono il misterioso sistema di classificazione dei risultati che rimane in gran parte segreto.
Pubblicato il 10 Dicembre 2019