I motori di ricerca sono destinati a cambiare, e a migliorare in qualità, ispirandosi al modo in cui ragiona il nostro cervello, ovvero sfruttando le potenzialità dell’Intelligenza Artificiale (AI). È la scommessa di Cortical.io, startup con sede a Vienna che ha deciso di fare dell’Intelligenza Artificiale la sua arma per cercare di scalzare il monopolio di pochi colossi come Google ma anche, in seconda battuta, Yahoo e Bing. “Se non hai una soluzione migliore di Google – dice il Ceo e co-founder Francisco De Sousa Webber – non ce la fai a competere con il colosso californiano. È la ragione per la quale ci sono pochissime startup in questo campo. L’unica strada è offrire qualcosa di diverso. Per esempio usare l’Intelligenza Artificiale per fornire risultati di ricerca non più basati solo sulla quantità di parole chiave contenute in un testo, ma sulla comprensione del testo stesso”.
Periodicamente salta fuori qualche startup nata in Europa e sbandierata come l’anti-Google. Puntualmente la società non si rivela all’altezza delle aspettative e non è raro che svanisca nel nulla dopo aver bruciato tutti i fondi a propria disposizione. Ma De Sousa Webber è convinto che, cambiando approccio, anche il search cambierà. E sarà addirittura di livello qualitativo superiore a quello dei “monopolisti”. Naturalmente questa startup non è la sola a sperimentare un approccio innovativo nel search . Ma è una case history per spiegare come si può utilizzare l’Intelligenza Artificiale nei motori di ricerca e quindi come la tecnologia può trasformare radicalmente il digital marketing, oltre a sottolineare il legame che si sta creando tra neuroscienze e applicazioni tecnologiche.
Cos’è l’Intelligenza Artificiale
Cosa fa Cortical.io – Fondata a Vienna nel 2011 da Daniel Schreiber e Francisco De Sousa Webber, ha raccolto finora 6,18 milioni di dollari da quattro investitori. Ha uffici a Vienna e San Francisco. Propone soluzioni di Natural Language Understanding (NLU) basate sul Semantic Folding, una teoria che apre una prospettiva fondamentalmente nuova nell’uso dei Big Data. Basandosi su questa teoria, ha sviluppato il Retina Engine, una piattaforma che converte il linguaggio in “semantic fingerprints”, “impronte digitali semantiche”.
Si tratta di una rappresentazione numerica – concretamente un quadrato di dimensioni 128X128 composto da pixel – che cattura il significato esplicito di una porzione di testo e lo processa in via computazionale. Il Retina Engine confronta la relazione di natura semantica di due testi qualsiasi misurando le sovrapposizioni che emergono dalle loro rispettive fingerprints. Attraverso questa piattaforma è possibile processare qualsiasi tipo di testo, indipendentemente dal linguaggio o dalla lunghezza.
Come spiega un articolo de L’Economist, che l’ha citata tra le startup internazionali più innovative nel campo dell’Artificial Intelligence, Cortical ha estratto centinaia di articoli da Wikipedia, li ha frammentati in migliaia di piccoli “snippets” (porzioni) di informazione, dopodiché ha applicato a questi snippets un algoritmo di machine learning che richiedeva al computer di individuare dei “pattern”, cioè degli schemi. Questi pattern sono stati successivamente rappresentati come “semantic fingerprints”, “impronte digitali semantiche”. Gruppi di pixel in luoghi simili rappresentano un’analogia semantica. Questo metodo può essere utilizzato per disambiguare parole con significati diversi.
Per esempio la parola “organo” è correlata sia a “fegato” (il fegato è un organo del corpo) sia a “piano” (l’organo suonato in chiesa). Se cerchiamo “organo” in un motore di ricerca standard, è possibile ottenere risultati non attinenti all’obiettivo della ricerca. Il nostro sistema di linguaggio naturale è invece portato a capire se stiamo parlando di una parte del corpo o di uno strumento musicale in base a una serie di processi cognitivi. È quello che fa Cortical: si ispira al funzionamento del cervello umano. La startup è nata grazie a fondi pubblici ed ha raccolto finora 6,5 milioni di euro.
Il search come è – “L’attuale sistema di ricerca – spiega il co-founder e Ceo Francisco De Sousa Webber – non capisce cosa è scritto nel documento, ma individua quali sono le parole chiave, quanto frequentemente sono citate e la probabilità di rilevanza di quelle parole. Questo, però, funziona fino a un certo punto. Non funziona, per esempio, se ci sono troppi documenti o documenti molto simili tra loro. Un caso per tutti: i documenti legali. Sono quei tipi di testi dove si usano sempre le stesse parole. Al momento della ricerca di una key word, il search tenderà a puntare su quei documenti. Inoltre Internet è cresciuto a tal punto che ci sono centinaia di miliardi di parole là fuori e ne possono scaturire tutte le possibilità di search, ma il 20% dei documenti non uscirà mai nei risultati. E il problema diventerà sempre più grande”.
Secondo De Sousa Webber, Google è consapevole di questo blind spot, così ha avviato funzionalità di hard coding. “Google è utile – prosegue – perché legge le key words, indovina a cosa è interessato l’utente e dirige la ricerca. Ma non è ancora una soluzione basata sulla comprensione di quello che il testo significa. Google ha centinaia di persone focalizzate su questo. Ma, per esempio, gli studi legali hanno necessità di ricerche interne sui propri documenti e quindi di soluzioni ad hoc. Hanno provato con il deep learning o il machine learning, sono diventati più bravi sulle statistiche, ma non hanno ottenuto sostanziosi cambiamenti. È un representational problem: se sai come rappresentare un problema, allora puoi trovare in cosa consiste il problema”.
Il search come può diventare – Per questa varietà di ragioni, la strada che sta seguendo Cortical è fare un search più semantico. “Abbiamo lasciato da parte l’informatica – spiega il co-founder – e abbiamo deciso di creare un algoritmo che rappresenti il cervello umano. È così emerso il concetto di semantic fingerprint. Abbiamo scelto di scandagliare centinaia di articoli da Wikipedia perché è una fonte generalista che tratta di tutto, da Enrico VIII fino a quante vitamine ci sono nei cornflakes, ma potevamo scegliere anche una collezione di testi di medicina. Un essere umano, per esempio uno studente di medicina, è in grado di leggere centinaia di libri legati alla sua professione, e deve farlo con estrema attenzione. Il nostro sistema è come se ne leggesse un milione in un brevissimo arco di tempo. Al cliente chiediamo basilarmente qual è il linguaggio che usa nei domini, raccogliamo il materiale e addestriamo il semantic space, il cervello del nostro sistema”.
La teoria del “nuovo search” – Cortical.io si basa sulle teorie di un imprenditore innovatore e visionario, Jeffrey Hawkins. Nato nel 1957, ha fondato Palm Computing, società specializzata nella produzione di assistenti digitali personali (personal digital assistants, Pdas), dando vita a PalmPilot, un Pda acquisito nel 2010 da Hewlett-Packard per circa 1,2 miliardi di dollari. Ha anche co-fondato Handspring, società che ha creato l’assistente digitale personale chiamato Treo. Dopo l’esperienza come imprenditore, Jeffrey Hawkins ha deciso di dedicarsi a tempo pieno alle neuroscienze.
Nel 2002 ha fondato il Redwood Center for Theoretical Neuroscience, nel 2004 ha pubblicato il libro “On Intelligence”, che descrive la sua teoria dello schema di memoria predittiva del cervello, e nel 2005 ha fondato la società Numenta. Hawkins sta cercando di capire come funziona davvero il cervello umano e di adattare il suo metodo per la creazione di nuovi sistemi e strumenti informatici. Hawkins ha un duplice obiettivo: capire come funziona davvero il cervello umano e sviluppare un software in grado di imitarne le funzionalità, creando così una autentica intelligenza artificiale. “Mi sono recato in Silicon Valley per incontrare Jeff Hawkings – dice De Sousa Webber – gli ho mostrato il mio lavoro ed è rimasto molto interessato. Così ha cominciato a lavorare con noi e 2 anni fa è diventato un nostro partner acquisendo una piccola quota della società in cambio della licenza per utilizzare il suo metodo detenuta dalla società. In pratica siamo sulle spalle di un gigante”.
Applicazioni pratiche
Banche – Cortical.io ha più di una cinquantina di clienti, in primis banche, assicurazioni e studi legali. Per una grande banca di New York si occupa di scovare dipendenti che fanno insider trading (sfruttamento di informazioni non di dominio pubblico per effettuare operazioni in Borsa traendo vantaggio dalla loro conoscenza anticipata). “Attraverso il nostro motore di ricerca scandagliamo tutte le email spedite e ricevute – spiega lo startupper – ma se qualcuno usa metafore o parole particolari per non far capire di cosa sta scrivendo è un problema individuare il tentativo criminoso. In questo caso cercare le keywords non senso. Le nostre fingerprints invece hanno funzionato e hanno dato risultati migliori di alcuni colossi informatici utilizzati allo stesso scopo dalla banca negli anni precedenti”. Altra soluzione richiesta dalle banche è il customer support per i call center.
Ogni volta che vengono inviate somme di denaro da una banca all’altra, parte dei messaggi vengono processati automaticamente. Ma la banca che invia il trasferimento può allegare delle note che finora venivano lette da essere umani. Si tratta di un numero sostanzioso di transizioni al giorno. Il sistema di Cortical.io ne permette la lettura in automatico. L’Intelligenza Artificiale può essere usata anche nel campo dei contratti: è necessario analizzare i contratti per verificare se ci sono trappole o rischi.
Un sistema di AI è in grado di scandagliarli. È l’attività centrale di un’altra startup, Law Geex, la seconda più finanziata al mondo nel settore dell’Artificial Intelligence. Israeliana, ha sviluppato un software per l’analisi dei contratti: chi sta per firmare un contratto per un nuovo impiego, o un contratto di acquisto o locazione di un immobile, può inserirlo nella piattaforma. Attraverso l’utilizzo dell’intelligenza artificiale il sistema è in grado, in sole 24 ore, di individuare clausole insolite, problematiche o mancanti e di fornire benchmark statistici per semplificare la decisione da prendere.
Assicurazioni – Un altro cliente di Cortical.io è una delle principali compagnie assicurative tedesche. La startup è in grado di monitorare le news quotidiane per identificare una determinata situazione e lanciare un early warning alla società, che poi verificherà se ci sono le condizioni per attivarsi. In altre parole: se dal search sulle notizie emerge che sta scoppiando un incendio in un distretto di Detroit, la startup avvisa la società assicurativa, che potrà in questo modo muoversi prima dei competitor.
Automotive – Cortical.io, così come altre startup e società di AI, sono attive anche nell’automotive, per esempio nelle speech interfaces. Sono stati realizzati notevoli miglioramenti nel campo della trascrizione automatica, ma il meccanismo può essere perfezionato se è in grado di “capire” di cosa parla il testo.
Davvero si può fare concorrenza a Google dall’Europa? “In Silicon Valley – conclude lo startupper – hanno la sindrome del non inventend-here: non l’abbiamo inventato noi, quindi non può funzionare. Inoltre in Europa c’è un ecosistema molto più limitato e gran parte dei fondi sono pubblici. Ma Cortical è potuta nascere in Europa perché abbiamo una tradizione di fundamental research, invece in Usa si fa maggiormente ricerca applicata”.
Devi effettuare l'accesso per postare un commento.