Bing vs Bard, la “AI war” è appena cominciata



immagine realizzata con DALL-E

Cresce la competizione nel settore dell’intelligenza artificiale, sull’onda del successo di ChatGPT. Questa settimana è andato in scena un vero e proprio botta e risposta tra Google e Microsoft: lunedì il primo ha lanciato (o meglio annunciato) il proprio servizio di IA “conversazionale”, chiamato Bard, mentre martedì Microsoft ha organizzato una conferenza di presentazione delle integrazioni di ChatGPT con il proprio motore di ricerca Bing. Evento cui Google ha risposto il giorno seguente, con una tempestiva conferenza parigina. A dire il vero, nessuno dei due servizi è attualmente utilizzabile dagli utenti finali e, sullo sfondo di un crescente dibattito (al momento ricco di congetture) sulle nuove applicazioni ed i relativi modelli di business, la nuova competizione nel campo dell’AI sembra aprire scenari ancora tutti da scrivere.

Lunedì: l’annuncio di Bard, il nuovo servizio di Google

Il botta e risposta è iniziato lunedì, con l’annuncio del lancio di Bard effettuato direttamente da Sundar Pichai tramite un post: il Ceo ha illustrato i risultati raggiunti dal team di ricerca di Google e la loro trasformazione in un prodotto “al servizio delle persone”. Le funzionalità linguistiche e conversazionali di nuova generazione, sviluppate grazie al Language Model for Dialogue Applications (LaMDA) di Google, sono confluite in questo nuovo “servizio sperimentale di intelligenza artificiale conversazionale” (Bard, appunto), il cui scopo consiste nel combinare la conoscenza mondiale con “la potenza, l’intelligenza e la creatività” dei modelli linguistici di grandi dimensioni. In pratica, l’intelligenza artificiale conversazionale verrà applicata alla ricerca di informazioni provenienti dal web, per fornire risposte creative e di alta qualità.
La mossa di Google sembrerebbe particolarmente azzeccata, poiché la nuova arrivata ChatGTP, allo stato attuale, sembrava presentare dei limiti piuttosto evidenti in termini di aggiornamento delle informazioni fornite e pubblicazione delle fonti utilizzate (ne avevamo parlato qui).

Il livello di interazione e la timeline di Bard

Sebbene molti ne abbiano parlato, la realtà è che il nuovo servizio non è ancora stato rilasciato pubblicamente. La timeline indicata da Pichar prevede di rilasciare la nuova applicazione in una versione lite di LaMDA – che richiede una potenza di calcolo significativamente inferiore – per raggiungere un maggior numero di utenti e ottenere un maggior numero di feedback. Lo scopo è combinare i feedback esterni con i test interni per assicurarsi che le risposte rese da Bard soddisfino gli elevati standard di qualità, sicurezza e fondatezza che Google garantisce con il suo servizio core. Nel dettaglio, per testare la nuova Generative Language API verranno progressivamente coinvolti sviluppatori, creatori e aziende a partire da marzo.
Nel suo post, Pichai ha sottolineato l’importanza dell’AI per sintetizzare le “intuizioni” rispetto alle domande per le quali non esiste un’unica risposta esatta, ma che richiedono l’analisi di informazioni complesse e prospettive multiple, allo scopo di fornire agli utenti elaborazioni chiare e sintetiche, capaci di far comprendere rapidamente il quadro generale e di estrarre più valore dalle informazioni presenti sul web. Inoltre, il Ceo ha sottolineato l’impegno di Google a sviluppare l’IA in modo “responsabile”. Motivo per cui, evidentemente, l’azienda preferisce effettuare ulteriori test prima di andare sul mercato col rischio di fornire risposte non completamente soddisfacenti (LinkedIn già abbonda di screenshot di risposte senza senso o palesemente errate fornite da ChatGPT).

Martedì: la presentazione di Bing potenziato con ChatGPT

L’evento di Microsoft – che nonostante lo scarso preavviso è riuscito a raccogliere oltre 70 giornalisti – è stato aperto dal ceo Satya Nadella, secondo cui “questa nuova tecnologia rimodellerà praticamente ogni categoria di software”. La presentazione del tool vero e proprio è stata svolta da Yusuf Mehdi, Corporate Vice President & Consumer Chief Marketing Officer, che ha spiegato come il nuovo Bing si baserà su un modello di ChatGPT più avanzato e customizzato per la ricerca. Nel complesso, il motore di ricerca Bing sta ricevendo un grande aggiornamento che consente di chattare con esso per ottenere risposte più dettagliate alle query di ricerca, una funzione che effettivamente sembrerebbe un passo avanti rispetto a ChatGPT, la quale rimaneva aggiornata al 2021.
In particolare, le nuova funzionalità integrano la ricerca “tradizionale” (ovvero la fornitura di link e snippet descrittivi dei link) con un form di chat laterale che consente l’inserimento fino a mille caratteri, in una modalità molto simile a quella di ChatGPT. Questa consente un’interazione molto più simile a quella umana, e sembra effettivamente svolgere parte del lavoro “intellettuale” che ancora oggi gli utenti compiono autonomamente durante il processo di ricerca sul web.
Al momento, le nuove funzioni appaiono sviluppate in particolare lungo 7/8 direttrici:
– le comparazioni, ad esempio di pittori (con le relative caratteristiche stilistiche) o prodotti di mercato (con pro e contro, anche rispetto a richieste abbastanza specifiche) e relative fonti;
– la ricerca di eventi rispetto ad un certo tema (nella conferenza sono stati mostrati tutti gli eventi identificati dall’intelligenza artificiale nella Super Bowl week);
– la realizzazione di calcoli o correlazioni (ad esempio se è possibile trasportare un armadio Ikea Klippan nel portabagagli di una Honda Odyssey del 2019 abbassando i sedili, domanda cui l’Ai ha risposto effettuando stime impacchettate dentro risposte rese in un linguaggio particolarmente user-friendly);
– la chat “generalista”, che consente di inserire prompt (ovvero richieste) fino a 2000 caratteri per rispondere a domande per le quali non esiste una risposta precisa (peraltro una funzione analoga a quella evidenziata da Pichai), e che in qualche modo comprende anche le funzioni seguenti;
– la pianificazione, ad esempio di viaggi, inclusi budget, percorsi, cose da fare e da vedere, rispetto a determinati budget, lassi di tempo ect;
– la scrittura creativa o il supporto ad essa, ad esempio nella scrittura di mail o di post per i social, quest’ultima con tanto di impostazione relativa al “tono” del messaggio (tra professional, casual, enthusiastic, informational and funny) e la creazione di quiz;
– l’analisi di documenti e la realizzazione di elaborazione, comparazione e sintesi delle informazioni chiave, inclusa la compilazione di tabelle comparative con dette informazioni chiave, nonché l’analisi e la scrittura di codice (e la relativa traduzione in linguaggi di programmazione diversi).
Come si nota, le funzioni sono così innovative che non esiste al momento una classificazione unitaria delle nuove potenzialità. Secondo quanto dichiarato sul sito di Microsoft, per accedere alla versione completa del nuovo servizio gli utenti dovrebbero prenotare un posto nella lista d’attesa e ricevere un numero limitato di query di ricerca, almeno nel periodo iniziale. Il servizio dovrebbe essere disponibile nelle prossime settimane. Noi siamo in lista d’attesa da mercoledì ma ad oggi (venerdì ndr) il sistema rende solo le risposte relative agli esempi già mostrati nella presentazione di Redmond.

Mercoledì: la conferenza di Google a Parigi

Il giorno successivo alla conferenza di Microsoft, il senior vicepresident di Google Prabhakar Raghavan e il vicepresidente di Google Search Liz Reid si sono alternati nella cornice della capitale francese, mostrando una serie di prodotti dotati del nuovo “multisearch”, il quale include:

  • una funzione di ricerca visiva basata sull’intelligenza artificiale di Google Lens che consente agli utenti di cercare scattando una foto e descrivendo ciò che vorrebbero trovare
  • una funzione ” Immersive View ” di Google Maps che consente un fly-through 3D delle principali città
  • una nuova versione di Google Translate.

Raghavan ha spiegato alcune caratteristiche di Bard, senza però fornire ulteriori dettagli “innovativi”, annunciando che il nuovo servizio verrà aperto ad alcuni trusted tester nel corso di questa settimana e confermando quindi la linea che prevede di assicurarsi il raggiungimento di elevati standard di qualità e sicurezza prima di allargare il servizio ad audience più ampie.

Nella stessa giornata di mercoledì, la Reuters ha individuato un errore nel video promozionale creato da Google per il lancio di Bard. In particolare, è stato scoperto che una delle informazioni fornite dalla nuova app rispetto al telescopio James Webb non era corretta (fenomeno piuttosto frequente con ChatGTP e in generale con le nuove tecnologie di AI generativa). Il combinato disposto dei rumors sulle potenzialità del nuovo Bing e l’errore di Bard hanno determinato un calo delle azioni di Google fino al 9%, a riprova di come stia crescendo l’attenzione sulla contesa in atto, oltre che dell’estrema volatilità della fiducia degli investitori nel settore hitech.

I nodi aperti e gli scenari futuri

Le nuove applicazioni di intelligenza artificiale, portate all’attenzione del grande pubblico da ChatGPT, stanno dimostrando effettivamente di avere funzionalità sorprendenti. E’ quindi verosimile che chi riuscirà a sfruttarle al meglio avrà la possibilità di disegnare nuovi confini nelle modalità di fruizione delle tecnologie digitali che si sono consolidate nel corso degli ultimi 15 anni (ad es. nel search e nei software da ufficio).
Tuttavia, come noto, il successo delle innovazioni a livello mainstream si basa sull’incontro favorevole tra una molteplicità di fattori chiave, e qui le difficoltà da superare appaiono ancora molteplici. Tra questi c’è senza dubbio l’aspetto tecnologico: allo stato attuale, gli algoritmi generativi presentano ancora alcuni problemi rispetto alla veridicità delle informazioni fornite. Secondo Kevin Scott, Chief Technology Officer di Microsoft, molti di questi errori sono dovuti al tentativo di questi modelli “di riempire gli spazi vuoti” rispetto a fatti su cui non sono stati addestrati. Alcune soluzioni includono il recepimento di feedback degli esseri umani rispetto a fonti e informazioni affidabili, l’utilizzo di memorie di sistema per consentire agli algoritmi di apprendere dalle conversazioni e la pubblicazione dei collegamenti alle fonti utilizzate dall’AI per generare le risposte (a nostro avviso la più grande lacuna di ChatGPT).
In secondo luogo, il nuovo paradigma generativo è (al momento) altamente più costoso di quello utilizzato dalla funzione search di Google: secondo Brian Nowak di Morgan Stanley, il costo di una query di ChatGPT costa circa 2 centesimi di dollaro, fino a 7 volte di più rispetto ad una effettuata sul motore di Google. Inoltre, non tutte le ricerche generano profitti (sebbene esistano anche le pubblicità pagate per “impressioni”, ovvero non per click ma per il solo fatto di essere mostrate). Ad esempio, Google ha affermato che circa l’80% dei suoi risultati di ricerca non contiene, nella pagina che mostra i risultati, annunci che generano profitti. Per rendere profittevole la ricerca generativa occorrerà quindi trovare un nuovo business model che riesca a garantire risultati (e chat) di qualità introducendo nel contempo spazi promozionali sufficientemente redditizi (o creando altre forme di sostentamento). A tal proposito, si osserva come incorporare annunci in ciò che, a un utente, dovrebbe apparire come una normale conversazione, potrebbe essere meno facile del previsto. Ad esempio, posizionare gli “sponsor” nei primi posti della classifiche stilate dall’AI rispetto alle richieste dagli utenti su determinati prodotti potrebbe generare non pochi problemi in termini di credibilità (e di regolazione della concorrenza).

In terzo luogo, lo scenario competitivo si fa sempre più complesso. Se Google si trova di fronte ad una sorta di dilemma dell’innovatore, rimane indiscutibilmente il leader del mercato del search e appare intenzionato a vendere cara la pelle. D’altro canto, pochi oltre a Microsoft possono disporre di un’infrastruttura tecnologica tale da provare a sfidare Google su quel terreno (si pensi all’infrastruttura di ricerca, alla potenza di calcolo, ai sistemi di archiviazione dati e ai software per indicizzare il web). Nel frattempo anche l’azienda cinese Baidu, proprietaria dell’omonimo motore di ricerca, ha annunciato il lancio di Ernie, la risposta cinese a ChatGPT, previsto per marzo. In uno scenario che si fa sempre più competitivo non resta che vedere all’opera tutte queste nuove applicazioni. Nel frattempo, pur nell’attuale incertezza che circonda il settore, appare chiaro che per l’intelligenza artificiale questo sarà un anno chiave.

Direttore Area Digitale dell'Istituto per la Competitività (I-Com). Lorenzo Principali si occupa di economia dei media, servizi web e tlc. Ricercatore dal 2007, sino al 2012 ha collaborato con l’Istituto di Economia dei Media, svolgendo analisi e consulenze per i maggiori operatori nazionali e internazionali.

No posts to display