top of page

OpenAI GPT o1: quando l'AI si prende il tempo di pensare

Negli ultimi mesi, l'industria dell’AI è stata attraversata da un turbine di previsioni, rumor e decisioni inaspettate. Da dimisioni clamorose a novità strabilianti, l'aria era elettrica. Tuttavia, c'era una convinzione comune: le AI, fino ad oggi, non "ragionavano". Certo, erano in grado di rispondere a domande, ma senza riflettere davvero. Ebbene, sembra che qualcosa sia cambiato.


Midjourney che interpreta o1: il modello che si prende tempo per pensare

GPT o1, il nuovo modello di OpenAI, ha fatto un passo avanti verso quello che potremmo chiamare "pensiero". In pratica: mentre i modelli precedenti rispondevano istantaneamente alle domande, come farebbe chiunque di fronte a una richiesta incalzante, GPT o1 si prende il suo tempo, riflette. Non risponde subito. Prima di dare la sua risposta, crea un piano, valuta diverse strategie e solo dopo decide come rispondere. In breve, sembra avvicinarsi sempre di più al modo in cui ragioniamo noi umani.

Provo a raccontarvelo brevemente, sapendo che dovremo tornarci su e che in questa fase di hype un po’ di fumo negli occhi ce l’abbiamo tutti.


Un salto dalla fantascienza alla realtà

Tutto ciò, da appassionato lettore di fantascienza, mi porta a una riflessione : quanto velocemente stiamo passando dalle idee fantascientifiche alla scienza concreta? Pensiamo alle invenzioni che ci sembravano lontanissime, come il traduttore universale o il computer a comando vocale, e oggi le usiamo ogni giorno. Fino a qualche mese fa, l’idea di un "cervello positronico" sembrava solo un sogno, eppure oggi ci stiamo avvicinando a un modello AI che "pensa" per davvero.

In sostanza: si sta accorciando sempre di più il tempo tra l’idea e la sua realizzazione pratica, con un sacco di implicazioni in termini di investimento e di come vengono distribuiti i costi tra produttori di AI e i suoi utilizzatori.


E questo mi fa venire in mente un articolo di qualche tempo fa sul Technological Anticipation GAP.



Come funziona GPT o1?

Invece di rispondere immediatamente a una domanda come gli altri modelli, GPT o1 entra in una fase di riflessione interna. È come se si prendesse una pausa per riflettere su cosa fare.

Questi momenti di "pensiero" gli permettono di analizzare problemi complessi, simulando un processo di problem-solving più umano. Il risultato? Risposte più ponderate e accurate, specialmente per compiti che richiedono un’analisi approfondita.

La vecchia domanda dell’1+1 quindi diventa una cosa simile a questa, nella quale il sistema ‘pensa’ per 8 secondi e poi restituisce, con la Conclusione, la risposta ragionata che ci aspettavamo.


Un esperimento interessante è fare la stessa domanda in più lingue. Questo è quello che succede se glielo chiedo in italiano:


Questo è quello che succede se lo chiedo in inglese (Se qualcuno avesse ancora il dubbio dell'utilità prompt in inglese o in Italiano con GPT )



Caratteristiche principali di GPT o1

Ci sono un sacco di informazioni e notizie su dettagli di come funzioni (alla fine vi metto un po’ di list per comodità) ma le caratteristiche su cui vorrei fermarmi sono:

  • Capacità di ragionamento avanzato: ideale per compiti che richiedono pensiero lento e deliberato.

  • Tempo di riflessione: può "pensare" per secondi, e l’obiettivo è estendere questo tempo fino a minuti o ore. (Io sono riuscito a farlo arrivare a 122 secondi al massimo).

  • Prestazioni migliorate: supera i modelli precedenti in matematica, programmazione e scienze.

  • Token di ragionamento: introduce token speciali che permettono all'AI di riflettere su sé stessa e migliorare le risposte.


Token di ragionamento?

Per capire meglio cosa significa il "ragionamento" in GPT o1, immaginate di dover rispondere a una domanda complessa.

Il tempo di silenzio che dedicate a pensare alla risposta, nel quale magari scarabocchiate sul blocco note qualcosa per capire meglio il piano di risposta, è un tempo di ragionamento.

E a quel tempo vengono assegnati dei token diversi.


Clic qui se non sapete cosa sono i token


I "token di ragionamento" sono le unità che GPT o1 utilizza per calcolare e riflettere, diversamente dai normali "token di output" utilizzati per generare rapidamente delle risposte come ha fatto fino ad ora.

Riepilogo con aggiuntina tecnica:

  • Prima di o1: Il calcolo per l'inferenza scalava linearmente con la dimensione del modello.

  • Con o1: Il calcolo per l'inferenza scala esponenzialmente con il "tempo di pensiero".


Perché è importante?

Questo nuovo approccio permette a GPT o1 di risolvere problemi più complessi senza dover aumentare le sue dimensioni. Invece di diventare più grande e costoso da addestrare, GPT o1 dedica più tempo al ragionamento, offrendo risposte più sofisticate.


Quando utilizzarlo?

Task per cui o1 è superiore:

  1. Problemi matematici complessi: Risoluzione di equazioni avanzate o dimostrazioni matematiche.

  2. Analisi scientifica approfondita: Interpretazione di dati sperimentali o elaborazione di ipotesi scientifiche.

  3. Programmazione avanzata: Sviluppo di algoritmi complessi o debugging di codice sofisticato.

Task per cui non ha senso usare o1:

  1. Conversazione generale: Chiacchiere quotidiane o risposte a domande semplici.

  2. Generazione di contenuti creativi brevi: Scrittura di brevi testi o post sui social media.

  3. Ricerche rapide di informazioni: Ricerca di fatti semplici o dati facilmente accessibili.

In questi casi, modelli più veloci e meno costosi come GPT-4 sono più efficienti e adeguati.


Ma quanto costa pensare?

Una delle implicazioni più interessanti di GPT o1 è che il ragionamento ha un costo. qualche giorno fa si vociferava che l’attuale versione di GPT avrebbe avuto un 100x nei costi di esercizio.

Oggi abbiamo capito perché:

Prima, i costi computazionali erano tutti a carico del produttore dell'AI.

Con GPT o1, parte di questi costi si spostano sugli utenti. Il ragionamento richiede molta più potenza di calcolo.

Open AI per il momento ha deciso di fare solo 6x sui token di ragionamento; ma questo rende il reasoning un nuovo costo operativo che le aziende dovranno considerare attentamente.


Implicazioni per le organizzazioni

Come già visto in passato vale la regola che non c’è un vestito buono per tutte le stagioni: non esiste già più più un "modello universale" adatto a tutti i compiti. Come racconto nel libro dovremo dotarci di un ‘team di AI’.

Riguardo o1 sarà fondamentale valutare quando vale la pena utilizzarlo visti i suoi costi di ragionamento. Occhio agli sprechi!


Quindi…

O1 quindi significa:

  • Ragionamento avanzato: è il primo passo verso un'AI che prova a pensare come un essere umano.

  • Costi più alti: usare il ragionamento costa di più rispetto ai modelli tradizionali e richiede molte più risorse di calcolo.

  • Scelta del modello: Non è un modello di sostituzione dei precedenti ma di affiancamento: valutate attentamente quando usare gpt o1 rispetto a modelli più economici.

GPT o1 rappresenta un'evoluzione importante e interessante, tutta da scoprire, ma non è la soluzione per tutto.

Rimane fondamentale imparare a bilanciare i benefici del ragionamento avanzato con i costi associati.

Avere ora algoritmi in grado di pensare alza l’asticella della sfida sia verso i competitor di OpenAI (Anche se Claude già fa qualcosa di simile sui task più complessi… ma senza dichiararlo troppo) ma anche verso di noi che l’AI la usiamo.

Come nel mondo reale: a volte ha senso pagare di più per ottenere risposte migliori, ma a volte è meglio sentire pareri e ragionare da soli sulle decisioni da prendere.


A presto!

Max



 

P.s. Se volete approfondire un po’ a livello tecnico, economico, filosofico questi sono alcuni link interessanti che ho trovato più o meno a riguardo di o1.


Comments


bottom of page