Google ha lanciato Gemini 3 Deep Think, un servizio di intelligenza artificiale avanzata per compiti scientifici che continua a “regolare” le risposte in base alle richieste.
Google ha presentato la versione aggiornata di Gemini 3 Deep Think
L’azienda Google ha annunciato un nuovo grande aggiornamento della sua piattaforma Gemini 3 Deep Think – intelligenza artificiale capace di ragionare e risolvere compiti scientifici‑ingegneristici complessi.
Cosa è cambiato
Parametro Nuovo Come appare Scopo Passare dalla pura teoria all’applicazione pratica Risolvere problemi senza vincoli chiari, con dati incompleti Accesso Integrato nell’app Gemini Gli abbonati a Google AI Ultra possono usarlo, e tramite API – ingegneri e aziende (richiede domanda) Partner di sviluppo Ricercatori scientifici Lavoro collaborativo su compiti complessi
Indicatori di prestazione
Test Risultato Commento Esame Finale dell’Umanità 48,4 % Senza strumenti esterni ARC‑AGI‑284,6 % Benchmark per assistenti AI Codeforces (Elo) 3455 Alto punteggio tra soluzioni software IMO 2025 Medaglia d’oro Equivalente al livello dei partecipanti olimpici internazionali Chimica/Fisica Stesso risultato Dimostrato versatilità in diverse discipline CMT‑Benchmark (fisica teorica) 50,5 % Buona padronanza di concetti complessi
Agente AI “Aletheia”
Nel laboratorio DeepMind di Google è stato creato l’agente Aletheia basato su Gemini 3 Deep Think. Caratteristiche chiave:
1. Verifica delle ipotesi – l’agente individua debolezze nelle soluzioni proposte e le corregge iterativamente.
2. Riconoscimento dell’incertezza – può comunicare di non conoscere la risposta.
3. Interazione con fonti esterne – utilizza il servizio di ricerca Google e la navigazione web, ma evita di inventare link.
Livelli di raggiungimento
Google ha suddiviso i successi di Aletheia in cinque livelli:
Livello Descrizione Esempi 0 – “novità minima” Modalità completamente autonoma, tre problemi di P. Erdős risolti (primo livello) Tre problemi Erdős 1 – “minima novità” Un risultato aggiuntivo in modalità autonoma Quarto problema 2 – “adatto alla pubblicazione” Risultati sia autonomi che collaborativi con l’uomo, oltre a strumenti di supporto I compiti dati 3–4 – “avanzo significativo/di rilievo” Non ancora raggiunti—
Come Aletheia affronta i problemi di Erdős
* Dalle 700 questioni non risolte finora, l’agente ha risolto 13.
* Tuttavia solo 4 sono davvero nuove – le altre sono già note nella comunità scientifica.
* Tra i 212 soluzioni presentate, solo il 6,5 % è stato sostanzialmente corretto; il 68,5 % conteneva errori fondamentali e il 31,5 % ha interpretato erroneamente la domanda.
Gli sviluppatori notano che l’IA tende a “reinterpreta la domanda in modo da fornire una risposta più semplice”, ed è “estremamente suscettibile agli errori rispetto agli umani”. Di conseguenza, al momento non è possibile sostituire i matematici con intelligenza artificiale.
In sintesi: Gemini 3 Deep Think e il suo agente Aletheia dimostrano risultati impressionanti in vari campi scientifici, ma mantengono ancora limitazioni significative di precisione e affidabilità delle soluzioni. Google continua a lavorare sul miglioramento della capacità dell’IA di ragionare profondamente e verificare le proprie conclusioni.
Commenti (0)
Condividi la tua opinione — per favore, sii cortese e resta in tema.
Accedi per commentare