Google ha lanciato Gemini 3 Deep Think, un servizio di intelligenza artificiale avanzata per compiti scientifici che continua a “regolare” le risposte in base alle richieste.

Google ha lanciato Gemini 3 Deep Think, un servizio di intelligenza artificiale avanzata per compiti scientifici che continua a “regolare” le risposte in base alle richieste.

4 software

Google ha presentato la versione aggiornata di Gemini 3 Deep Think

L’azienda Google ha annunciato un nuovo grande aggiornamento della sua piattaforma Gemini 3 Deep Think – intelligenza artificiale capace di ragionare e risolvere compiti scientifici‑ingegneristici complessi.

Cosa è cambiato
Parametro Nuovo Come appare Scopo Passare dalla pura teoria all’applicazione pratica Risolvere problemi senza vincoli chiari, con dati incompleti Accesso Integrato nell’app Gemini Gli abbonati a Google AI Ultra possono usarlo, e tramite API – ingegneri e aziende (richiede domanda) Partner di sviluppo Ricercatori scientifici Lavoro collaborativo su compiti complessi

Indicatori di prestazione
Test Risultato Commento Esame Finale dell’Umanità 48,4 % Senza strumenti esterni ARC‑AGI‑284,6 % Benchmark per assistenti AI Codeforces (Elo) 3455 Alto punteggio tra soluzioni software IMO 2025 Medaglia d’oro Equivalente al livello dei partecipanti olimpici internazionali Chimica/Fisica Stesso risultato Dimostrato versatilità in diverse discipline CMT‑Benchmark (fisica teorica) 50,5 % Buona padronanza di concetti complessi

Agente AI “Aletheia”
Nel laboratorio DeepMind di Google è stato creato l’agente Aletheia basato su Gemini 3 Deep Think. Caratteristiche chiave:

1. Verifica delle ipotesi – l’agente individua debolezze nelle soluzioni proposte e le corregge iterativamente.

2. Riconoscimento dell’incertezza – può comunicare di non conoscere la risposta.

3. Interazione con fonti esterne – utilizza il servizio di ricerca Google e la navigazione web, ma evita di inventare link.

Livelli di raggiungimento
Google ha suddiviso i successi di Aletheia in cinque livelli:

Livello Descrizione Esempi 0 – “novità minima” Modalità completamente autonoma, tre problemi di P. Erdős risolti (primo livello) Tre problemi Erdős 1 – “minima novità” Un risultato aggiuntivo in modalità autonoma Quarto problema 2 – “adatto alla pubblicazione” Risultati sia autonomi che collaborativi con l’uomo, oltre a strumenti di supporto I compiti dati 3–4 – “avanzo significativo/di rilievo” Non ancora raggiunti—

Come Aletheia affronta i problemi di Erdős
* Dalle 700 questioni non risolte finora, l’agente ha risolto 13.

* Tuttavia solo 4 sono davvero nuove – le altre sono già note nella comunità scientifica.

* Tra i 212 soluzioni presentate, solo il 6,5 % è stato sostanzialmente corretto; il 68,5 % conteneva errori fondamentali e il 31,5 % ha interpretato erroneamente la domanda.

Gli sviluppatori notano che l’IA tende a “reinterpreta la domanda in modo da fornire una risposta più semplice”, ed è “estremamente suscettibile agli errori rispetto agli umani”. Di conseguenza, al momento non è possibile sostituire i matematici con intelligenza artificiale.

In sintesi: Gemini 3 Deep Think e il suo agente Aletheia dimostrano risultati impressionanti in vari campi scientifici, ma mantengono ancora limitazioni significative di precisione e affidabilità delle soluzioni. Google continua a lavorare sul miglioramento della capacità dell’IA di ragionare profondamente e verificare le proprie conclusioni.

Commenti (0)

Condividi la tua opinione — per favore, sii cortese e resta in tema.

Non ci sono ancora commenti. Lascia un commento e condividi la tua opinione!

Per lasciare un commento, accedi.

Accedi per commentare