L'IA ha mostrato bassa efficacia nelle scommesse sportive, perdendo tutti i soldi sulle partite della Premier League inglese.

L'IA ha mostrato bassa efficacia nelle scommesse sportive, perdendo tutti i soldi sulle partite della Premier League inglese.

2 hardware

Breve risultato dell’esperimento

Lo startup *General Reasoning* ha condotto un test chiamato KellyBench, in cui hanno valutato otto principali sistemi di IA (Google Gemini 3.1 Pro, OpenAI ChatGPT‑4, Anthropic Claude Opus 4.6, xAI Grok 4.20 e altri) sulla capacità di scommettere durante la stagione della Premier League inglese 2023–2024.

A ciascun agente è stato fornito un completo descrizione statistica di tutte le squadre e delle partite precedenti, ma l’accesso a Internet è vietato – i modelli potevano usare solo i dati ricevuti in anticipo.

Come si è svolto il test

1. Tre tentativi: ogni sistema poteva fare tre serie di scommesse per la stagione.

2. Scommesse: sui risultati delle partite (vittoria/pareggio/perdita) e sul numero di gol.

3. Obiettivo: massimizzare il profitto gestendo i rischi.

Chi ha vinto, chi ha perso

Sistema IARisultato medioNota
Anthropic Claude Opus 4.611 % (circa pareggio in un tentativo)Il partecipante più “onesto”, ma comunque ha perso denaro
Google Gemini 3.1 Pro+34 % al primo tentativo, poi fallitoInizialmente profitto, poi perdita
xAI Grok 4.20Fallito subito, non ha completato i due successiviIl più debole di tutti

Alla fine ogni modello ha perso denaro nella stagione, e alcuni è «fallito» completamente. Ciò conferma le conclusioni dei ricercatori: anche i sistemi IA più avanzati incontrano difficoltà con la previsione a lungo termine nel mondo reale.

Cosa significa per il futuro dell’IA

- Le preoccupazioni sul sostituzione dell’uomo sembrano ancora esagerate.
- I benchmark attuali spesso usano condizioni «statiche» che non riflettono l’chaos e la complessità della vita reale.
- Sebbene l’IA risolva con successo compiti come la scrittura di codice, nella maggior parte delle altre aree dell’attività umana rimane limitata.

Di conseguenza, l’esperimento KellyBench dimostra che l’IA non è ancora pronta a competere con l’uomo in compiti dinamici e imprevedibili, come le previsioni sportive.

Commenti (0)

Condividi la tua opinione — per favore, sii cortese e resta in tema.

Non ci sono ancora commenti. Lascia un commento e condividi la tua opinione!

Per lasciare un commento, accedi.

Accedi per commentare