L'IA ha mostrato bassa efficacia nelle scommesse sportive, perdendo tutti i soldi sulle partite della Premier League inglese.
Breve risultato dell’esperimento
Lo startup *General Reasoning* ha condotto un test chiamato KellyBench, in cui hanno valutato otto principali sistemi di IA (Google Gemini 3.1 Pro, OpenAI ChatGPT‑4, Anthropic Claude Opus 4.6, xAI Grok 4.20 e altri) sulla capacità di scommettere durante la stagione della Premier League inglese 2023–2024.
A ciascun agente è stato fornito un completo descrizione statistica di tutte le squadre e delle partite precedenti, ma l’accesso a Internet è vietato – i modelli potevano usare solo i dati ricevuti in anticipo.
Come si è svolto il test
1. Tre tentativi: ogni sistema poteva fare tre serie di scommesse per la stagione.
2. Scommesse: sui risultati delle partite (vittoria/pareggio/perdita) e sul numero di gol.
3. Obiettivo: massimizzare il profitto gestendo i rischi.
Chi ha vinto, chi ha perso
| Sistema IA | Risultato medio | Nota |
|---|---|---|
| Anthropic Claude Opus 4.6 | 11 % (circa pareggio in un tentativo) | Il partecipante più “onesto”, ma comunque ha perso denaro |
| Google Gemini 3.1 Pro | +34 % al primo tentativo, poi fallito | Inizialmente profitto, poi perdita |
| xAI Grok 4.20 | Fallito subito, non ha completato i due successivi | Il più debole di tutti |
Alla fine ogni modello ha perso denaro nella stagione, e alcuni è «fallito» completamente. Ciò conferma le conclusioni dei ricercatori: anche i sistemi IA più avanzati incontrano difficoltà con la previsione a lungo termine nel mondo reale.
Cosa significa per il futuro dell’IA
- Le preoccupazioni sul sostituzione dell’uomo sembrano ancora esagerate.
- I benchmark attuali spesso usano condizioni «statiche» che non riflettono l’chaos e la complessità della vita reale.
- Sebbene l’IA risolva con successo compiti come la scrittura di codice, nella maggior parte delle altre aree dell’attività umana rimane limitata.
Di conseguenza, l’esperimento KellyBench dimostra che l’IA non è ancora pronta a competere con l’uomo in compiti dinamici e imprevedibili, come le previsioni sportive.
Commenti (0)
Condividi la tua opinione — per favore, sii cortese e resta in tema.
Accedi per commentare