L'IA ha mostrato bassa efficacia nelle scommesse sportive, perdendo tutti i soldi sulle partite della Premier League inglese.

17.04.2026 2 hardware

Breve risultato dell’esperimento

Lo startup *General Reasoning* ha condotto un test chiamato KellyBench, in cui hanno valutato otto principali sistemi di IA (Google Gemini 3.1 Pro, OpenAI ChatGPT‑4, Anthropic Claude Opus 4.6, xAI Grok 4.20 e altri) sulla capacità di scommettere durante la stagione della Premier League inglese 2023–2024.

A ciascun agente è stato fornito un completo descrizione statistica di tutte le squadre e delle partite precedenti, ma l’accesso a Internet è vietato – i modelli potevano usare solo i dati ricevuti in anticipo.

Come si è svolto il test

1. Tre tentativi: ogni sistema poteva fare tre serie di scommesse per la stagione.

2. Scommesse: sui risultati delle partite (vittoria/pareggio/perdita) e sul numero di gol.

3. Obiettivo: massimizzare il profitto gestendo i rischi.

Chi ha vinto, chi ha perso

Sistema IA	Risultato medio	Nota
Anthropic Claude Opus 4.6	11 % (circa pareggio in un tentativo)	Il partecipante più “onesto”, ma comunque ha perso denaro
Google Gemini 3.1 Pro	+34 % al primo tentativo, poi fallito	Inizialmente profitto, poi perdita
xAI Grok 4.20	Fallito subito, non ha completato i due successivi	Il più debole di tutti

Alla fine ogni modello ha perso denaro nella stagione, e alcuni è «fallito» completamente. Ciò conferma le conclusioni dei ricercatori: anche i sistemi IA più avanzati incontrano difficoltà con la previsione a lungo termine nel mondo reale.

Cosa significa per il futuro dell’IA

- Le preoccupazioni sul sostituzione dell’uomo sembrano ancora esagerate.
- I benchmark attuali spesso usano condizioni «statiche» che non riflettono l’chaos e la complessità della vita reale.
- Sebbene l’IA risolva con successo compiti come la scrittura di codice, nella maggior parte delle altre aree dell’attività umana rimane limitata.

Di conseguenza, l’esperimento KellyBench dimostra che l’IA non è ancora pronta a competere con l’uomo in compiti dinamici e imprevedibili, come le previsioni sportive.

L'IA ha mostrato bassa efficacia nelle scommesse sportive, perdendo tutti i soldi sulle partite della Premier League inglese.

Related news

Tinder e altri servizi introdurranno la verifica degli utenti reali, riferisce World Altman sul superamento del settore delle criptovalute.

Microsoft Edge su Android ora riproduce i video di YouTube in background, aggirando le vecchie limitazioni.

Apple‑Car potrebbe apparire così: Ferrari mostra l’interno dell’auto elettrica Luce, sviluppata da Johnny Aiv.

Le vendite di Mortal Kombat 1 hanno superato gli 8 milioni di copie, ma il record del gioco precedente è ancora inaccessibile

Commenti (0)

Accedi per commentare

L'IA ha mostrato bassa efficacia nelle scommesse sportive, perdendo tutti i soldi sulle partite della Premier League inglese.

Related news

Tinder e altri servizi introdurranno la verifica degli utenti reali, riferisce World Altman sul superamento del settore delle criptovalute.

Microsoft Edge su Android ora riproduce i video di YouTube in background, aggirando le vecchie limitazioni.

Apple‑Car potrebbe apparire così: Ferrari mostra l’interno dell’auto elettrica Luce, sviluppata da Johnny Aiv.

Le vendite di Mortal Kombat 1 hanno superato gli 8 milioni di copie, ma il record del gioco precedente è ancora inaccessibile

Accedi per commentare

Le vendite di Mortal Kombat 1 hanno superato gli 8 milioni di copie, ma il record del gioco precedente è ancora inaccessibile