Alibaba lancia modelli compatto Qwen 3.5 che funzionano direttamente sui laptop e superano i corrispondenti di OpenAI
Alibaba Qwen 3.5 — nuova serie di modelli AI compatti
Nel suo dipartimento di intelligenza artificiale, Alibaba ha annunciato il lancio della linea di modelli Qwen 3.5, che promettono «dimensioni ridotte + alta efficienza». Rispetto ai loro omologhi americani, dimostrano una maggiore precisione con un minor consumo di memoria.
| Modello | Dimensione | Caratteristiche chiave |
|---|---|---|
| Qwen 3.5‑0.8B | 0,8 miliardi di parametri | “Miniatura” e veloce, destinato a prototipi e dispositivi mobili con autonomia limitata |
| Qwen 3.5‑2B | 2 miliardi | Simile al 0.8B ma leggermente più potente |
| Qwen 3.5‑4B | 4 miliardi | Multimodale, finestra contestuale di 262 144 token; adatto a soluzioni agenti leggere |
| Qwen 3.5‑9B | 9 miliardi | Capacità di ragionamento, supera OpenAI gpt‑oss‑120B (13,5× più parametri) e mostra livello di dottorato nel pensiero logico |
Tutti i modelli sono disponibili sotto licenza Apache 2.0, consentendo l’uso in progetti commerciali e il riaddestramento se necessario.
Cosa c’è di nuovo nell'architettura?
Alibaba ha abbandonato i tradizionali Transformer e adottato una configurazione ibrida:
* Gated Delta Networks (GDN) – garantiscono elevata larghezza di banda e bassa latenza.
* Mixture‑of‑Experts (MoE) – risolvono il problema della memoria limitata tipico dei modelli piccoli.
Grazie a ciò, Qwen 3.5 può gestire token multimodali contemporaneamente, senza dover “attaccare” generatori di immagini ai modelli testuali come nei generazioni precedenti. Le versioni 4B e 9B possono riconoscere elementi UI e contare oggetti in video.
Test e risultati
| Benchmark | Qwen 3.5‑9B |
|---|---|
| MMMU‑Pro (visivo) | 70,1 % – supera Google Gemini 2.5 Flash‑Lite (59,7) e Qwen 3‑VL‑30B‑A3B (63,0) |
| Pensiero logico | 81,7 % – superiore a OpenAI gpt‑oss‑120B (80,1), nonostante quest’ultimo abbia 10× più parametri |
| HMMT Feb 2025 (matematica) | 83,2 % (9B), 74,0 % (4B) – dimostra che per compiti di scienze esatte non servono enormi risorse cloud |
| OmniDocBench v1.58 | 87,7 % – leader tra tutti i modelli |
| MMMLU (multilingua) | 81,2 % – supera gpt‑oss‑120B (78,2 %) |
Perché è importante?
L’introduzione di Qwen 3.5 coincide con l’aumento della domanda per agenti AI autonomi. L’utente moderno richiede non solo chatbot, ma sistemi che:
1. Pensano – ragionano su problemi.
2. Vedono – elaborano immagini, video e elementi UI.
3. Agiscono – usano strumenti (compilare moduli, ordinare file).
Poiché i grandi modelli (da 3 a 5 miliardi di parametri) sono costosi da gestire, Qwen 3.5 è una soluzione più economica. I modelli possono essere eseguiti localmente senza connettersi al cloud e l’apprendimento per rinforzo permette loro di prendere “decisioni umane” – ad esempio, organizzare la scrivania o sviluppare codice da un video.
Applicazioni pratiche
* Dispositivi mobili – 0,8 miliardi di parametri si adattano facilmente a uno smartphone e garantiscono autonomia.
* Stazioni di lavoro – 9 miliardi di parametri offrono l’intero set di funzioni agenti senza cloud.
* Agenzie UI – grazie al “binding a livello pixel”, i modelli possono muoversi nell’UI, compilare moduli e ordinare file, eseguendo comandi in linguaggio naturale con precisione intorno al 90 %.
In sintesi, Alibaba Qwen 3.5 apre la strada a agenti AI più accessibili, flessibili e potenti, capaci di operare sia nel cloud che localmente, soddisfacendo le crescenti esigenze dell’utente moderno.
Commenti (0)
Condividi la tua opinione — per favore, sii cortese e resta in tema.
Accedi per commentare