Intelligenza.it lancia il primo LLM italiano: ti serve davvero?
Intelligenza.it ha lanciato Italia 9B, il primo large language model addestrato in italiano. Per chi fa prodotti AI in Italia, la domanda non è se sia una buona notizia, ma se risolva davvero il problema GDPR che ci portiamo dietro da due anni. Spoiler: dipende cosa stai costruendo. Se hai clienti enterprise italiani terrorizzati dal mandare dati fuori UE, forse sì. Se fai B2C e devi scalare veloce, probabilmente no. Analizziamo i numeri, i casi d'uso reali e soprattutto quanto ti costa davvero
Lunedì scorso Intelligenza.it, startup milanese fondata nel 2023, ha rilasciato Italia 9B: un large language model con 9 miliardi di parametri, addestrato principalmente su corpus italiano, hostabile in Europa, open source.
La notizia ha fatto il giro delle chat founder italiane in 48 ore. Reaction polarizzate: chi urla "finalmente sovranità digitale", chi "tanto GPT-4 fa meglio". Nessuno ha ancora fatto i conti veri.
Perché il punto non è tifare. Il punto è: se stai costruendo un prodotto AI in Italia oggi, questa cosa ti cambia la vita o è solo rumore?
Facciamo i numti.
Il modello: cosa è Italia 9B e come si posiziona
Italia 9B è un modello trasformer decoder-only con 9 miliardi di parametri, rilasciato sotto licenza Apache 2.0. È stato addestrato su un dataset di circa 800GB di testo italiano (crawl web, libri, articoli, documenti pubblici) più 200GB di testo inglese per mantenere capacità multilingua.
Benchmark pubblicati da Intelligenza.it:
- HellaSwag (italiano): 67.3% (GPT-3.5: ~70%, Llama 3 8B: 64%)
- MMLU (general knowledge): 58.1%
- Traduzione IT-EN: BLEU score 31.2
- Generazione codice (HumanEval): 42.7%
In sintesi: performance vicine a GPT-3.5 su task italiani, sotto GPT-4 di un buon 20-25% su reasoning complesso. Meglio di Llama 2 7B, alla pari con Mistral 7B fine-tunato su italiano.
Il modello gira su una V100 con 32GB VRAM (inferenza), pesa 18GB in formato fp16. Costo compute stimato per training: circa 80.000€ su cloud GPU europeo.
Deployment: disponibile su Hugging Face, container Docker pre-configurati, API compatibili OpenAI (stessi endpoint, cambi solo base URL). Intelligenza.it offre hosting managed in datacenter Milano/Francoforte a partire da 0.12€ per 1M token (input), 0.18€ output.
Per confronto: GPT-3.5-turbo costa 0.50€/1M input, 1.50€/1M output. GPT-4o costa 2.50€/1M input, 10€/1M output.
Il vantaggio sulla carta: modello italiano, dati in UE, costo token 70% più basso di GPT-3.5, hostabile on-premise.
Il problema sulla carta: performance inferiore a GPT-4, team piccolo (12 persone vs migliaia in OpenAI), nessuna garanzia di uptime enterprise, ecosistema tools ancora immaturo.
Ora vediamo i casi d'uso reali.
Chi se ne frega davvero: i 3 profili founder che dovrebbero considerarlo
Profilo 1: Hai clienti enterprise italiani con procurement impazzito per GDPR
Se vendi B2B a banche, assicurazioni, PA, sanità italiana, sai già di cosa parlo. Il tuo interlocutore IT/legal ti chiede ogni volta: "i dati dove vanno? Possiamo avere garanzia che non escono dall'UE? Possiamo fare on-premise?"
Con OpenAI/Anthropic/Google la risposta è: "hanno datacenter EU, firmano DPA, ma tecnicamente i modelli sono addestrati USA e potrebbero esserci trasferimenti". Per il 90% dei legal italiani, questo è un no.
Con Italia 9B la risposta diventa: "tutto hostato nel tuo datacenter Aruba/OVH Milano, zero trasferimenti, open source quindi auditable".
Caso reale: Legaltech italiana che fa analisi contratti. Cliente è studio legale top 10 Italia. Non possono mandare contratti clienti a OpenAI, neanche con DPA. Hanno provato con Llama 2 self-hosted, ma performance su italiano pessime (il modello non capiva riferimenti normativi). Con Italia 9B fine-tunato su 5.000 contratti italiani annotati, ora processano 200 contratti/giorno, tutto on-premise. Costo compute: 400€/mese su server dedicato vs 0€ (perché prima non potevano proprio farlo).
Profilo 2: Fai prodotto consumer italiano con volumi alti
Se hai un'app B2C con utenti italiani, magari freemium, e bruci 50M+ token/mese, il costo OpenAI ti sta mangiando il margine.
Esempio: chatbot per studenti universitari. 40.000 utenti attivi, 80M token/mese su GPT-3.5-turbo. Costo: 40.000€/mese di API calls. Con Italia 9B hosted: 9.600€/mese managed, o 2.000€/mese self-hosted su GPU dedicata.
Risparmio: 30.000€/mese. In un anno, 360.000€. Abbastanza per assumere 2 ML engineer e fare fine-tuning serio.
Ma: devi avere volume. Sotto i 10M token/mese, la differenza è 100-200€. Non vale lo sbatti di switchare provider.
Profilo 3: Stai costruendo vertical AI dove italiano è critico
Se il tuo prodotto deve capire davvero bene italiano — non solo tradurre, ma capire contesto culturale, riferimenti normativi, modi di dire, regionalismi — GPT-4 è ottimo ma generico.
Italia 9B è stato addestrato su Gazzetta Ufficiale, sentenze tribunali, letteratura italiana, forum italiani. Capisce "condono edilizio", "ravvedimento operoso", "legge Fornero" meglio di GPT-4.
Caso reale: Startup che fa AI per commercialisti. GPT-4 sbagliava interpretazioni su normative fiscali italiane perché aveva visto pochi esempi. Italia 9B fine-tunato su 10.000 circolari Agenzia Entrate ora genera bozze di risposta clienti con accuratezza 85% vs 62% di GPT-4 vanilla.
Se non sei in uno di questi 3 profili, probabilmente Italia 9B non ti serve.
I conti veri: quanto costa davvero switchare
Facciamo i conti su un caso medio: B2B SaaS, 1.000 utenti paganti, 15M token/mese, uso chatbot assistenza + document analysis.
Scenario A: OpenAI GPT-3.5-turbo
- Costo API: 7.500€/mese (15M token input) + 22.500€/mese (15M token output) = 30.000€/mese
- Dev time: zero (già integrato)
- Uptime: 99.9%
- Performance: ottima
- Totale anno 1: 360.000€
Scenario B: Italia 9B managed (Intelligenza.it hosting)
- Costo API: 1.800€/mese (15M input) + 2.700€/mese (15M output) = 4.500€/mese
- Dev time: 40 ore migrazione (compatibile OpenAI SDK, ma devi testare + aggiustare prompt) = 4.000€ one-time
- Performance: 15-20% peggio su reasoning, meglio su italiano specifico
- Uptime: 99.5% (SLA dichiarato)
- Totale anno 1: 58.000€
Risparmio: 302.000€ primo anno
Scenario C: Italia 9B self-hosted
- Server GPU (A100 40GB su Hetzner): 1.200€/mese
- Setup + manutenzione: 80 ore dev = 8.000€ one-time
- Monitoring/scaling: 10 ore/mese = 1.000€/mese
- Totale anno 1: 30.400€
Risparmio: 329.600€ primo anno
Ma c'è un costo nascosto: se performance peggiora del 20%, quanti utenti perdi? Se churn sale dal 3% al 5% mensile per risposte peggiori, su 1.000 utenti a 50€/mese MRR, perdi 1.000€/mese = 12.000€/anno. Ancora conveniente, ma non è gratis.
Il vero costo è il rischio prodotto: se il tuo moat è "abbiamo la miglior AI del mercato", non puoi permetterti di essere 20% peggio dei competitor su GPT-4.
Se il tuo moat è "unico prodotto compliant GDPR per banche italiane", allora 20% peggio è accettabile.
Cosa fare adesso se stai costruendo AI in Italia
Se hai già un prodotto live su OpenAI:
- Fai audit clienti: quanti ti hanno chiesto "possiamo hostare on-premise?" negli ultimi 6 mesi. Se >20%, vale la pena testare Italia 9B.
- Prendi 100 query reali, runnale su GPT-3.5 e Italia 9B, confronta output. Se degradation <10% su metrica che ti importa, considera switch.
- Calcola break-even: se risparmi >5.000€/mese, fai pilota 2 settimane con 10% traffico.
Se stai partendo ora:
- Se fai consumer/PLG con utenti internazionali: usa OpenAI, scala veloce, non perdere tempo.
- Se fai enterprise italiano con procurement difficile: parti da Italia 9B, è il tuo vantaggio competitivo in sales.
- Se fai vertical con dominio italiano complesso: testa Italia 9B fine-tunato vs GPT-4 few-shot, scegli cosa performa meglio.
Se sei tecnico e vuoi smanettare:
Il repo GitHub di Intelligenza.it ha esempi di fine-tuning con LoRA su 1.000 esempi (costa ~50€ su RunPod). Se hai un dataset proprietario italiano, 2-3 giorni di lavoro e hai un modello custom che batte GPT-4 sul tuo dominio.
Ma attenzione: il vero lavoro non è addestrare il modello, è mantenere pipeline di eval continua. Se non hai ML engineer in team, meglio API managed.
Se sei founder non-tecnico:
Non serve diventare esperto di LLM. Serve capire: il mio cliente paga per performance o per compliance? Se compliance, Italia 9B è un sales tool. Se performance, stay su frontier models.
L'elefante nella stanza: Intelligenza.it reggerà?
La domanda che nessuno fa pubblicamente: Intelligenza.it è una startup 12 persone, fondata 18 mesi fa, pre-seed da 2.5M€. OpenAI ha 1.500+ persone e backing Microsoft.
Se basi il tuo prodotto su Italia 9B e tra 12 mesi Intelligenza.it chiude/pivota/viene acquisita, che fai?
Pro: modello è open source, puoi sempre self-hostare. Non sei lock-in come con OpenAI.
Contro: nessuno mantiene il modello, nessun nuovo training, nessuna evolution. Rischi di restare su tech 2024 mentre il mondo va avanti.
La mia take: usa Italia 9B se risolve un problema business oggi (GDPR, costo, italiano specifico). Non usarlo per "sovranità digitale" o "supportare italiano". Quelle sono narrative, non moat.
E tieni sempre pronto piano B: API wrapper che ti permette di switchare provider in 24 ore.
Quindi: ti serve Italia 9B?
Due domande:
- Hai perso deal negli ultimi 6 mesi perché cliente voleva on-premise / no-US-transfer?
- Spendi >3.000€/mese in API OpenAI e potresti accettare 15% performance peggiore?
Se hai risposto sì a entrambe: testa Italia 9B questa settimana.
Se hai risposto sì solo alla prima: testa se davvero è deal-breaker o è scusa del cliente.
Se hai risposto no a entrambe: ignora il rumore, continua su OpenAI/Anthropic, spendi tempo su distribution.
Il primo LLM italiano è una buona notizia per l'ecosistema. Ma non è soluzione magica. È uno strumento in più nel toolbox. Usalo se serve, ignoralo se non serve.
E soprattutto: non costruire mai un prodotto AI attorno a un solo modello. La tech è commodity, il valore è nel dato proprietario, nel fine-tuning, nella UX, nella distribution.
Italia 9B non ti salverà se il tuo prodotto fa schifo. Ma può sbloccarti clienti enterprise italiani che altrimenti non avresti mai chiuso.
Vuoi confrontarti con altri founder AI italiani che stanno testando Italia 9B? Nel FounderLab Match trovi 40+ founder AI-first che condividono setup, benchmark, casi d'uso reali. Zero teoria, solo quello che funziona o non funziona sul campo. Richiedi accesso qui.
Ricevi le prossime edizioni
Newsletter 3x a settimana — Lun · Mer · Ven alle 7:00. Tutto in inbox.