OpenAI rilascia i modelli Open-Weight: cosa sono e perché cambia tutto

OpenAI ha appena fatto qualcosa che non faceva da anni: ha rilasciato modelli linguistici open source.
L’ultima volta che è successo è stato con GPT-2 nel 2019. Ora ne abbiamo due nuovi: gpt-oss-120b e gpt-oss-20b.
Cosa c’è di diverso questa volta? Vengono rilasciati sotto la licenza Apache 2.0, il che significa che chiunque può usarli, modificarli ed eseguirli come preferisce. È una mossa piuttosto inaspettata da parte di un’azienda che ultimamente ha per lo più tenuto le cose chiuse.
Cosa sono i modelli Open-Weight?
I modelli a peso aperto sono sistemi di intelligenza artificiale in cui i “pesi” effettivi, i numeri fondamentali che il modello ha appreso durante l’addestramento, sono resi pubblici. Questi pesi sono ciò che guida le previsioni, le risposte e il comportamento generale del modello.
A differenza dei modelli chiusi come GPT-4 o Claude, a cui è possibile accedere solo tramite API o servizi web, i modelli open-weight offrono agli utenti una vera libertà. Gli utenti possono:
- Scaricali ed eseguili sul tuo hardware, che si tratti di un PC personale, di un server dell’ufficio o persino di un telefono
- Ottimizzali con i tuoi dati per ottenere risultati migliori per attività specifiche
- Dai un’occhiata sotto il cofano e gioca con l’architettura del modello stesso
- Usali come vuoi, senza dover pagare per l’accesso o affidarti a una piattaforma di terze parti
Detto questo, “open-weight” non significa completamente open-source. Gli utenti ottengono i pesi del modello, ma non sempre il codice di addestramento o il set di dati completo utilizzato per costruirlo.
Quindi è un compromesso in quanto gli utenti ottengono il controllo e la trasparenza, ma le aziende mantengono ancora private parti del processo di formazione, spesso per motivi di proprietà o di sicurezza.
Perché la mossa di OpenAI cambierà tutto?
Fino ad ora, i modelli più potenti di OpenAI erano bloccati dietro API a pagamento, accessibili solo a grandi aziende o utenti ben finanziati. L’azienda ha citato problemi di sicurezza, ma il risultato è stato un accesso limitato per la più ampia comunità di sviluppatori e ricercatori.
Questo sta cambiando. Con il rilascio di modelli open-weight, OpenAI offre a sviluppatori, ricercatori e startup indipendenti gli strumenti per eseguire l’intelligenza artificiale all’avanguardia a livello locale, sia per motivi di privacy, risparmio sui costi o semplicemente per la libertà di armeggiare.
Questi modelli possono essere ottimizzati per qualsiasi cosa, dalla consulenza legale e dal supporto medico alle lingue regionali e alle attività di codifica specializzate.
Non c’è bisogno di attendere l’autorizzazione o gli aggiornamenti da un team centrale, gli utenti possono personalizzare e distribuire alle proprie condizioni.
È anche una vittoria per la trasparenza. I pesi aperti consentono ai ricercatori di approfondire il funzionamento dei modelli, testare i pregiudizi e verificare la presenza di problemi di sicurezza. Questo tipo di visibilità crea fiducia.
Questa mossa è vista anche in risposta alla crescente concorrenza di Meta, Mistral e DeepSeek. Ma indipendentemente dal motivo, il risultato è lo stesso: più persone, in più luoghi, possono ora attingere alla potente tecnologia dell’intelligenza artificiale e costruire cose che prima non erano possibili.
Come accedere ai modelli Open-Weight?
OpenAI ha reso i suoi ultimi modelli scaricabili gratuitamente su Hugging Face e GitHub. Funzionano su hardware con 16-80 GB di memoria e sono completamente personalizzabili, ideali per attività come il ragionamento, l’esecuzione di istruzioni ed eseguite codice e ottimizzati per settori o linguaggi specifici.
Rilasciando questi modelli apertamente, OpenAI sta spostando il potere da una manciata di grandi aziende tecnologiche a sviluppatori, startup e ricercatori di tutto il mondo.
Ciò significa un’innovazione più rapida, test di sicurezza più rigorosi e più sperimentazioni in tempi più rapidi. I ricercatori possono ora ispezionare il funzionamento dei modelli, trovare distorsioni o creare nuove funzionalità senza attendere la roadmap di qualcun altro.