In due parole
Una startup cinese, DeepSeek, ha creato modelli di intelligenza artificiale ad alte prestazioni con costi di addestramento drasticamente inferiori rispetto ai concorrenti occidentali. Questo ha scatenato un'ondata di preoccupazione nel settore tecnologico e nel mercato azionario, e potrebbe cambiare le carte in tavola nella corsa all'intelligenza artificiale avanzata.
Cos'è DeepSeek? La startup cinese che sta rivoluzionando l'IA
DeepSeek è una startup cinese specializzata in intelligenza artificiale (IA) che ha recentemente sorpreso l’Occidente creando modelli di IA di altissimo livello, capaci di competere con quelli di aziende leader come OpenAI e Google. Per di più, queste tecnologie sono state sviluppate con un uso sorprendentemente ridotto di risorse.
La società è nata come progetto secondario di una società di trading quantitativo, e si pone come obiettivo quello di esplorare l'essenza dell'intelligenza artificiale generale.
L'innovazione di DeepSeek: modelli di IA efficienti e potenti
DeepSeek ha rilasciato due modelli di intelligenza artificiale open source in rapida successione: DeepSeek V3 e DeepSeek R1.
- DeepSeek V3, rilasciato a dicembre 2024, è un large language model simile a GPT-4 di OpenAI o Claude di Anthropic. La cosa sorprendente è che per addestrare DeepSeek è bastato circa il 5% del tempo e del denaro rispetto a quello richiesto da modelli come GPT-4, senza contare che le GPU di OpenAI sono più potenti di quelle in possesso di DeepSeek.
- DeepSeek R1, rilasciato a gennaio 2025, è basato su DeepSeek V3 ma è stato “affinato” per ragionare passo dopo passo, esaminando e correggendo i suoi pensieri prima di fornire una risposta definitiva. Questo modello ha raggiunto prestazioni paragonabili, se non superiori, a quelle del modello o1 di OpenAI in vari test.
Impatto sul mercato e sull'industria: un nuovo scenario per l'IA globale
Le scoperte di DeepSeek hanno avuto un grosso impatto sul mercato finanziario e sull'industria dell'IA. L'annuncio dei modelli di DeepSeek ha causato una forte calo delle azioni di Nvidia, il principale produttore di chip per IA avanzata, e di altre grandi aziende tecnologiche. Questo è dovuto al fatto che DeepSeek ha dimostrato che è possibile addestrare modelli di IA di alto livello con un uso minore di risorse.
Diversi esperti, tuttavia, hanno fatto notare che questa reazione del mercato sia stata impulsiva e non del tutto giustificata. In primo luogo, anche se DeepSeek ha abbattuto le risorse necessarie per l’addestramento, saranno sempre necessarie GPU potenti per “far funzionare” i modelli tutte le volte che interagiamo con loro. Per di più, se il costo di una tecnologia si abbassa, questa tenderà ad essere sempre più richiesta, con il risultato netto che la domanda si alza.
Per finire, i modelli di DeepSeek sono open source: il codice è disponibile pubblicamente e può essere usato e migliorato da altre aziende e ricercatori. Questo approccio apre la strada a una maggiore competizione e a una più rapida innovazione nel campo dell'IA.
Controversie e preoccupazioni: risorse, provenienza dei dati e competizione USA-Cina
Nonostante i successi, DeepSeek ha sollevato anche alcune preoccupazioni e controversie. Alcuni esperti dubitano che l'azienda abbia effettivamente raggiunto i suoi risultati con le sole risorse di calcolo dichiarate, suggerendo che potrebbe aver usato un numero maggiore di GPU oppure GPU più potenti.
Ci sono anche voci che sostengono che DeepSeek potrebbe aver utilizzato modelli preesistenti (come Llama di Meta) come base di partenza, o che abbia usato dati proprietari di OpenAI.
Infine, i progressi di DeepSeek hanno creato preoccupazioni sulla possibilità che la Cina stia recuperando terreno nella corsa all'IA. Le restrizioni imposte dagli USA sull'esportazione di chip verso la Cina potrebbero aver inavvertitamente spinto l'innovazione nel paese, portando a nuove soluzioni come quelle di DeepSeek. Questa corsa all’IA potrebbe portare a una mancanza di controlli adeguati, con possibili conseguenze sulla sicurezza, sulla diffusione di disinformazione e sul mercato del lavoro. Inoltre, la competizione tra Stati per il dominio tecnologico può facilmente aumentare le tensioni geopolitiche.