(nostra traduzione da Jamestown Foundation)
Il 20 gennaio, l’uscita di DeepSeek-R1, l’ultimo grande modello linguistico (LLM) dell’azienda di intelligenza artificiale DeepSeek, ha fatto tremare il mercato azionario statunitense. Durante la notte, circa un trilione di dollari è evaporato da alcune delle aziende tecnologiche di maggior successo al mondo. Nel frattempo, la sua app è diventata rapidamente quella più scaricata sull’App Store di Apple. L’azienda, con sede a Hangzhou, ha affermato che il modello è stato addestrato a un costo notevolmente inferiore rispetto ai concorrenti occidentali. La funzionalità di DeepSeek è impressionante e il suo marchio ha eclissato di gran lunga la società madre, un fondo speculativo poco conosciuto che si è concentrato a lungo sull’intelligenza artificiale e sull’apprendimento automatico.
I controlli sulle esportazioni e il contrabbando di GPU hanno accompagnato l’ascesa di DeepSeek
Il chatbot LLM noto come “DeepSeek” è stato sviluppato da Hangzhou DeepSeek Artificial Intelligence Basic Technology Research. Spin-off del 2023 dell’hedge fund cinese Ningbo High-Flyer Quantitative Investment Management Partnership, o “High-Flyer”, DeepSeek è stato inizialmente presentato come un ‘nuovo organismo di ricerca indipendente’ incentrato esclusivamente sulla ricerca sull’IA piuttosto che sul trading o sull’analisi di mercato. Sostiene che i costi di formazione per il suo modello V3 (su cui si basa R1) sono stati di soli 6 milioni di dollari, una frazione dei costi stimati per il GPT-4 di OpenAI, che nel 2023 ammontavano a 100 milioni di dollari. Dopo il rilascio di DeepSeek-R1, i timori che questo segnasse la fine della ‘bolla dell’IA’ hanno portato il mercato azionario statunitense a perdere più di 1.000 miliardi di dollari. NVIDIA, la società i cui progetti di unità di elaborazione grafica (GPU) avanzate e costose sono vitali per l’addestramento e l’esecuzione di LLM, consentendole di beneficiare maggiormente dell’impennata dell’IA negli ultimi due anni, ha registrato la più grande svendita in un giorno della sua storia. Si ritiene che questa svendita sia stata in gran parte basata sul presupposto che i risultati tecnici di DeepSeek avrebbero segnalato una minore domanda per i prodotti NVIDIA.
Il modello di DeepSeek è open source, il che consente a chiunque di eseguirlo sul proprio hardware, ma i dettagli del suo sviluppo, vale a dire i dati di addestramento, i processi e il codice utilizzato nell’addestramento, rimangono oscuri. Sebbene l’azienda abbia reso open source parti del proprio codice, i dati relativi alle funzioni di implementazione e inferenza di DeepSeek-V3, i processi di addestramento e il codice per l’addestramento del modello non sono stati rilasciati al 13 febbraio. Allo stesso modo, non c’è modo di verificare in modo indipendente le affermazioni dell’azienda secondo cui ha reperito l’hardware GPU necessario per addestrare il modello attraverso canali legali.
I rapporti indicano che l’azienda ha trascorso diversi anni ad accumulare chip. In un’intervista del 2020 con il blogger di investimenti Zhu Ang, il co-fondatore e CEO di High-Flyer Lu Zhengzhe ha affermato che High-Flyer aveva già investito 100 milioni di RMB (13,8 milioni di dollari) in ‘hardware puro’. Più recentemente, DeepSeek ha dichiarato che Liang Wenfeng (梁文锋), il volto pubblico e co-fondatore sia di High-Flyer che di DeepSeek, ha trascorso anni ad acquistare GPU avanzate come hobbista prima dell’imposizione delle sanzioni statunitensi nell’ottobre 2022. L’azienda insiste sul fatto di non aver utilizzato GPU controllate per l’esportazione dagli Stati Uniti che potrebbero essere state importate illegalmente nella Repubblica Popolare Cinese.
Eppure per molte aziende come DeepSeek, rimangono dubbi sull’uso di chip statunitensi soggetti a controllo delle esportazioni che arrivano nella Repubblica Popolare Cinese attraverso paesi terzi. Le spedizioni di chip NVIDIA a Singapore sono aumentate da quando i controlli sulle esportazioni statunitensi hanno bloccato l’accesso alla Repubblica Popolare Cinese. Anche il contrabbando e la deviazione dei prodotti dalla loro destinazione dichiarata sono aumentati. Il bilancio trimestrale di NVIDIA per il periodo terminato il 27 ottobre 2024, rileva esplicitamente queste nuove vendite a soggetti di Singapore, affermando che ‘la maggior parte delle spedizioni associate alle entrate di Singapore erano dirette in località diverse da Singapore e le spedizioni verso Singapore erano insignificanti’. Le vendite di NVIDIA a clienti con indirizzi di fatturazione a Singapore fanno salire le entrate associate al paese da circa 10 miliardi di dollari nel 2023 a 17,4 miliardi di dollari nel 2024.
Il 1° febbraio il Ministero del Commercio e dell’Industria di Singapore ha rilasciato una dichiarazione in risposta alle voci secondo cui il piccolo Paese sarebbe stato utilizzato per reindirizzare articoli controllati verso la Repubblica Popolare Cinese. Il ministero ha ribadito l’affermazione di NVIDIA secondo cui non avevano motivo di credere che le spedizioni verso Singapore finissero alla DeepSeek o nella Repubblica Popolare Cinese, citando il suddetto rendiconto finanziario trimestrale e sottolineando che molte delle entità commerciali di Singapore stanno acquistando i chip ‘per prodotti destinati agli Stati Uniti e ad altri Paesi occidentali’.
Il mentore di Liang ha studiato le tecnologie a duplice uso
Liang Wenfeng è stato uno dei primi sostenitori e utilizzatori dell’IA. Prima di fondare le aziende che continua a supervisionare, ha trascorso anni a sviluppare strategie di trading algoritmico con amici conosciuti all’Università di Zhejiang. Il suo collega Lu Zhengzhe ha descritto il nucleo di studenti che hanno poi fondato High-Flyer come amici dei corsi di informatica e ingegneria dell’università. Lu ha detto che erano uniti da un ‘approccio sistematico e programmatico allo studio del mercato’, collaborando e competendo negli anni 2008-2015 prima di fondare l’azienda. Dopo la sua fondazione, l’azienda è cresciuta rapidamente e nel 2020 stava ‘assorbendo talenti esperti di IA su larga scala’.
All’Università di Zhejiang, Liang sembra aver studiato per la prima volta l’IA con Xiang Zhiyu, un eminente esperto di IA e apprendimento automatico. Xiang ha pubblicato decine di articoli e detiene molti brevetti, quasi tutti nel campo della navigazione dei veicoli autonomi e dell’elaborazione delle immagini con l’intelligenza artificiale. L’ampio corpus di lavori di Xiang include almeno una collaborazione pubblicata con Liang, mentre il fondatore di DeepSeek studiava sotto la sua guida all’Università di Zhejiang. Sembra che la prima collaborazione tra i due risalga al 2011, con un articolo su un algoritmo progettato per migliorare il tracciamento del bersaglio della telecamera, un argomento che corrisponde perfettamente alla specializzazione di Xiang in sistemi di navigazione, mappatura e puntamento di veicoli autonomi. Un’analisi dei brevetti e dei documenti pubblicati da Xiang a partire dal 2010 rivela che quasi tutti sono legati all’intelligenza artificiale, in particolare alla navigazione autonoma dei veicoli e all’elaborazione dei dati delle immagini.
Tra i lavori di Xiang, molteplici articoli e brevetti riguardano applicazioni militari. La maggior parte del suo lavoro riguarda tecnologie per uso civile, come quelle adatte alla guida di veicoli nel traffico urbano prevedibile (sistemi di navigazione per veicoli autonomi, strumenti di riconoscimento dei semafori, mappatura LiDar, sistemi di rilevamento dei pedoni e simili). Xiang ha scritto articoli e detiene brevetti su algoritmi per sciami di droni cooperativi, sistemi di acquisizione di bersagli terrestri per UAV e il funzionamento di veicoli autonomi in spazi di battaglia con terreno imprevedibile: ambienti con vegetazione fitta e fuoristrada e ambienti in cui un avversario ha negato o disabilitato l’accesso ai tradizionali strumenti di navigazione GPS.
DeepSeek integrato nell’ecosistema regionale di IA
DeepSeek e High-Flyer hanno sede a Hangzhou, che si trova anch’essa nello Zhejiang. Il Chengxi Science and Technology Innovation Corridor di Hangzhou, un progetto sotto l’egida del governo locale e nazionale, mira a trasformare la città in un hub per la tecnologia strategica, in particolare l’IA. Il piano quinquennale per lo sviluppo dell’industria dell’intelligenza artificiale di Hangzhou, annunciato nel dicembre 2021, afferma esplicitamente la necessità di sviluppare e coltivare imprese private di intelligenza artificiale situate in città, guidate dallo ‘spirito di Xi Jinping, anche se nel socialismo con caratteristiche cinesi’, e di rendere Hangzhou la risposta della Repubblica Popolare Cinese alla Silicon Valley, denominata ‘China’s Vision Valley’, dove può avere luogo ‘una nuova generazione di innovazione e sviluppo dell’IA’.
Lo Zhejiang Lab di Hangzhou, un istituto a proprietà mista organizzato dal governo provinciale di Zhejiang, dall’Università di Zhejiang e dal Gruppo Alibaba, funge da punto di riferimento per la ricerca tecnologica sensibile. È anche un organizzatore, finanziatore e facilitatore del reclutamento sostenuto dallo Stato per lo sviluppo indipendente nell’intelligenza artificiale e in altri settori ad alta tecnologia a Zhejiang. Al momento della sua fondazione nel 2017, il Ministero della Scienza e della Tecnologia della Repubblica Popolare Cinese ha definito il laboratorio Zhejiang come ‘l’anima centrale’ della costruzione del corridoio dell’innovazione scientifica e tecnologica di Hangzhou Chengxi. In quanto uno dei laboratori di intelligenza artificiale più grandi e prestigiosi del Paese, si concentra sulle priorità strategiche, descrivendo il suo obiettivo come la costruzione di ‘capacità scientifiche e tecnologiche strategiche nazionali’. Oltre a condurre i propri progetti di ricerca, il laboratorio Zhejiang ospita spesso eventi di reclutamento per attrarre nella regione di Hangzhou laureati cinesi in materie STEM (scienza, tecnologia, ingegneria e matematica) di talento, istruiti all’estero. Questo costituisce un altro importante dato che dimostra come DeepSeek sia profondamente inserito nell’ecosistema nazionale cinese dell’IA.
Questa situazione contribuisce alle preoccupazioni sollevate da legislatori e autorità di regolamentazione al di fuori della RPC sia per quanto riguarda la privacy dei dati che la censura. Alcuni, tra cui Stati Uniti, Taiwan, India, Corea del Sud, Australia e Italia, hanno già imposto divieti o blocchi di vario genere sull’app. Queste preoccupazioni sembrano fondate. Secondo l’analisi del ricercatore di sicurezza informatica David Bombal, l’app DeepSeek invia pacchetti di dati a server nella RPC e nel Regno Unito. Questi server sembrano appartenere a Shenzhen Tencent Computer Systems a Pechino e Zhejiang Taobao Network a Londra. Quest’ultimo è un subappaltatore con sede nello Zhejiang per Alibaba e Alibaba Cloud. Ciò contraddice l’affermazione di DeepSeek secondo cui nessun dato utente viene inviato alla RPC.
DeepSeek censura anche le risposte, comprese quelle ritenute politicamente sensibili dal Partito Comunista Cinese, quando vengono eseguite su cloud (al contrario che localmente, su un dispositivo non connesso a Internet). Ad esempio, autocensura le risposte in tempo reale su argomenti come quelli relativi alle proteste e al massacro di Piazza Tiananmen del 1989.
Conclusione
DeepSeek continua a guadagnare terreno sia all’interno della RPC che all’estero per i suoi impressionanti LLM. Tuttavia, parti fondamentali del background dell’azienda e la storia dietro i suoi straordinari prodotti rimangono poco chiare. Questo ha spinto i legislatori di diversi Paesi a procedere con cautela. Anche se i mercati potrebbero aver reagito in modo eccessivo al lancio del modello R1 a fine gennaio, la redditività di DeepSeek come vero concorrente dei LLM occidentali resta da vedere, soprattutto perché l’azienda sarà ora sottoposta a una pressione crescente da casa e a un controllo sempre più attento dall’estero.