Dentro DeepSeek

DeepSeek ha la reputazione di innovatore dirompente. L’azienda è sostenuta principalmente dall’hedge fund High-Flyer Quant, i cui primi successi hanno visto il patrimonio gestito raggiungere i 100 miliardi di RMB (13,8 miliardi di dollari) entro il 2021 e hanno portato a investimenti sostanziali nella ricerca sull’IA e nei cluster di calcolo. DeepSeek fa anche parte di una struttura aziendale più ampia che comprende filiali e altre entità correlate con sede nei principali hub di IA della Repubblica Popolare Cinese.
DeepSeek sostiene di aver speso meno di 6 milioni di dollari per addestrare il suo ultimo grande modello linguistico (LLM) utilizzando poco più di 2.000 chip Nvidia H800, una frazione del costo speso dai concorrenti statunitensi. Alcuni elementi di questa storia sono stati contestati, ma l’attenzione continua sulle caratteristiche di DeepSeek come azienda unica nel suo genere distrae dall’analisi degli eventi precedenti che, in retrospettiva, avrebbero dovuto servire come primi indicatori della svolta che sarebbe seguita. Nel caso di DeepSeek e della società madre High-Flyer, questi includevano: il riconoscimento del governo; la vicinanza a istituti di ricerca nazionali di alto livello; una complessa rete di società affiliate con capacità di ricerca e sviluppo.
I progressi di DeepSeek nell’architettura e nella formazione dell’IA non sono emersi dal nulla. Allo stesso modo, il momento saliente dell’apparizione del CEO Liang Wenfeng a fianco del premier della Repubblica Popolare Cinese Li Qiang, sebbene degno di nota, è stato solo uno di una serie di eventi che indicano il riconoscimento di High-Flyer/DeepSeek come azienda innovativa da parte del governo di Pechino.
Il ruolo che fattori esterni come la convalida del Partito-Stato, tipicamente un indicatore di supporto finanziario e operativo, possono aver avuto nella rapida transizione di DeepSeek da start-up a leader del settore è discutibile. Ma in un ecosistema di IA competitivo come quello della RPC, questi indicatori di successo hanno un duplice significato. In quanto entità relazionale all’interno di un più ampio ecosistema di istituzioni statali e aziendali, le partnership di High-Flyer/DeepSeek, la posizione strategica e la comprovata leadership tecnologica riflettono la fiducia e la forza della reputazione tra gli attori chiave. Il prossimo “evento DeepSeek” sarà probabilmente innescato da un’azienda inserita in una rete simile di affiliazioni vantaggiose.
La struttura aziendale di DeepSeek riflette la sua espansione nei principali centri di innovazione della Repubblica Popolare Cinese, in particolare a Pechino.
I materiali di reclutamento dell’azienda identificano “DeepSeek” come un “marchio” di Beijing DeepSeek AI Foundational Technology Research, che impiega 100-499 persone. Beijing DeepSeek è stata fondata nel maggio 2023, seguita un mese dopo dalla costituzione di Hangzhou DeepSeek AI Foundational Technology Research (“Hangzhou DeepSeek”). Hangzhou DeepSeek detiene la piena proprietà della sua controparte di Pechino ed entrambe le entità condividono lo stesso rappresentante legale.
DeepSeek ha una struttura integrata a doppio hub, con contributi da parte di Beijing DeepSeek, con sede a Zhongguancun nel distretto di Haidian, che supporta le operazioni della sua controparte di Hangzhou. Zhongguancun è un importante centro di ricerca e sviluppo nel campo dell’intelligenza artificiale, popolato da importanti università, istituti di ricerca e aziende high-tech. Nel novembre 2023, High-Flyer AI si è assicurata una struttura di ricerca di 2.000 metri quadrati in questo luogo, in un indirizzo condiviso con Google, Intel, Alibaba Software Services e la Chinese Academy of Sciences Venture Capital Management.
La proprietà intellettuale di DeepSeek deriva da cinque società (IPR Daily, 28 gennaio):
Beijing DeepSeek;
Hangzhou High-Flyer AI Foundational Research;
Hangzhou High-Flyer Technology;
Ningbo Jimi Information Technology;
Shanghai Jimi Information Technology.
Beijing DeepSeek potrebbe essere la vera sede centrale dell’azienda, dove viene sviluppata la sua tecnologia di base. Questa affermazione non è stata confermata. Ma sarebbe coerente sia con le affermazioni secondo cui il team di Beijing DeepSeek è composto in gran parte da ricercatori formati presso l’Università Tsinghua, la migliore istituzione del Paese, sia con gli annunci di assunzione per posizioni in DeepSeek a Pechino, che offrono “il massimo supporto alla potenza di calcolo dei cluster GPU”.
La comparsa di Liang Wenfeng davanti al Consiglio di Stato è l’esempio più recente del riconoscimento di Pechino alla sua azienda, ma la sua storia di convalida ufficiale risale a molto tempo prima.
Nel 2020, la Hangzhou High-Flyer Technology, predecessore di DeepSeek, è stata designata “impresa high-tech” nazionale dal Ministero della Scienza e della Tecnologia, designazione che ha ricevuto nuovamente nel 2023, insieme al riconoscimento da parte del governo di Hangzhou come “impresa innovativa di medie e piccole dimensioni”. Beijing DeepSeek è stata anche designata come una delle trenta “principali unità di redazione” per un piano nazionale di standardizzazione del 2023 supervisionato dal Comitato nazionale di gestione della standardizzazione, intitolato “Tecnologia di sicurezza dei dati – Requisiti di sicurezza per il processo decisionale automatizzato basato sulle informazioni individuali.
Si è anche ipotizzato che DeepSeek possa avere legami con l’Accademia Cinese delle Scienze. In un post a un gruppo universitario, un utente ha notato che l’indirizzo di Beijing DeepSeek, n. 2, Academy of Sciences South Road nel distretto Haidian della città, era adiacente al CAS Computing Technology Institute con sede al n. 6 sulla stessa strada. Gli utenti di un forum di studenti stranieri hanno anche discusso se CAS, la “squadra nazionale”, fosse dietro DeepSeek.
Non ci sono prove disponibili che confermino queste affermazioni. Servono invece a ricordare che le opache strutture interne di DeepSeek sono ancora collegate all’esterno con una comunità di sviluppatori di IA più ampia e di grande talento, e che le capacità delle aziende private possono effettivamente superare quelle delle istituzioni statali. Il sito web della società madre di DeepSeek descrive un progetto proposto per mettere le proprie risorse informatiche a disposizione di “team di ricerca scientifica qualificati”.

Latest articles

Related articles